优化AI技艺,入手通常是最有效的路径。
很多人都执着于“新技术怎样用”,其实应该多想想“我能处置什么疑问”。这样做,你的技术就能变成实真实在的价值,面试时也能令人印象深入。
本文给大家介绍5个不同难度的AI名目,具体说明每个名目标步骤和所需Python库,能够协助你极速上手。
这些名目都以处置疑问为**,读者可以间接实施,或用来启示自己处置疑问。
1 简历优化(新手级)
求职环节中,调整简历婚配不同职位是个费时费劲的活。但如今,用大型言语模型,这个义务变得便捷了。上方是简化步骤:
用Python的好处是可以轻松裁减这个环节。上方是**代码示例:
import openaiopenai.api_key = "your_sk"# 揭示(假定md_resume和job_description曾经被定义)prompt = f"""我有一份用Markdown格局编写的简历和一份上班形容。请依据上班需要调整我的简历,同时坚持专业语气。调整我的技艺、阅历和成就,以突出与职位最关系的点。确保我的简历依然反映我共同的资历和长处,但强调与上班形容婚配的技艺和阅历。确保我的阅历以合乎所需资历的形式出现。坚持明晰、繁复和专业。以Markdown格局前往更新后的简历。"""# 调用APIresponse = openai.chat.completions.create(model="gpt-4o-mini",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}],temperature = 0.25)# 提取照应resume = response.choices[0].message.content
2 视频摘要生成器(新手级)
这个工具可以智能协助看视频,提取关键点,生成摘要。
步骤简化如下:
**代码如下(YouTube视频):
import refrom youtube_transcript_api import YouTubeTranscriptApiyoutube_url = "video link here"# 经常使用正则表白式提取视频IDvideo_id_regex = r'(?:v=|\/)([0-9A-Za-z_-]{11}).*'match = re.search(video_id_regex, youtube_url)if match:return match.group(1)else:return None# 提取文稿text_list = [transcript[i]['text'] for i in range(len(transcript))]transcript_text = '\n'.join(text_list)
3 智能整顿PDF文件(中级)
咱们可以应用AI智能按主题分类横七竖八的PDF文件。
步骤如下:
这里是用sentence_transformers库生成文本向量的代码:
from sentence_transformers import SentenceTransformer# 加载嵌入模型model = SentenceTransformer("all-MiniLM-L6-v2")# 将摘要存储在列表中abstract_list = ["摘要1", "摘要2"]# 计算嵌入embeddings = model.encode(abstract_list)
4 多模态搜查(中级)
在开发搜查系统时,经常出现的应战之一是关键消息经常嵌入在图表和图形中,不在纯文本中。
处置打算是经常使用多模态嵌入模型,让文本和图像在同一个空间里示意。步骤简化如下:
PDF宰割是名目**,可驳回固定字符数宰割,坚持局部堆叠,同时记载文件名和页码等元数据。
以下是成功该环节的代码示例:
import fitz# PyMuPDFdef extract_text_chunks(pdf_path, chunk_size, overlap_size):# 关上PDF文件pdf_document = fitz.open(pdf_path)chunks = []# 遍历PDF的每一页for page_num in range(len(pdf_document)):page = pdf_document[page_num]page_text = page.get_text()# 将页面的文本宰割成有堆叠的块start = 0while start < len(page_text):end = start + chunk_sizechunk = page_text[start:end]# 将页码与文本块一同保留chunks.append((page_num + 1, chunk))# 移动到下一个有堆叠的块start += chunk_size - overlap_sizereturn chunks# 提取参数pdf_path = "your_file.pdf"chunk_size = 1000# 每个文本块的字符数overlap_size = 200# 堆叠的字符数text_chunks = extract_text_chunks_with_page_numbers(pdf_path, chunk_size, overlap_size)# 显示带有页码的文本块for i, (page_number, chunk) in enumerate(text_chunks):print(f"Chunk {i + 1} (Page {page_number}):\n{chunk}\n{'-' * 50}")
5 常识库问答系统(初级)文档问答系统是AI名目中的抢手选用。
假设文档曾经宰割并存入DataFrame,咱们可以将多模态搜查工具更新为多模态RAG系统。步骤如下:
注:Llama 3.2 Vision在2025年前可经过Together AI的API无偿经常使用。
这个名目联合了名目2和4的元素,并新增了用户界面。咱们可以经常使用Gradio这样的工具,用几行代码就搭建起聊天界面。
以下是经常使用Gradio的示例代码:
import gradio as grdef generate_response(message, history):# 生成照应的代码return responsedemo = gr.ChatInterface(fn=generate_response,examples=[{"text": "Hello", "files": []}],title="Echo Bot",multimodal=True)demo.launch()
如今,借助ChatGPT等工具,AI名目开发变得极速高效。倡导大家大胆尝试新名目,优化技艺。
本文转载自,作者: