直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

大模型优化有哪些方式

回答

大模型优化的方式主要包括以下几种:

  1. 模型压缩:由于大模型的参数众多,内存需求巨大,在实际部署时会进行压缩。例如使用内存占用更小的数据类型,如 16 位的浮点数,其中英伟达在其最新一代硬件中引入了对 bfloat16 的支持。
  2. 上下文优化:如果模型缺失必知信息,如内部业务数据、流程等,可通过将相关信息提供给模型进行优化。例如采用 RAG 技术,先在知识库检索相关内容,然后与提示词组装后提供给大模型作为输入。
  3. 大模型优化:在进行足够的 prompt 工程后,如果模型在垂直领域表现不足或输出内容的格式风格稳定性不及预期,可以考虑微调。但微调也要与良好的 prompt 工程结合。
  4. 更换大模型:例如从 ChatGLM2-6B 替换成 baichuan2-13b,可能提升性能。
  5. 更换 embedding 模型:如将 embedding 模型从 LangChain Chatchat 默认的 m3e-base 替换为 bge-large-zh。
  6. 测试不同 Top k 的值:比较不同的 Top k 值(如 Top 5、Top 10、Top 15),找到最优效果的值。
  7. 对文档名称进行处理:人工对文件重命名,上传相同文件构建知识库,并勾选【开启中文标题加强】选项,可减少无关信息,提升效果。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

大模型入门指南

在LLM中,Token是输入的基本单元由于在大模型的参数非常多,比如在GPT-2中,有1.5B参数,每个参数用float32表示,那么需要的内存大小为4 bytes * 1,500,000,000 = 6GB,更先进的模型如LLAMA有65B参数,那么需要的内存就需要260G,这还是在不考虑词汇表的情况下。因此在进行模型实际部署时,会进行模型的压缩。而且,在训练LLM中,CPU与内存之间的传输速度往往是系统的瓶颈,核心数反而不是大问题,因此减小内存使用是首要优化点。使用内存占用更小的数据类型是一种直接的方式,比如16位的浮点数就可以直接将内存使用减倍。目前有几种相互竞争的16位标准,但英伟达在其最新一代硬件中引入了对bfloat16的支持,|Format|Significand|Exponent|<br>|-|-|-|<br>|bfloat16|8 bits|8 bits|<br>|float16|11 bits|5 bits|<br>|float32|24 bits|8 bits|

3. 如何让 LLM 应用性能登峰造极

如图所示,主要从下面两个维度考虑问题:Context optimization(上下文优化):模型是否缺失必知信息?如内部业务数据,流程等。LLM optimization(大模型优化):模型是否准确率不足,输出内容未能很好的遵循特定风格或格式?1.Context optimization(上下文优化)所创建的LLM应用如果需要了解特定的数据、系统和流程,而这是预训练LLM中不存在(或者有缺失)的知识和信息,则需要进行所谓上下文优化,将依赖的这部分信息提供给模型。如企业内部智能问答机器人,针对企业内部员工提供内部知识服务,需要了解企业知识库、规章制度、系统流程、甚至部分业务数据。而这些信息正是大模型所不知道的知识,无法通过单纯的prompt工程解决,应该考虑将相关知识提供给大模型。RAG就是很好的解决该问题的技术,首先在知识库检索相关内容,然后将内容和提示词组装起来一起提供给大模型作为输入,得到理想的输出。1.LLM optimization(大模型优化)在进行了足够的prompt工程后,如果所创建的LLM应用如果在垂直领域的表现仍然不足,或者我们希望其输出内容保持特定的格式风格等的稳定性依然不及预期,可以考虑进行大模型优化。这里所说的大模型优化通常是指微调。需要注意的是,即使用微调,也要和良好的prompt工程结合起来才能更有效的发挥作用,所以前期基于prompt工程打好地基很重要。下文中我们还会进一步说明。

开发:产品视角的大模型 RAG 应用

开发:产品视角的大模型RAG应用[heading1]调优实践[content]基于以上的分析,我们先选取了实现成本最小的方式进行调优,结果如下:1、更换大模型:从ChatGLM2-6B替换成baichuan2-13b,发现针对我们的场景,后者的性能可以提升一倍左右。2、更换embedding模型:将embedding模型从LangChain Chatchat默认的m3e-base替换为bge-large-zh,发现后者优于前者3、测试不同Top k的值:比较Top 5、Top 10、Top 15的结果,发现Top 10时效果最优。4、对文档名称进行处理:由于原来的政策文件,在导出时文件名会进行简化,如too_long_发展行动方案。因此,人工对文件进行重命名,上传相同文件构建知识库,同时在构建知识库时勾选【开启中文标题加强】选项,发现重命名文件对结果的提升效果不明显,但勾选【开启中文标题加强】选项后,回答的无关信息减少,效果有所提升。目前来看,尽管效果有所提升,但仍未达到可用水平,后续我们也将尝试其他的调优策略。

其他人在问
问题定义优化助手
以下是关于问题定义优化助手的相关内容: 市面上有很多 Prompt 框架,框架可理解为从不同角度为思考问题提供解决方案的路径。一个问题的解决通常包括问题背景(所需角色、具备的能力和资源)、问题目标(期望的输出结果和验收标准,如提供商务谈判的完整过程)、提供的资料信息、限制条件(如预算限制等)、角色技能(为目标服务所需调动的技能,如熟悉某个领域的商业案例)和工作流(解决问题时需完成的任务步骤,如信息收集、谈判策略设定等)。细致的内容可能得到更好的结果,但也可能限制可能性,这是一个平衡和折中的结果。 效果呈现方面,体验地址为 。 3 月 5 日作业要求大家看完小七姐的 5 篇入门指南并动手实践,写出自己的一条 prompt 及对话分享出来,提交格式为创作思路和目标|prompt 展示|输出结果。例如无上的目标是让大模型对自己的提问内容进行优化,其思路包括询问大模型“更好的提问”方法论、让 kimi 分析并优化等步骤。 在从 AI 助教到智慧学伴的应用探索中,提到了在不同学段和学科的应用场景,以及向 AI 大模型提问的问题设计,还涉及教育提示词优化助手。
2025-04-11
AI如何优化库存管理、员工排班
以下是关于 AI 优化库存管理和员工排班的相关内容: 库存管理: 1. 利用 AI 预测需求,优化库存管理,减少积压和缺货情况。 2. AI 可以分析不同产品的销售速度、市场趋势等数据,为库存的补货和调整提供决策依据。 3. 通过 AI 生成的库存周转分析工具,预测滞销品并推荐促销策略。 员工排班: 1. 智能排班优化,根据客流预测自动调整员工排班表。 2. 实时话术提示工具,在员工与客户沟通时 AI 推荐应答策略。 3. 自动化周报生成,汇总销售数据、客户反馈生成可视化报告,为排班提供参考。 4. 培训模拟考试系统,基于产品知识库生成随机测试题,提升员工能力,优化排班安排。 5. 客户潜力评分系统,根据消费行为自动标记高价值客户,据此安排合适的员工服务。 6. 舆情预警系统,实时监测负面评价并推送处理建议,灵活调整员工工作安排。 7. 客户流失预测模型,通过行为数据预警流失风险,合理安排员工进行客户维护。 8. 会议纪要自动生成,转录会议录音并提取任务清单,辅助排班决策。 9. 员工满意度分析,通过匿名问卷分析员工工作痛点,优化排班以提高员工满意度。
2025-04-09
提示词优化工具
以下是关于提示词优化工具的相关信息: /shorten 命令: 分析提示:最短的提示,Option 5:tower of donuts, sprinkles 产生了最接近原始目标的图像。 分析结果:许多填充词,如“异想天开”“令人着迷”和“杰作”可以省略。了解“塔”和“魔法”被认为是重要的标记有助于解释为什么一些图像是用童话城堡元素生成的。了解这一点提供了一条线索:如果目标是制作一堆美味的甜甜圈,则应该从提示中删除“神奇”。 特点:该/shorten 命令是一个工具,可帮助您探索 Midjourney Bot 如何解释标记并尝试单词,但它可能不适用于所有主题和提示风格。 星流一站式 AI 设计工具: 下方 prompt 输入框: 可以输入提示词、使用图生图功能辅助创作。 提示词相关: 什么是提示词:用于描绘画面,支持中英文输入。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(一个长头发的金发女孩),基础模型 1.5 使用单个词组(女孩、金发、长头发)。 如何写好提示词: 提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词,点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,更优先。对已有的提示词权重进行编辑。 辅助功能: 翻译功能:一键将提示词翻译成英文。 删除所有提示词:清空提示词框。 会员加速:加速图像生图速度,提升效率。 提示词优化:启用提示词优化后,帮您扩展提示词,更生动地描述画面内容。 预设词组:小白用户可以点击提示词上方官方预设词组,进行生图。
2025-04-08
全能写作优化指令
以下是为您提供的关于全能写作优化指令的相关内容: 拘灵遣将: 对文章中案例进行脱敏,替换人物姓名、时间和地点。 深化写作时,每次对话输出文章一个部分,各部分字数有具体要求,组合成可直接发布、吸引目标群体、高质量实用的公众号普法文章。 敕代表告诫,划定灵机工作边界、禁忌事项和具体要求。 令:初始化时用中文与用户对话并欢迎;牢记符与敕要求,除非用户明确调整,否则一直遵守;先请求用户提供案例洞察报告和目标群体,用户提供并输入“依律奉行”后,先输出纲要和写作方案。 集合 Deepseek 提示词方法论: 进阶控制技巧: 思维链引导:分步标记法,苏格拉底式追问。 知识库调用:领域限定指令、文献引用模式。 高级调试策略: 模糊指令优化:包括宽泛需求添加维度约束、主观表述量化标准。 迭代优化法:首轮生成获取基础内容、特征强化、风格调整、最终校验。 报告:GPT4 通用人工智能的火花 编程: 编写深度学习代码需掌握数学、统计学知识及熟悉相关框架和库。要求 GPT4 和 ChatGPT 编写自定义优化器模块,GPT4 响应在很大程度上与指令匹配,但忘记部分指令,ChatGPT 在应用动量时犯致命错误。
2025-04-08
需要优化工作规程文件,使用什么AI工具比较好
以下是一些可用于优化工作规程文件的 AI 工具及相关建议: 业务流程优化方面: 流程挖掘软件是一种常用的 AI 工具,它可以自动分析业务流程,并识别改进点。您需要先利用该工具分析当前的业务流程,收集关于业务流程的数据,如任务执行时间、顺序、参与者等,然后对收集到的数据进行分析,自动识别流程中的瓶颈、重复步骤或效率低下的环节。基于分析结果重新设计和优化流程,并将新设计的流程实施到日常业务中,持续监控其表现,根据实施结果和员工反馈进一步调整和优化流程。 文章润色方面: 以下是一些常见的文章润色 AI 工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 总的来说,这些 AI 工具涵盖了文章润色的各个环节,包括校对、改写、大纲生成、内容生成等,可以有效提高写作效率和质量。科研人员和学生可以根据自身需求选择合适的工具进行使用。 创建工作流文件方面: 可以使用 Cursor 和 MCP 来创建工作流文件。首先创建一个名为 workflow.md 的文件,写入明确的指令,避免模糊表达,任务越细分越好。然后在对话窗口中告诉 AI 各个文件的对应关系。在使用过程中,Cursor 会请求您允许使用 MCP,记得点“同意”,经过多轮同意后,它会开始执行生成页面。需要注意的是,必须要用 claude sonnet 3.7,3.5 版本实测不行。
2025-04-01
AI 优化简历
以下是一些可以用于优化简历的 AI 工具: 1. ResumeMatcher:这是一个 AI 驱动的开源简历优化工具。它能提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。采用 FastEmbed 计算简历与职位匹配度,结合 textacy 提取核心术语,精准优化简历内容。链接: 2. 超级简历优化助手:帮助用户优化简历提高求职成功率。超级简历优化助手分析简历内容并提供优化建议。 3. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,为简历摘要、工作经验和教育等专业部分编写内容,并在整个文档中保持一致的语调。 4. Rezi:是一个受到超过 200 万用户信任的领先 AI 简历构建平台。使用先进的 AI 技术自动化创建可雇佣简历的每个方面——写作、编辑、格式化和优化。 5. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合您的工具。
2025-03-30
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
我想找一个可以把服装图片用ai的方式直接‘穿’在另一张图片的模特身上
以下是两种可以将服装图片用 AI 的方式“穿”在另一张图片的模特身上的方法: 方法一:使用 ComfyUI GeminiAPI 1. 在 Google 的 AI Studio 申请一个 API key(需要网络环境),有免费的额度,网址为:https://aistudio.google.com/apikey?hl=zhcn 。 2. 安装相关依赖,根据使用的情况选择手动安装(如果使用 ComfyUI 便携版或自己的 Python 环境)或通过 ComfyUI Manager 安装。 手动安装:安装相关依赖。 通过 ComfyUI Manager 安装:在 ComfyUI 中安装并打开 ComfyUI Manager,在 Manager 中搜索“Gemini API”,然后点击安装按钮。 方法二:使用【SD】 1. 进行 SAM 模型分割:来到图生图中,提示词输入“蓝色毛衣”,蒙版区域内容处理改为“填充”,尺寸改为和图像一致,重绘幅度为 1。 2. 处理可能出现的问题:如蒙版区域较大导致的衔接问题,可以通过降低重绘幅度或添加一个 openpose 来控制人物的身体,得到正确的姿势。 3. 选择合适的重绘功能:除了使用图生图的局部重绘,还可以使用 controlnet 的局部重绘功能,控制模式选择“更注重提示词”,具体效果可自行试验选择。
2025-04-09
我想了解AI的应用方式
AI 的应用方式广泛且多样,主要包括以下几个方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 药物研发,加速研发过程。 个性化医疗,提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,降低金融机构风险。 信用评估,辅助贷款决策。 投资分析,帮助投资者做出明智决策。 客户服务,提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐,根据客户数据推荐感兴趣的产品。 搜索和个性化,改善搜索结果和提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 聊天机器人,回答客户问题和解决问题。 4. 制造业: 预测性维护,预测机器故障避免停机。 质量控制,检测产品缺陷提高质量。 供应链管理,优化供应链提高效率和降低成本。 机器人自动化,控制工业机器人提高生产效率。 5. 交通运输: 自动驾驶,提高交通安全性和效率。 交通管理,优化交通信号灯和流量缓解拥堵。 物流和配送,优化路线和配送计划降低运输成本。 无人机送货,将货物快速送达偏远地区。 6. 其他应用场景: 教育,提供个性化学习体验。 农业,分析农田数据提高农作物产量和质量。 娱乐,开发虚拟现实和增强现实体验。 能源,优化能源使用提高能源效率。 此外,还有众多具体的 AI 应用产品,如辅助创作与学习方面的 AI 智能写作助手、语言学习助手等;推荐与规划方面的图像识别商品推荐、旅游行程规划器等;监控与预警方面的宠物健康监测设备、家居安全监控系统等;优化与管理方面的办公自动化工具、物流路径优化工具等;销售与交易方面的艺术作品生成器、汽车销售平台等。总之,AI 的应用场景还在不断扩展,未来将对我们的生活产生更加深远的影响。
2025-04-09
ai变现方式有哪些
以下是一些常见的 AI 变现方式: 1. 电商方面: 利用 AI 制作服装,如 AI 小绿裙,单价 239 卖了 1160 多份,几个月共卖 27 万。可使用 sd、mj 等工具制作,新手也可用 mewxai 或幻火。 用 AI 定制萌娃的头像,单价 19.9,卖了 2675 份,执行力强的一个月能有 2000 3000 的收入。 2. 摊位活动: 乐易科学院:通过 AI 技术结合多种能量形式从多方面讲解国学和传统文化,进行批八字、调风水、性格色彩分析等。 AIGC 策划程序美术(3AI 简称 3A 游戏)应用独立游戏开发。 AI 人像摄影绘画。 B2B AI 营销与 AI 落地项目快速落地,涵盖 AI 训练、美国独立站搭建、Google seo 与 AI 结合等,并开发了多种 AI 工具,如帮 HR 筛选简历的工具、行业新闻 AI 生成与自动推送的工作流、小红书 AI 生成的工具、Newsletter AI 生成的工具等。 3. 个人方面: 在公司给自己贴 AI 大神标签。 在社交网络进行分享,扩大影响力,承接项目开发。 二创方向,如增加画板节点,结合公司 Logo 生成一系列公司主题的产品邮票,承接类似需求,扩充工作流以适应更复杂的业务,修改提示词调整生图内容方向。
2025-04-09
我们是搜索团队的产品经理,团队定位倾向于“对于插件的建设与调用”定位,现在要做AI相关的产品规划,请以通俗易懂的方式对以下问题做出回答 1、请通过流程图的方式,介绍【插件/工具】能力在大模型生态架构中的环节、定位、实现流程是什么 2、调研下对于我们搜索团队而言,插件应该做什么,可以做什么 3、思考对于大模型来说,有哪些(通用或垂类)的模块/功能/插件是无法绕开的,或高频使用的,作为我们团队后续争取的发力点(如搜索推荐对于传统综合搜索结果页)
以下是为您提供的关于 AI 相关产品规划的回答: 一、插件/工具能力在大模型生态架构中的环节、定位、实现流程 从 2023 年 3 月份 OpenAI 宣布插件计划开始,到 5 月份上线,其中包括联网、代码、画图三个插件。其实现流程大致为: 1. 经过对模型的微调,检测何时需要调用函数(取决于用户的输入)。 2. 使用符合函数签名的 JSON 进行响应。 3. 在接口层面声明可调用的工具。 4. 使用函数和用户输入调用模型。 5. 使用模型响应调用 API。 6. 将响应发送回模型进行汇总。 二、对于搜索团队,插件可以做和应该做的事 目前没有直接针对搜索团队插件具体可做和应做事项的明确内容,但可以参考 OpenAI 的插件计划,例如开发与搜索相关的特定功能插件,或者探索如何将现有的搜索推荐功能与大模型更好地结合。 三、对于大模型无法绕开或高频使用的模块/功能/插件 目前没有直接指出对于大模型无法绕开或高频使用的具体模块、功能或插件。但从相关信息中可以推测,例如与数据获取和处理相关的插件(如联网)、与技术开发相关的插件(如代码)以及与内容生成相关的插件(如画图)可能是较为重要和高频使用的。对于搜索团队来说,可以考虑在这些方向上寻找发力点,结合搜索推荐等传统功能,开发出更具竞争力的插件。
2025-04-08
想进入AI 这个赛道,有啥搞钱方式
以下是进入 AI 赛道的一些搞钱方式: 1. 参加“城市狂想”文旅短视频创意大赛: 该大赛由百度百家号主办,国内最大 AI 开源社区通往 AGI 之路协办,于 8 月 27 日正式开启。 无论个人、团体还是机构,AI 视频创作者或普通自媒体创作者,都可选择适合的分赛道参与,奖金池达 60000 元。 优质作品有机会获得单项 10000 元奖金及百+助推,还有机会获得地方政府/媒体扩圈传播,百度 APP 城市频道商业 banner 推荐。 针对零基础/技术欠缺的朋友,下周将在社区开设线上直播课程,由行业内顶尖的 AI 艺术家手把手教学如何制作 AI 文旅宣传片。 报名方式: 第一步,报名,填写右侧报名链接,本赛道为实名制,未报名作者不参与评奖。https://www.wjx.top/vm/w2oCF2q.aspx 第二步,投稿,在百家号创作者后台/百度 APP,带话题城市狂想发布符合活动要求的视频内容。(允许同一作者投稿多个参赛作品,或参与多部参赛作品制作。) 第三步,提交作品,填写右侧提交作品链接。https://www.wjx.top/vm/wvfqf2f.aspx 2. 运营 AI 创作账号: 变现方式:分为通过官方蒲公英平台接单和主流媒体约稿。蒲公英平台会收取 10%手续费,行业 AI 视频价格一分钟约 2.5 万到 4 万,主流媒体约稿稿费可能较低但有背书作用。 平台选择:推荐小红书和 B 站。小红书从种草平台逐渐变为知识社区,其知识属性适合 AI 创作者,视频号也值得做但经验分享较少。 内容形式:小红书能发视频就发视频,小红书的视频 UI 界面改版且推送机制变化,后续可能重点发力视频。 账号赛道:起号前期可用妖魔鬼怪类内容,但后期要扭转账号标签,此类账号变现方式窄,做账号要有价值,不能割韭菜,要把 AI 生态圈做大。 账号搭建与运营: 头像设计:要有记忆点和视觉冲击力,能让人记住。 名称选择:要独特,能体现个人或内容特点。 简介撰写:要有哲理或引人思考的话语,能吸引用户。 封面统一:要统一且具有账号属性,体现商业化。 追热点策略:账号初期应追热点,如对热门内容进行分析和跟风创作。 获取信任:做 IP 最终要赢得用户信任,用户信任能增强其对推荐内容的关注度。 3. 运营 AI 视频号: 保持日更:起号阶段至少两天一更,每天半小时就能完成 20 秒的简单内容制作,持续更新让平台看到创作者的诚意。 选择赛道:资讯类不做,选择 AI 视觉冲击力、利他的内容,有 AI 基础可做教程。 寻找对标:起号阶段要找 10 个对标的账号,参考其内容和模式。 克服心理:出镜做 IP,不要有容貌焦虑,长得丑或有特点都能有流量,要克服不敢出镜的心理。 蹭取热点:蹭经过平台验证有流量的热点,如黄油小熊,根据热点抄学制作,同时注意热点的舆论导向和合规性。 其他经验: 获取视频教程:可在 vtwoagi.com 网站的飞书知识库中获取 AI 视频创作教程。 应对抄袭方法:在抄袭者评论区留言指出,或找朋友点赞将评论顶上去,为自己账号引流。 特效视频长度:建议控制在 1 分钟内,不建议做费时费力的剧情或故事片。 账号限流处理:视频号限流建议重新起号,小红书限流可日更 10 天尝试。 内容商业价值:内容有商业价值的标准是甲方或品牌愿意投钱,如靠播放量或带货分成有收入。 封面获取渠道:可从堆友、吉梦、小红书等获取封面素材。 蹭取平台热点:做哪个平台就蹭哪个平台的热点。 寻找对标账号:在小红书创作者平台的成长榜样中可找到对标账号。 账号标签查看:在小红书创作者后台可查看账号是否被打上标签。 内容发布时间:8 点到 10 点、2 点到下午 5 点、7 点到 8 点较为合适。
2025-03-28
作为AI小白,如何开始学习AI?有哪些资源和方式推荐?
对于 AI 小白,以下是开始学习 AI 的建议和资源推荐: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,关于 AI 知识库使用及 AIPO 活动的介绍:讨论了 AI 知识库的使用情况、AIPO 活动的发起背景、内容安排及相关资源等。AIPO 线下活动及 AI 相关探讨:讨论了 AIPO 线下活动的规则和玩法,以及 AI 在科技发展中的重要地位和相关研究方向。way to AGI 社区活动与知识库介绍:讨论了 way to AGI 社区活动的安排、材料准备以及知识库的使用和相关内容更新等情况。 学习路径方面:有李弘毅老师的生成式 AI 导论等高质量学习内容,可系统化学习或通过社区共创活动反推学习,鼓励整理学习笔记并分享交流。初学者入门推荐:推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。历史脉络类资料:整理了 open AI 的发展时间线和万字长文回顾等。
2025-03-27