Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有关于微调的最佳实践

Answer

以下是关于微调的最佳实践:

  • 一般最佳实践:使用更多高质量的示例进行微调效果更好。要微调一个比使用基本模型使用高质量提示更好地执行的模型,应提供至少几百个高质量的示例,最好由人类专家审查。从那里开始,性能往往会随着示例数量的每增加一倍而线性增加。增加示例的数量通常是提高性能的最佳和最可靠的方法。分类器是最容易上手的模型。对于分类问题,建议使用 ada,经过微调后,它通常只会比功能更强大的模型稍微差一点,同时速度更快,成本更低。
  • 准备数据集:微调是一种强大的技术,可用于创建特定于您的用例的新模型。在微调您的模型之前,强烈建议阅读以下针对您的用例的最佳实践和具体指南。
  • 具体指南:微调可以解决多种问题,最佳使用方式可能取决于您的具体用例。常见的微调用例和相应的指南包括:

如果您要对预先存在的数据集进行微调,而不是从头开始编写提示,请务必在可能的情况下手动检查您的数据是否存在令人反感或不准确的内容,或者如果数据集很大,请检查尽可能多的随机样本。

Content generated by AI large model, please carefully verify (powered by aily)

References

微调(Fine-tuning)

使用更多高质量的示例进行微调效果更好。要微调一个比使用我们的基本模型使用高质量提示更好地执行的模型,您应该提供至少几百个高质量的示例,最好由人类专家审查。从那里开始,性能往往会随着示例数量的每增加一倍而线性增加。增加示例的数量通常是提高性能的最佳和最可靠的方法。分类器是最容易上手的模型。对于分类问题,我们建议使用ada,经过微调后,它通常只会比功能更强大的模型稍微差一点,同时速度更快,成本更低。如果您要对预先存在的数据集进行微调,而不是从头开始编写提示,请务必在可能的情况下手动检查您的数据是否存在令人反感或不准确的内容,或者如果数据集很大,请检查尽可能多的随机样本。

微调(Fine-tuning)

微调是一种强大的技术,可用于创建特定于您的用例的新模型。在微调您的模型之前,我们强烈建议您阅读以下针对您的用例的最佳实践和具体指南。

微调(Fine-tuning)

微调可以解决多种问题,最佳使用方式可能取决于您的具体用例。下面,我们列出了最常见的微调用例和相应的指南。[分类](https://platform.openai.com/docs/guides/fine-tuning/classification)[该模型是否做出了不真实的陈述?](https://platform.openai.com/docs/guides/fine-tuning/case-study-is-the-model-making-untrue-statements)[情绪分析](https://platform.openai.com/docs/guides/fine-tuning/case-study-sentiment-analysis)[电子邮件分类的分类](https://platform.openai.com/docs/guides/fine-tuning/case-study-categorization-for-email-triage)[条件生成](https://platform.openai.com/docs/guides/fine-tuning/conditional-generation)[根据维基百科文章撰写引人入胜的广告](https://platform.openai.com/docs/guides/fine-tuning/case-study-write-an-engaging-ad-based-on-a-wikipedia-article)[实体提取](https://platform.openai.com/docs/guides/fine-tuning/case-study-entity-extraction)[客户支持聊天机器人](https://platform.openai.com/docs/guides/fine-tuning/case-study-customer-support-chatbot)[基于技术属性列表的产品描述](https://platform.openai.com/docs/guides/fine-tuning/case-study-product-description-based-on-a-technical-list-of-properties)

Others are asking
热点的大模型微调蒸馏工具有哪些
以下是一些热点的大模型微调蒸馏工具: FLUX.1:包括 FLUX.1(可商用,为本地开发和个人使用定制,生成速度快,内存占用小,在 Apache 2.0 许可下公开提供,支持在 Replicate、fal.ai 和 Comfy UI 等平台使用,且支持用户根据自己数据集微调)。其训练参数高达 120 亿,在图像质量、提示词跟随等多方面超越流行模型,工作原理基于混合架构,结合变换器和扩散技术。 基于阿里云 PAI 平台:可复现 R1 蒸馏及蒸馏训练模型过程。部署 32b 的蒸馏模型展示效果,包括模型部署(如选中模型卡片后的操作、选择 vLLM 部署、涉及竞价系统等)、蒸馏数据获取(在本地 python 环境或 notebook gallery 建立实例执行代码获取蒸馏数据集)等。 DeepSeek:PaaS 平台支持多机分布式部署,满足推理性能要求,能一站式完成模型蒸馏。可登录 Pad 控制台通过 model gallery 进行部署,如 Deepseek R1 模型,可选择 SG 浪或 Vim 推理框架,根据资源出价部署,部署后可在模型在线服务 EAS 查看状态。还介绍了模型 API 调用、服务关停、蒸馏概念、应用场景及部署实操等。
2025-04-13
deepseek v3微调
以下是关于 Deepseek V3 微调的相关信息: 云舒文章总结卡 2.0 提示词全面支持 Deepseek V3,效果媲美 Claude3.7。V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号。提示词复制链接:。横版为 1080 x 800 卡片提示词,竖版为 750 x 不限高卡片提示词。 各平台均需下载 html 文件,打开后才能查看真实效果,平台自带预览因兼容性问题无法正常展示效果。Claude 使用平台包括 Claude3.7 官网、API、Cursor,使用时需要下载为 HTML 文件打开查看效果。Deepseek 使用平台包括 Deepseek 官网、API(V3 需要为 0324 更新的版本),Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 关于智能纪要,会带着大家复现模型的蒸馏和微调,并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面。 北京时间 00:30 至 08:30 期间,DeepSeek API 价格大幅下调,DeepSeekV3 降至原价的 50%。
2025-04-12
有哪些针对CoT能力的微调工具
以下是一些针对 CoT 能力的微调工具: 1. Selfconsistency CoT:使用手动设计的 Prompt 生成采样一组不同的推理路径,再通过“多数投票”找到推理步骤中“最一致”的路径,使用这条解码路径驱动原始的贪心解码方式来提示 CoT 性能。 2. MMCoT:侧重使用微调方法嵌入 CoT,通过将语言和图像合并在一个包含推理生成与答案推理的两阶段的框架中,使用微调大模型赋予输入多模态 CoT 的能力。 3. GoTInput 方法:通过对 CoT 生成的思维图进行抽取构建三元组,并使用 GNN 将文本、图像与 CoT 统一,从而生成包含 CoT 信息的最终答案。 4. VCoT:解决了一个输出多模态的问题,通过以生成图片的“标题”以及识别核心关注点作为图像生成的启动过程,通过递归的方式填充图像信息,从而实现输出多模态。 此外,在将 DoT 扩展到预训练的扩散语言模型 Plaid 1B 并在更复杂的推理任务上进行评估时,自回归模型和扩散模型在使用 CoT 或 DoT 进行微调时都显示出显著提高的性能。在微调 Plaid 1B 时,也探索了几种替代方案。 在强化学习驱动的合成数据生成与模型优化流程中,也涉及到 CoT 的相关应用和优化,如初始 CoT 生成、CoT 存储等。
2025-04-12
本地部署大模型,如何微调建立本地知识库
以下是关于本地部署大模型并微调建立本地知识库的详细步骤: 一、使用 AnythingLLM 进行本地知识库搭建 1. 安装 AnythingLLM 安装地址:https://useanything.com/download 安装完成后进入配置页面,主要分为三步: 第一步:选择大模型 第二步:选择文本嵌入模型 第三步:选择向量数据库 2. 构建本地知识库 在 AnythingLLM 中创建自己独有的 Workspace 与其他项目数据隔离。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,提供了 Chat 模式(大模型根据训练数据和上传文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 二、张梦飞的全本地部署教程 1. 部署大语言模型 下载并安装 Ollama 点击进入,根据电脑系统,下载 Ollama:https://ollama.com/download 下载完成后,双击打开,点击“Install” 安装完成后,将下方地址复制进浏览器中。如果出现下方字样,表示安装完成:http://127.0.0.1:11434/ 下载 qwen2:0.5b 模型 如果是 Windows 电脑,点击 win+R,输入 cmd,点击回车;如果是 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。 复制相关命令行,粘贴进入,点击回车。 三、智能纪要中的相关内容 在智能纪要中,许键介绍了模型 API 调用方法与知识库创建,包括获取 API key 位置及调用设置,详细讲解了创建 Rag 应用(知识库)流程,如上传非结构化文件、数据解析、切分段落等操作,并回答了诸多问题。同时还涉及工作流创建、模型能力及相关问题的探讨,以及通义千问相关应用及明天课程安排交流等内容。 总之,本地部署大模型并建立本地知识库需要按照上述步骤进行操作和配置,同时不断实践和探索,以达到理想的效果。
2025-04-10
如何做 deepseek 微调
要进行 DeepSeek 微调,以下是一些相关的知识和步骤: 1. 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 2. 本地部署介绍:如果拥有云服务器,可以进行本地部署,了解满血版本地部署的实际情况。 3. 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 4. 平台服务差异:了解 DLC、DSW 和 EAS 等模型部署平台服务的差别。 5. 对于微调的全过程,建议阅读 Unsloth 笔记本和 HuggingFace 的《如何微调开放式 LLMs》,也可以使用《如何在一小时内阅读论文》作为指南。 6. 更加完善的训练说明,可直接阅读官方论文:DeepSeekAI《DeepSeekR1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》https://arxiv.org/html/2501.12948
2025-04-08
怎么本地部署ai模型,并进行微调
以下是本地部署 AI 模型并进行微调的主要步骤: 1. 选择合适的部署方式:包括本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,根据自身的资源、安全和性能需求进行选择。 2. 准备训练所需的数据和计算资源:确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础:可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练:根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 5. 部署和调试模型:将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护:大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 此外,关于本地部署还有以下相关内容: 如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 会带着大家复现模型的蒸馏和微调,并讲解相关知识。 PaaS 平台支持多机分布式部署,满足推理性能要求,使用独占资源和专有网络,能一站式完成模型蒸馏。 登录 Pad 控制台,通过 model gallery 进行部署,如 Deepseek R1 模型,可选择 SG 浪或 Vim 推理框架,根据资源出价,部署后可在模型在线服务 EAS 查看状态。 介绍了模型 API 的调用方法,包括查找位置、获取 token 等,强调使用后要及时停止或删除服务以避免持续付费。 总的来说,部署和训练自己的 AI 模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2025-03-27
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
对于用cursor来开发,有没有好好用prompt来使cursor变得更加好用
以下是关于如何用 prompt 使 Cursor 变得更好用的相关内容: 在 prompt 方面,Devin 有一个特别有帮助的文档(https://docs.devin.ai/learnaboutdevin/prompting),它会教您什么样的 prompt 在与 Devin 沟通时最有效,比如明确定义成功的标准,如跑通某个测试或访问某个链接能对得上等。将同样的原则应用到 Cursor 中,会发现 Cursor 变得聪明很多,能自主验证任务完成情况并进行迭代。 Cursor 在生成单测方面表现出色。相对 GPT 等工具,Cursor 解决了上下文缺失和难以实现增量更新的问题。它可以向量化整个代码仓库,在生成单测代码时能同时提供目标模块及对应的上下游模块代码,生成结果更精确。例如,使用适当的 Prompt 能返回基于 Vitest 的结果,调整成本较小。 Cursor 支持使用.cursorrules 文件设定项目的系统提示词,针对不同语言可设定不同的 Prompt。@AIChain 花生做了一个 Cursor 插件解决提示语管理问题,可选择不同的.cursorrules 文件,还可从 https://cursor.directory/ 和 https://cursorlist.com/ 寻找提示词。此外,还有一个提示语小技巧,给已有的提示语追加上特定规则,可使模型在搜索资源和思考时默认使用英语,回复转换成中文,或更灵活地根据提问语言进行回复。
2025-04-14
有没有把pdf转成word的ai
以下是一些可以将 PDF 转换成 Word 的 AI 工具和方法: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-14
有没有AI面试
有的,目前有一些 AI 面试官的相关产品。例如: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 不过,使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。 此外,在 3 月 19 日的 XiaoHu.AI 日报中,提到了一些其他的 AI 相关内容: 1. 克隆一个自己,用 AI 面试:创新的克隆 AI 面试应用。链接:https://x.com/imxiaohu/status/1770011969229390287?s=20 2. SystemAnimatorOnline,全身运动捕捉:基于 AI 的全身运动捕捉方案,仅需网络摄像头。新交互方式,适用于虚拟直播和视频制作。链接:https://github.com/ButzYung/SystemAnimatorOnline… 、https://x.com/imxiaohu/status/1769957973252796634?s=20 3. Apollo 机器人,自主制作果汁:展示与英伟达 Project GROOT 合作,实现任务自主完成。从人类示范中学习,无需回初始位置。链接:https://x.com/imxiaohu/status/1770047098731577481?s=20 4. MindEye2,重建大脑所见图像:仅需 1 小时 fMRI 数据,重建观察者所见图像。能识别多个图像选项中的实际所见。实现不同受试者数据的有效泛化。链接:https://medarcai.github.io/mindeye2/ 、https://arxiv.org/abs/2403.11207 、https://github.com/MedARCAI/MindEyeV2 、https://x.com/imxiaohu/status/1770021233129885989?s=20 5. 英伟达 Blackwell GPU
2025-04-14
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
学习WaytoAGI的最佳路径是什么
学习 WaytoAGI 的最佳路径包括以下几个方面: 1. 了解最新的 AI 技术:WaytoAGI 像免费的“技术期刊”,能让您了解最新动态,还能教授实用技能,且开源免费。 2. 线上共学:通过线上共学方式,手把手教您应用 AI 技术,无论您是小白还是有一定基础,都能找到适合自己的学习路径。 3. 找到志同道合的队友:如果您想创业、做副业,或者只是想找对 AI 感兴趣的伙伴一起做事,WaytoAGI 是很好的平台。 使用 WaytoAGI 的方法: 1. 点开链接就能看:无需注册和花钱,直接点击链接:点击。 2. 想看啥就看啥:比如想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分,内容分类清晰。 3. 有问题还能问:看了还有不懂的,或者想跟别人交流,可以加入社群讨论。 此外,WaytoAGI 还有整活区,这里不是系统性学习的地方,而是一起做有趣事情的游乐场。在这里,您不用证明想法“有什么用”,可以尽情发挥对 AI 最天马行空的想象,鼓励把 AI 玩出新花样。
2025-04-10
写代码的最佳模型
写代码的最佳模型取决于具体的需求和任务。以下是一些相关要点: 1. 对于不同人使用同一个模型,结果差异大的原因在于是否懂 AI 和懂内容,专业写作通常会混合使用多个模型并取其精华,例如 Grok、Gemini、GPT 各有优势,关键在于如何运用。 2. 在需要精确计算时,可以使用代码或调用 API。GPT 自身进行算术或长计算可能不准确,此时应让模型编写并运行代码,运行代码输出结果后,再将其作为输入提供给模型进行下一步处理。同时调用外部 API 也是代码执行的一个好的用例,但执行代码时要注意安全性,需采取预防措施,特别是需要一个沙盒化的代码执行环境来限制不可信代码可能造成的危害。 3. 文本补全端点可用于各种任务,它提供了简单且强大的接口连接到任何模型。输入一些文本作为提示,模型会生成文本补全,试图匹配给定的上下文或模式。探索文本补全的最佳方式是通过 Playground,它是一个文本框,可提交提示生成完成内容。由于 API 默认是非确定性的,每次调用可能得到稍有不同的完成,将温度设置为 0 可使输出大部分确定,但仍可能有小部分变化。通过提供指令或示例可以“编程”模型,提示的成功通常取决于任务复杂性和提示质量,好的提示应提供足够信息让模型明确需求和回应方式。 需要注意的是,默认模型的训练数据截止到 2021 年,可能不了解当前事件情况。
2025-04-01
数据问答的最佳实践
以下是关于数据问答最佳实践的相关内容: Databricks: Databricks 作为大数据领域的领先服务商,在 RAG 设计上有自身特点和优势。用户输入问题后,从处理好的文本向量索引获取相关信息,结合提示词工程生成回答。上半部分 Unstructured Data pipeline 采用主流 RAG 方法,下半部分 Structured Data Pipeline 是其特征工程处理流程,也是最大特点。Databricks 从专业大数据角度出发,在准确度较高的数据存储中进行额外检索,发挥在 Real Time Data Serving 上的优势。可见其在 GenAI 时代将强大的 Lakehouse 数据处理能力与生成式 AI 技术深度融合,构建一体化解决方案。 OpenAI: 从 OpenAI Demo day 的演讲整理所得,在提升 RAG 准确率的成功案例中,OpenAI 团队从 45%的准确率开始,尝试多种方法。包括假设性文档嵌入(HyDE)和精调嵌入等,但效果不理想。通过尝试不同大小块的信息和嵌入不同内容部分,准确率提升到 65%。通过 Reranking 和对不同类别问题特别处理,进一步提升到 85%。最终,结合提示工程、查询扩展等方法,达到 98%的准确率。团队强调模型精调和 RAG 结合使用的强大潜力,仅通过简单的模型精调和提示工程就接近行业领先水平。 Loop: 具有环状结构的 RAG Flow 是 Modular RAG 的重要特点,检索和推理步骤相互影响,通常包括一个 Judge 模块控制流程,具体可分为迭代、递归和主动检索三种。 迭代检索:对于一些需要大量知识的复杂问题,可采用迭代方式进行 RAG,如 ITERRETGEN。每次迭代利用前一次迭代的模型输出作为特定上下文帮助检索更相关知识,通过预设迭代次数判断终止。 递归检索:特点是明显依赖上一步并不断深入检索,通常有判断机制作为出口,需搭配 Query Transformation,每次检索依赖新改写的 Query。典型实现如 ToC,从初始问题通过递归执行 RAC 逐步插入子节点到澄清树中,达到最大数量有效节点或最大深度时结束,然后收集所有有效节点生成全面长文本答案回答初始问题。
2025-03-17
利用agi做ppt的最佳选择
以下是一些利用 AGI 做 PPT 的较好选择: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,还支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路来完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 此外,还了解到在众多的 PPT 工具中,AI 的介入带来了便捷与高效的体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适的工具要根据实际需求调整,试用和体验比盲目跟风更明智。 希望以上信息对您有所帮助。
2025-03-07
我需要一套帮我总结论文,阅读论文的最佳prompt
以下是为您提供的一套帮助总结和阅读论文的最佳 prompt 相关内容: 一、李继刚等的 prompt 最佳实践 对于给定的论文链接,总结如下: 1. 提出了基于 GPT3 的无代码聊天机器人设计工具 BotDesigner。 2. 创建了 Conversation 视图和 Error Browser 视图。 3. 观察了 10 名非专家提示设计师执行聊天机器人设计任务的行为,得出相关结论,如参与者能够进行机会性的提示迭代设计,但在生成、评估提示有效性和解释提示效果方面存在困难,倾向于过度推广和从人类交流角度过滤提示设计等。 二、小七姐的 Prompt 喂饭级系列教程小白学习指南(二) 1. 让 AI 帮您阅读文档时,可使用简单的 Prompt,如:于是这个提示词解决了你自己,和任何收到你 Prompt 的人微调几个关键信息就能自动让 GPT 或者 Kimi 帮你阅读一篇论文而且生成不错的总结啦! 2. 结合自己的生活或工作场景想一个能简单自动化的场景,例如自动给班级里的每个孩子起个昵称、自动排版微信群经常发的运营小文案等。 3. 选择一个好上手的提示词框架,如情境。 三、学术场景数据处理 1. 论文总结:GLM4Plus 结合良好的提示词能够帮助学生快速总结论文内容,提高论文梳理的效率。 2. 论文翻译:GLM 结合良好的提示词能够帮助学生快速翻译论文内容,提高论文阅读效率。 3. 论文内容扩写润色:精心设计的润色提示词可以根据特定场景进行调整,以便生成与特定平台风格相匹配的多样化润色结果。例如针对小红书的使用场景,调整提示词以匹配其特有的口语化、轻松愉快的氛围,将论文中的结论部分润色成适合在小红书上分享的生活化内容。
2025-03-05
编写最佳实践的工具
以下是关于编写最佳实践的工具的相关内容: 熊猫 Jay:万字解读 ChatGPT 提示词最佳实践 最佳实践 5 使用外部工具: 1. 文本嵌入工具:需要能够将文本转化为向量的工具,如 Word2Vec、BERT、FastText 等,将文本转化为高维空间中的向量。 2. 构建电影数据库:包含各种电影详细信息,可以是简单的文本文件每行包含一个电影信息,或更复杂的数据库系统。 3. 预处理和嵌入:对数据库中的每部电影信息进行文本嵌入,得到向量表示并存储。 4. 查询处理:将用户提出的查询(如“由莱昂纳多·迪卡普里奥主演的电影”)进行文本嵌入得到查询向量。 5. 向量搜索:使用快速的向量搜索算法(如余弦相似度、KNN 搜索等)在电影数据库中找到最接近的电影向量。 6. 返回结果:根据找到的最接近向量,从数据库中检索相关电影信息返回给用户。 7. 集成到 ChatGPT:将上述步骤封装成 API 或函数,在 ChatGPT 对话逻辑中调用,以便用户提出相关查询时返回相关电影信息。 小七姐:官方最佳 Prompt 实践的六个方法 策略一:编写清晰的说明 在 OpenAI 官方的说明文档中,为用户提供了若干策略以更好使用 ChatGPT。在询问中应包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”意图,所以提问时不要惜字如金,多说多提供信息能有效提高回复质量和丰富性。例如:想要大模型提供思维模型时,本能问法可能效果不佳,而提供更多信息(如为什么需要、希望列举个数、是否有已知模型参考等)能得到更符合预期的回答;请 ChatGPT 帮助记忆抽象概念时,脱口而出的问题可能不理想,提供更多细节则能得到更好的回答;了解提示词时,给出特定情景和进一步思考的问题能得到更好效果。
2025-03-03
如果是小白新手,理论应用到实践中最重要的是什么
对于小白新手,将理论应用到实践中,以下几点最为重要: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,可找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,知识库中有很多实践后的作品和文章分享,欢迎分享自己的实践成果。 5. 体验 AI 产品:与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验,激发对 AI 潜力的认识。 此外,就像有人认为“只要知道它的原理和历史,自然而然就会知道它的底线和顶点在哪里”,但实践中的体验和尝试同样不可或缺。
2025-04-13
学的理论模型如何高效指导实践,在教学中
在教学中,关于如何让学习的理论模型高效指导实践,以下是相关内容: 本系列课程是由 Deeplearning 联合谷歌 Gemini 团队开发的免费在线课程,以 Gemini 模型作为教学模型,教授如何使用多模态提示词与模型交互。但课程内容在国内存在部分无法应用的情况,且缺乏某些概念。因此,对部分教程内容进行了重新整理和刊发,并适当混合了一些入门概念,以增强普世价值。(如有需要,请访问) 在本节课程中您可以学到: 通过实践,与视频内容交互,辅助工作与学习。 通过实践,学习 Function Calling 概念与实际应用。 扩展阅读: )
2025-04-13
ai在茶饮或者餐饮行业的实践
以下是 AI 在茶饮或餐饮行业的一些实践: 中昊智达是一家智能饮茶机研发与运营服务商,专注于智能饮茶机的研发、生产和市场投放。该公司整合了茶叶种植、生产、销售和体验等多方资源,构建了完整的产业链,致力于为消费者提供便捷的茶饮服务。 有人对利用 ComfyUI 的底层原理搭建适用于中医药房自动抓药或养生茶饮茶方的工作流感兴趣。 大雍是新茶饮行业的全栈服务商,在 AI 社群的共创项目里主要负责剧本创意和分镜脚本部分。
2025-04-09
AI在人力资源中的实践应用资料
以下是关于 AI 在人力资源中的实践应用资料: 在人力资源管理领域,AI 的应用覆盖了多个环节,显著提高了工作效率。 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计等方面。 在员工绩效评估中,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 在员工培训与发展方面,AI 也能发挥作用。 相关报告推荐: 《》预测,随着技术进步,AI 将进一步推动个性化人力资源管理,创造无人值守的 HR 平台,推动企业持续发展。 此外,在全行业中,基础办公提效如 ppt、excel、会议报告、策划会、文案包装、图文海报、客服机器人 bot 等,都可以从【单个任务 task>角色 role>角色间协同 collaboration】显著提高工作效率。
2025-03-31
公司给我了一个调研作业,收集 市场上其它公司在agent业务变革上的优秀实践
很抱歉,目前没有关于市场上其他公司在 agent 业务变革方面优秀实践的相关内容。建议您通过以下途径进行收集和调研: 1. 行业报告和研究机构发布的分析:这些通常会涵盖多个公司在特定领域的实践和趋势。 2. 专业的行业论坛和社区:与同行交流,获取他们的经验和见解。 3. 公司的官方网站和公开资料:了解其业务变革的介绍和相关案例分享。 4. 新闻媒体报道:关注相关的商业新闻,获取最新的动态和实践案例。
2025-03-31
实践案例推荐,仅搜索教育、多邻国相关的内容
以下是与教育、多邻国相关的实践案例推荐: 张翼然:用 AI 为教师减负(3H) 教师的 AI 减负指南生成式人工智能在教学中的应用 教师使用 AI 小技巧 想让 AI 做好,首先你得会做 教学目标:是否明确,与课程标准和学生实际需求相符合 教学方法:是否使用多种,考虑学生不同学习风格 能力培养:是否注重培养学生的思维、创新和实践能力 教学实践 教案中的教学过程是否紧密结合学生现实生活和个人经验 群里“公开问”创造良好探究学习气氛,提问技巧可见的快速提高 是否充分利用课堂时间,让学生参与教学 是否在教学中关注学生反馈和理解,及时调整教学策略 师生关系 是否营造良好教学氛围和师生关系 是否平等尊重学生主体地位,体现尊重和关爱学生的教育理念 是否注重发挥学生积极性和主动性,激发学习热情 移动教学应用: 多邻国 六六写字 幕布 “遇见苏轼”项目式教学 在教育实践中,针对二年级学生对于抽象数学概念感到困惑的痛点问题,也有相关的探索和尝试。
2025-03-20