Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

openai 12天都有哪些内容

Answer

以下是 OpenAI 12 天相关的内容:

  • 12 月 18 日:
    • API 正式版:速度更快,成本降低 60%,支持视觉识别、函数调用、结构化输出等功能。
    • 语音交互升级:引入 WebRTC 支持,12 行代码即可实现实时语音交互,音频处理费用降低 60%。
    • 偏好微调功能:让 AI 回答更具个性化,企业 AI 准确率提升显著。
    • 新增 Go 和 Java 工具包,简化 API 密钥申请流程。
  • 12 月 12 日:
    • 苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作。
    • 多平台无缝衔接:支持 iPhone、iPad 和 Mac,涵盖 Siri 集成、写作工具增强、视觉智能分析等多种应用场景。
    • 实用场景:圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。
  • 12 月 5 日:
    • OpenAI 近日宣布将举行为期 12 天的活动,期间每天直播展示新功能或工具。
    • DeepMind 发布了基础世界模型 Genie 2,可以通过一张图片生成可操作的 3D 环境,实现智能体的实时交互与行为预测。
    • 真格基金投资副总裁 Monica 在其播客「OnBoard!」发布的最新一期对谈中,与在一线大模型机构有实际训练大语言模型(LLM)经验的研究员针对 OpenAI o1 模型进行了三个多小时的拆解与解读。强化学习如何给大语言模型带来新的逻辑推理能力?这种能力的来源、实现方式和未来潜力又是怎样的?o1 带来的「新范式」会对行业有怎样的影响?
Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

?宝玉日报「12月18日」✨✨✨✨✨✨✨✨1⃣️?AI架构与技术选型的4条原则选主流框架:优先选择语料多、生成质量好的语言和框架。测试覆盖率:用AI辅助生成测试代码,确保代码质量。避免私有框架:尽量使用流行框架生成独立模块代码。模块化设计:降低耦合度,方便AI快速开发和维护。?[https://x.com/dotey/status/1869209113726529989](https://x.com/dotey/status/1869209113726529989)2⃣️?OpenAI 12天发布会第9天:开发者主题日o1 API正式版:速度更快,成本降低60%,支持视觉识别、函数调用、结构化输出等功能。语音交互升级:引入WebRTC支持,12行代码即可实现实时语音交互,音频处理费用降低60%。偏好微调功能:让AI回答更具个性化,企业AI准确率提升显著。新增Go和Java工具包,简化API密钥申请流程。?[https://x.com/dotey/status/1869166100367151452](https://x.com/dotey/status/1869166100367151452)3⃣️?Sora眼中的西施:穿越古代的浪漫邂逅Prompt描述了在繁华古代集市遇见西施的唯美场景。镜头化叙事,展现了主角与西施的心动瞬间及互动细节。?[https://x.com/dotey/status/1869087190447280303](https://x.com/dotey/status/1869087190447280303)

宝玉 日报

?宝玉日报「12月12日」✨✨✨✨✨✨✨✨?OpenAI连续12天AI发布会:第五天完整视频(中英文双语字幕)亮点功能:苹果设备深度集成ChatGPT,可通过Siri实现文档总结、任务分配、节日创意等操作。多平台无缝衔接:支持iPhone、iPad和Mac,涵盖Siri集成、写作工具增强、视觉智能分析等多种应用场景。实用场景:圣诞派对策划、PDF总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。?[https://x.com/dotey/status/1866974269051113543](https://x.com/dotey/status/1866974269051113543)

4.4 历史更新

《[OpenAI深夜官宣!连续12天发布AI大招!「截胡」DeepMind头条,Sora、满血o1或将发布](https://mp.weixin.qq.com/s/LwGWl2mm8UpIE4MeqIc3Dw)》OpenAI近日宣布将举行为期12天的活动,期间每天直播展示新功能或工具。与此同时,DeepMind发布了基础世界模型Genie 2,可以通过一张图片生成可操作的3D环境,实现智能体的实时交互与行为预测。《[三万字实录对话Google Deepmind研究员:拆解OpenAI o1及LLM+RL新范式](https://mp.weixin.qq.com/s/W6-ZdS5xBk3-odFEs-LAgA)》真格基金投资副总裁Monica在其播客「OnBoard!」发布的最新一期对谈中,与在一线大模型机构有实际训练大语言模型(LLM)经验的研究员针对OpenAI o1模型进行了三个多小时的拆解与解读。强化学习如何给大语言模型带来新的逻辑推理能力?这种能力的来源、实现方式和未来潜力又是怎样的?o1带来的「新范式」会对行业有怎样的影响?《[Anthropic创始人最看好的领域,AI for Science深度解读](https://mp.weixin.qq.com/s/Uxu7zsCeFVUcpWJg9aOyFA)》Anthropic的联合创始人兼CEO Dario Amodei预测,AI在生物学和神经科学领域将加速研究进程,可能在5-10年内实现原本需要50-100年才能达到的突破。Pear VC分析了过去15年北美和欧洲的Top 50 Biotech公司,发现药物研发公司占大多数,且行业内对智能软件的需求将推动Biotech SaaS的发展。

Others are asking
12个精选prompt框架
以下是 12 个精选的 prompt 框架: 1. ICIO 框架: 指令:执行的具体任务。 背景信息:提供执行任务的背景信息、上下文内容,让大模型更好地回答。 输入信息:大模型需要用到的一些信息。 输出信息:明确输出的具体信息的要求,比如字数、风格、格式。 2. BROKE 框架:通过 GPT 的设计提示,来提升整体反馈的效率。 背景:提供足够背景信息,让大模型可以理解问题的上下文。 角色设定:特定的角色,让 GPT 根据特定的角色能力的特点来形成响应。 目标:明确任务的目标,让大模型知道您想让它做什么。 结果定义:明确可以衡量的结果,让大模型清楚自己做的情况。 调整:根据具体的情况,来调整具体的结果。 3. CRISPIE 框架: 能力和角色:您期望大模型扮演的角色洞察,提供幕后洞察力、背景信息和上下文。 声明:简洁明了的说明希望完成的任务。 个性:回应的风格、个性或者方式。 实验:提供多个回答的示例。 另外,在潘帅分享的法律人如何用好 AI—Prompt 篇中,也提到了 Prompt 的建议框架及格式,如 CRISPE 框架: 能力与角色(Capacity and Role):比如您希望它的角色和能力,如您是一名专注于民商事法律领域的律师,擅长案例研究、法律条文检索以及案件策略分析。 洞察(Insight):提供背景信息和上下文,比如处理一起复杂的合同纠纷案件,向 AI 提供案件的关键事实、相关法律以及案件涉及的背景。 陈述(Statement):您希望 AI 做什么,比如直接明确期望 AI 完成的任务是什么。 个性(Personality):您希望 AI 以什么风格或方式回答您。 举例:以合同纠纷案件为例,要求 AI 总结此案件中双方的诉求、检索法条、预测可能的判决结果。
2025-03-26
12个精选prompt框架
以下是 12 个精选的 prompt 框架: 1. ICIO 框架: 指令:执行的具体任务。 背景信息:提供执行任务的背景信息、上下文内容,让大模型更好地回答。 输入信息:大模型需要用到的一些信息。 输出信息:明确输出的具体信息的要求,比如字数、风格、格式。 2. BROKE 框架:通过 GPT 的设计提示,来提升整体反馈的效率。 背景:提供足够背景信息,让大模型可以理解问题的上下文。 角色设定:特定的角色,让 GPT 根据特定的角色能力的特点来形成响应。 目标:明确任务的目标,让大模型知道您想让它做什么。 结果定义:明确可以衡量的结果,让大模型清楚自己做的情况。 调整:根据具体的情况,来调整具体的结果。 3. CRISPIE 框架: 能力和角色:您期望大模型扮演的角色洞察,提供幕后洞察力、背景信息和上下文。 声明:简洁明了地说明希望完成的任务。 个性:回应的风格、个性或者方式。 实验:提供多个回答的示例。 此外,在法律领域,对于律师写好 Prompt 有以下建议框架及格式: 第一种:CRISPE Capacity and Role(能力与角色):比如您希望它的角色是一名专注于民商事法律领域的律师,擅长案例研究、法律条文检索以及案件策略分析。 Insight(洞察):提供背景信息和上下文,比如处理一起复杂的合同纠纷案件,向 AI 提供案件的关键事实、相关法律以及案件涉及的背景。 Statement(陈述):直接明确期望 AI 完成的任务,比如要求 AI 总结此案件中双方的诉求、检索法条、预测可能的判决结果。 Personality(个性):您希望 AI 以什么风格或方式回答您。 Experiment(举例)
2025-03-25
java程序员,怎么吧AI结合到公司的业务上去,K12教育公司
对于 Java 程序员将 AI 结合到 K12 教育公司的业务中,以下是一些可能的方向和建议: 首先,可以考虑利用自然语言处理技术来改善学生与学习平台的交互体验。例如,开发智能客服,能够自动回答学生和家长常见的问题,提高服务效率。 其次,通过机器学习算法对学生的学习数据进行分析,从而实现个性化的学习推荐。比如根据学生的学习进度、成绩、学习习惯等因素,为他们推荐适合的课程、练习和学习资源。 另外,运用图像识别技术来辅助教学材料的制作和评估。例如,自动识别和批改学生的手写作业、试卷等。 还可以开发智能辅导系统,为学生提供实时的学习指导和答疑服务。 最后,利用语音识别和合成技术,打造有声读物、语音教学等功能,丰富教学形式。 但在将 AI 引入业务的过程中,需要注意数据的安全性和合法性,以及确保技术的可靠性和稳定性。同时,要充分考虑教育的特点和学生的需求,以实现有效的融合和应用。
2025-02-23
12个精选prompt框架
以下是 12 个精选的 prompt 框架: 1. ICIO 框架: 指令:执行的具体任务。 背景信息:提供执行任务的背景信息、上下文内容,让大模型更好地回答。 输入信息:大模型需要用到的一些信息。 输出信息:明确输出的具体信息的要求,比如字数、风格、格式。 2. BROKE 框架:通过 GPT 的设计提示,来提升整体反馈的效率。 背景:提供足够背景信息,让大模型可以理解问题的上下文。 角色设定:特定的角色,让 GPT 根据特定的角色能力的特点来形成响应。 目标:明确任务的目标,让大模型知道您想让它做什么。 结果定义:明确可以衡量的结果,让大模型清楚自己做的情况。 调整:根据具体的情况,来调整具体的结果。 3. CRISPIE 框架: 能力和角色:您期望大模型扮演的角色洞察,提供幕后洞察力、背景信息和上下文。 声明:简洁明了地说明希望完成的任务。 个性:回应的风格、个性或者方式。 实验:提供多个回答的示例。 4. 课件中的 Prompt 之术“三板斧”: 分配角色。 给出示例(fewshots)。 思维链(ChainofThought)。
2025-02-17
如果让你来给小学生设计一门人工智能视频课,12集,你会怎么设计
对于为小学生设计一门 12 集的人工智能视频课,以下是我的设计思路: 第一集:《走进神奇的 AI 世界》 介绍什么是人工智能,通过有趣的例子展示 AI 在日常生活中的应用,激发学生的兴趣。 第二集:《AI 的历史之旅》 讲述人工智能的发展历程,从早期的概念到现代的突破。 第三集:《AI 如何理解我们》 讲解 AI 是如何处理和理解人类输入的信息,如语言、图像等。 第四集:《智能机器人小伙伴》 介绍机器人如何通过 AI 技术实现各种功能和动作。 第五集:《AI 在游戏中的魔法》 展示 AI 在游戏中的应用,如游戏角色的智能行为。 第六集:《AI 与医疗保健》 讲述 AI 在医疗领域的作用,如疾病诊断、医疗影像分析等。 第七集:《AI 与交通出行》 介绍 AI 如何改善交通状况,如智能交通系统。 第八集:《AI 与教育的碰撞》 探讨 AI 在教育中的应用,如个性化学习、智能辅导。 第九集:《AI 绘画的奇妙世界》 让学生了解 AI 绘画的原理和创作过程。 第十集:《AI 音乐的旋律》 介绍 AI 在音乐创作和演奏方面的应用。 第十一集:《AI 的未来展望》 一起畅想未来 AI 可能带来的更多变化和创新。 第十二集:《我和 AI 的故事》 鼓励学生分享自己对 AI 的理解和想象,总结课程内容。 在每一集的设计中,都会采用生动有趣的动画、简单易懂的案例和互动环节,让小学生能够轻松理解和参与。
2025-02-14
在2025年2月12日这个时间点,我有哪些方式可以快速,稳定的使用 deepseek r1
在 2025 年 2 月 12 日,您可以通过以下方式快速、稳定地使用 DeepSeek R1: PPIO 派欧云(https://ppinfra.com/modelapi/product/llmapi?utm_medium=article&utm_source=WayToAGI):提供满血版全版本的 DeepSeekR1,输入价格为¥4/百万 tokens,输出价格为¥16/百万 tokens。有开发者福利,新注册立得 500 万 tokens(关注 PPIO 公众号回“deepseek”再领 1 亿),初创企业认证有 10 万算力补贴。产品服务特点为服务稳定性 99.9%,保持 0 故障,与 DeepSeek 官方同价,客户支持通道 10 分钟响应。 百度智能云:DeepSeekR1 限时免费,配额 1000RPM/10000TPM,无调用 tokens 上限。本模型将于 2025 年 2 月 19 日 00:00 起正式商用计费,输入价格 0.002 元/千 tokens,输出价格 0.008 元/千 tokens,有在线体验。 硅基流动:DeepSeekR1 输入价格为¥4/M Tokens,输出价格为¥16/M Tokens,有在线体验。2025 年 2 月 6 日起,未实名用户每日最多请求此模型 100 次。 此外,在 2 月 12 日,还有以下相关内容: 《》,来自社区伙伴 Hua 的投稿,手把手指导您在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 《》Anthropic 正式发布 Anthropic AI Economic Index,聚焦 AI 对经济的长期影响。该指数直观展现 AI 如何融入现代经济的各类实际任务,并从职业(occupation)和具体工作任务(task)两个维度,量化 AI 对劳动力市场的影响。 《》DeepSeekR1 的火爆现象背后,企业可以获得显著提升。其强化学习和联网搜索能力,改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。同时,DeepSeek 的开源策略打破了技术垄断,让国内大模型能力迅速提升。
2025-02-12
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
openai deep research使用技巧
OpenAI 的 Deep Research 功能能够整合多源信息,进行复杂的信息查询与分析,并生成专业水准的报告,同时详细展示思考和搜索过程。目前,该功能仅支持文本输出,未来还将增加嵌入式图片、数据可视化等功能。使用入口为在 ChatGPT 输入框中选择「Deep Research」模式,输入问题后即可开始体验。 在 OpenAI 推出「Deep Research」功能一天后,Hugging Face 的工程师迅速联合推出了免费开源的版本 Open Deep Research,能自主浏览网页、滚动页面、处理文件,以及基于数据进行计算。使用入口为前往 Demo 网站(opendeepresearch.vercel.app)体验。 Deep Research 让 AI 自动完成多步骤研究任务,快速分析海量信息并生成专业报告,具备自动化信息汇总、文献引用与多领域适用性,适合科研、工程、金融等行业。目前向 Pro 用户开放,未来将扩展至 Plus 和 Team 用户,并提供更强大的功能。 该智能体基于优化版 OpenAI o3 模型,结合网络浏览和 Python 分析能力,实现高效研究,适用于科学、政策、工程等高强度知识工作,也能帮助购物者做复杂决策。Pro 用户已可使用,后续将逐步向 Plus、Team 和企业用户开放。
2025-03-08
openai
OpenAI 相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4 Beta(一组改进 GPT3.5 的模型,可理解和生成自然语言或代码)、GPT3.5(一组改进 GPT3 的模型,可理解并生成自然语言或代码)、DALL·E Beta(可在给定自然语言提示的情况下生成和编辑图像的模型)、Whisper Beta(可将音频转换为文本的模型)、Embeddings(可将文本转换为数字形式的模型)、Codex Limited Beta(一组可理解和生成代码的模型,包括将自然语言转换为代码)、Moderation(可检测文本是否敏感或不安全的微调模型)、GPT3(一组可理解和生成自然语言的模型)。 通用人工智能(AGI)计划: 有网络上传播的关于 OpenAI 计划在 2027 年前实现通用人工智能(AGI)的计划的相关文档,内容为各种报道和推文的拼凑猜测。 文档提到 OpenAI 于 2022 年 8 月开始训练一个拥有 125 万亿参数的多模态模型,第一阶段被称为 Arrakis 或 Q,该模型于 2023 年 12 月完成训练,但因高昂推理成本发布被取消,原计划 2025 年发布的 GPT5 取消,Gobi(GPT4.5)被重新命名为 GPT5。 技术栈: 从 GPT、DALL·E 到 Sora,OpenAI 成功跑通了 AGI 的所有技术栈。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现、商业和技术趋势上分析了原因,并尝试预测了 OpenAI 下一步的进展。
2025-02-24
openai最近有什么新闻
以下是 OpenAI 最近的一些新闻: 1. 12 天连续直播相关结果,昨天 OpenAI 把 o1 模型在 API 中正式发布,之前发布的是 o1 Preview 历史版本,正式版思考花费的 token 少了 60%。 2. 北京时间 9 月 13 号凌晨 1 点多,OpenAI 宣布推出模型 o1preview 与 o1mini,拥有 Plus 版本的用户会陆续收到新模型权限,可在 Web 客户端中尝鲜体验。 3. OpenAI 更新风控与账号共享识别力度,可能会偷偷降低 ChatGPT 模型的调用规格,如 o1pro 降级为 o1。 4. 奥特曼谈 AI 推理能力进展,o1(2024 年 9 月)排名全球第 9800 名,o3(2024 年 12 月)提升至第 175 名,现内部模型已达全球第 50 名,预计今年内登顶第一。
2025-02-17
openai发展史
OpenAI 的发展历程如下: 2015 年成立,一直将 AGI 作为战略目标之一。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级,分别为: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 组织(Organizations):最高级别,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 AI 的起源最早可追溯到上世纪: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开著名的达特茅斯会议,人工智能(Artificial Intelligence)一词被正式提出,并作为一门学科确立下来。此后接近 70 年,AI 的发展起起落落。 Sam Altman 于 2025 年 1 月 6 日发表反思,回首创业历程,包括经历解雇等事件,也提到 2025 年首批 AI Agent 将融入劳动力市场,ChatGPT 两周岁时已迈入能进行复杂推理的全新模型时代,强调随着 AGI 临近,要回顾公司发展历程,继续探索。
2025-01-26
openai 的产品分析
OpenAI 的产品具有以下特点和发展情况: 去年 11 月发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT,其具有强大的功能,能提供各种回答和完成多种任务,但也存在捏造事实的问题。ChatGPT 被视为 GPT4 的台标。 OpenAI 内部对于是否发布功能强大的工具存在争论,发布被视为让公众适应 AI 改变日常生活现实的战略一部分。 OpenAI 目前严重受限于 GPU,这影响了其多项计划,包括 API 的可靠性和速度、更长上下文窗口的推广、微调 API 以及专用容量的提供。 Sam Altman 分享了 OpenAI 近期路线,如 2023 年的首要任务是更便宜、更快的 GPT4,以及实现更长的上下文窗口、扩展微调 API 和推出有状态的 API。 2024 年 10 月有相关的视频和文章对 OpenAI 进行分析和介绍新产品,如剖析其从理想主义走向商业化的历程,以及介绍了四款创新 AI 产品。
2025-01-11
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
我是一个实体店家,我怎么能利用AI产生内容进而帮助我在流量平台拓客
以下是一些利用 AI 为实体店在流量平台拓客的方法和思路: 1. 借助抖音平台:利用抖音对实体商家的流量扶持,购买 AI 抖音发广告的软件。这需要懂软件开发的技术人员,并且熟悉抖音。 2. 利用 AI 私域做客户培育/用户旅程:通过 AI 软件自动跟进和培育客户,需求是懂软件开发的技术人员且熟悉微信。 3. 打造特定领域的 AI 工具:比如针对法律、健康、财务、教育、销售、HR 等领域,开发如“AI 合同助手”“AI 健康管家”“AI 课程生成器”“AI 销售助理”等垂类工具。 4. 作为引流者:把 AI 工具做成“公众号插件”“小程序入口”或“微信机器人”进行推广,获取分成。 5. 参考优秀作品:如商业综合体 AI 伴侣、客流诊断师、跨境商品不求人、公私域全流程内容规划师、公众号 10W+爆文工厂、营销内容文案合规检查、提示词定制神器、Nicole 咖啡门店分析师、3C 软文文案撰写、网购评论助手、万能 AI 营销助手、贴心平替推荐精灵、产品一键生成一篇高质量的知乎种草文、One thing AI 目标达成教练、润物等,从中获取灵感和思路。
2025-04-15
如何识别网页内容
识别网页内容通常可以通过以下步骤实现: 1. 内容识别:使用智能算法分析网页的 HTML 结构,确定网页的主要内容区域。 2. 文本提取:在识别出内容区域后,提取这些区域的文本内容,包括从 HTML 标签中获取可见文本,同时忽略脚本、样式和其他无需翻译的代码。 3. 预处理:对提取出的文本进行处理,清除不必要的空格、特殊字符和格式信息,进行标准化。 4. 翻译调用:将预处理后的文本拼接到 Prompt 模板中请求相关模型的 API 进行翻译。 5. 结果整合:翻译完成后,将原文和译文对照整合回网页、字幕中,常见的展示形式有原文保持不变,译文以悬浮框、下划线注释或平行文本呈现。 6. 用户界面交互:用户可通过鼠标悬停、点击等操作控制翻译的显示与否,工具会根据用户操作实时显示或隐藏译文。 另外,在获取网页内容时,初版提示词实验中对大模型对话产品的外链解析能力依赖较大,但这种方式易受平台反爬机制制裁。转换思路,通过用户浏览器以浏览器插件形式本地提取网页内容是一种稳定且经济的解决方案。开发时,可拿着初版提示词询问 AI 来确定需要插件获取哪些网页元素。例如 SeeAct 能力可以在多种不同网站上识别网页上的各种元素,执行不同任务。
2025-04-15
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
mcp 的内容
MCP(模型上下文协议)是一种创新的开放协议,由 Anthropic 公司在 2024 年 11 月推出并开源。 其主要特点和功能包括: 统一了交互标准,是链接所有 AI 应用与工具的桥梁,兼容所有 AI 应用。 具有三大功能:工具(Tools),底层使用 Function call 实现,与 OpenAI 格式兼容;资源(Resources),为 AI 提供参考信息;提示词(Prompts),预设对话模板。 主要接口路径包括获取工具列表、调用工具、获取资源列表、读取资源内容、获取提示词列表、获取提示词内容等。 转换步骤包括客户端向 MCP 服务器请求工具列表,将 MCP 工具定义转换为 Function call 格式,发送 Function Call 定义给 LLM,接收 LLM 生成的 Function call,将 Function call 转为 MCP 工具调用,发送工具调用结果给 LLM。 MCP 就像一个“转接头”或“通用插座”,其核心作用是统一不同外部服务,通过标准化接口与 AI 模型对接。它与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 MCP 最早由 Anthropic 公司开发,目的是帮助 AI 模型(如 Claude)更容易地连接工具和数据源,现在已成为一个开放协议,被越来越多的企业和开发者采用,逐渐成为 AI 与工具互动的新标准。 官方文档:https://modelcontextprotocol.io/
2025-04-13
知识库中的LangChain和LangGraph的内容有哪些 ?
以下是关于 LangChain 和 LangGraph 的相关内容: LangChain: LangChain 是一个由 Harrison Chase 开发的开源 Python 库,旨在支持使用大型语言模型(LLM)和外部资源(如数据源或语言处理系统)开发应用程序。 它提供了标准的接口,与其他工具集成,并为常见应用程序提供端到端链。 设计主张集中在模块化组件上,这些组件提供用于使用 LLM 的行为抽象,并为每个抽象提供实现的集合,从而允许开发人员构造新链或实现现成的链。 LangChain 和 RAG 的关系: LangChain 是一个用于构建高级语言模型应用程序的框架,提供了实现 RAG 所必需的工具和组件。 RAG 即检索增强生成,是一种结合了检索(检索外部知识库中相关信息)和生成(利用 LLM 生成文本)的技术。 LangChain 作为框架,与 RAG 的关系包括:是框架与技术的关系,允许通过模块化组件构建 RAG 应用程序,简化开发过程,提高性能,支持构建复杂的 RAG 应用。 关于大模型 RAG 应用中的 LangChain: 有从产品视角出发的分享,包括项目背景、初步体验和评测结果等。 预计会分成 3 篇分享,分别是 LangChain 框架初体验、调优思路分享、如何测评。
2025-04-12