Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

openai发布会内容

Answer

以下是关于 OpenAI 发布会的相关内容:

  1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness
  2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
  3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wb-HzsJS-w
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「12月20日」✨✨✨✨✨✨✨✨1⃣️?OpenAI发布AI大模型风险防范框架文件:OpenAI董事会有权决定发布新AI模型。框架文件提出防范AI大模型灾难性风险的路线图。董事会可推翻领导团队关于AI模型发布的决策。?https://openai.com/safety/preparedness3⃣️?Google的VideoPoet视频模型:根据文本描述生成视频。多模态学习能力,包括音频和视频处理代码编写。视频风格化、修复、扩展以及音频生成功能。?https://x.com/xiaohuggg/status/1737371348467618039?s=204⃣️?HyFluid项目分析流体运动:从视频中分析水、烟等流体的移动状态。能预测流体未来的运动趋势。适用于复杂、难以捉摸的流体动态。?https://x.com/xiaohuggg/status/1737321380511891550?s=205⃣️?Runway发布文字转语音功能:用于生成视频的画外音和对话。支持多种语言的细腻真实人声效果。?https://x.com/xiaohuggg/status/1737124514969075791?s=206⃣️?微软与Suno合作引入AI音乐创作到Copilot:Suno可以从一句话生成完整的歌曲。包括歌词、乐器伴奏和歌声。通过Microsoft Edge体验Suno的音乐创作。?https://x.com/xiaohuggg/status/1737305135670546861?s=207⃣️?Amphion开源工具包:提供语音、声音和歌唱功能。支持声音转换、歌声合成、文本到音频等。HuggingFace上的演示可用。?https://huggingface.co/amphion?https://x.com/xiaohuggg/status/1737299090848018565?s=20

宝玉 日报

?宝玉日报「12月12日」✨✨✨✨✨✨✨✨?OpenAI连续12天AI发布会:第五天完整视频(中英文双语字幕)亮点功能:苹果设备深度集成ChatGPT,可通过Siri实现文档总结、任务分配、节日创意等操作。多平台无缝衔接:支持iPhone、iPad和Mac,涵盖Siri集成、写作工具增强、视觉智能分析等多种应用场景。实用场景:圣诞派对策划、PDF总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。?[https://x.com/dotey/status/1866974269051113543](https://x.com/dotey/status/1866974269051113543)

OpenAI将在11月6日举办首次开发者大会

引用来源:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wb-HzsJS-wOpenAI将在11月6日的首次开发者大会上发布重要更新,其目标是让开发者能够更快捷和廉价地开发基于大模型的应用。而此次更新最让人期待的部分是:“OpenAI将推出Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。”“The updates include the addition of memory storage to its developer tools for using AI models.This could theoretically slash costs for application makers by as much as 20-times,addressing a major concern for partners whose cost of using OpenAI’s powerful models could pile up quickly,as they try to build sustainable businesses by developing and selling AI software.”在AI Agents逐渐流行的今天,如果该消息属实,其无异于向大模型市场投入一枚重磅炸弹,并将进一步推进大模型的“Commodity”化。Stateful API并非新的概念,但“Stateful API”将如何将GPT打成“地板价”?Stateful API实际上早在5月的一次采访上,Altman就首次透露了有关Stateful API的信息,并表示将在年内发布该功能(图1)。图1 OpenAI产品路线图依据该信息:“In the future,there will be a version of API that remembers the conversation history”,我们推测Stateful API的实现方式如下:首先,GPT的API将从Stateless变为Stateful。当前,开发者必须将应用中的历史记录通过Stateless API传给大模型,以便大模型依据历史上下文进行内容生成(图2)。当应用运行一段时间后,其历史记录通常会填满Context Window,并推高API调用成本。图2:Stateless OpenAI API

Others are asking
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
openai deep research使用技巧
OpenAI 的 Deep Research 功能能够整合多源信息,进行复杂的信息查询与分析,并生成专业水准的报告,同时详细展示思考和搜索过程。目前,该功能仅支持文本输出,未来还将增加嵌入式图片、数据可视化等功能。使用入口为在 ChatGPT 输入框中选择「Deep Research」模式,输入问题后即可开始体验。 在 OpenAI 推出「Deep Research」功能一天后,Hugging Face 的工程师迅速联合推出了免费开源的版本 Open Deep Research,能自主浏览网页、滚动页面、处理文件,以及基于数据进行计算。使用入口为前往 Demo 网站(opendeepresearch.vercel.app)体验。 Deep Research 让 AI 自动完成多步骤研究任务,快速分析海量信息并生成专业报告,具备自动化信息汇总、文献引用与多领域适用性,适合科研、工程、金融等行业。目前向 Pro 用户开放,未来将扩展至 Plus 和 Team 用户,并提供更强大的功能。 该智能体基于优化版 OpenAI o3 模型,结合网络浏览和 Python 分析能力,实现高效研究,适用于科学、政策、工程等高强度知识工作,也能帮助购物者做复杂决策。Pro 用户已可使用,后续将逐步向 Plus、Team 和企业用户开放。
2025-03-08
openai
OpenAI 相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4 Beta(一组改进 GPT3.5 的模型,可理解和生成自然语言或代码)、GPT3.5(一组改进 GPT3 的模型,可理解并生成自然语言或代码)、DALL·E Beta(可在给定自然语言提示的情况下生成和编辑图像的模型)、Whisper Beta(可将音频转换为文本的模型)、Embeddings(可将文本转换为数字形式的模型)、Codex Limited Beta(一组可理解和生成代码的模型,包括将自然语言转换为代码)、Moderation(可检测文本是否敏感或不安全的微调模型)、GPT3(一组可理解和生成自然语言的模型)。 通用人工智能(AGI)计划: 有网络上传播的关于 OpenAI 计划在 2027 年前实现通用人工智能(AGI)的计划的相关文档,内容为各种报道和推文的拼凑猜测。 文档提到 OpenAI 于 2022 年 8 月开始训练一个拥有 125 万亿参数的多模态模型,第一阶段被称为 Arrakis 或 Q,该模型于 2023 年 12 月完成训练,但因高昂推理成本发布被取消,原计划 2025 年发布的 GPT5 取消,Gobi(GPT4.5)被重新命名为 GPT5。 技术栈: 从 GPT、DALL·E 到 Sora,OpenAI 成功跑通了 AGI 的所有技术栈。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现、商业和技术趋势上分析了原因,并尝试预测了 OpenAI 下一步的进展。
2025-02-24
openai最近有什么新闻
以下是 OpenAI 最近的一些新闻: 1. 12 天连续直播相关结果,昨天 OpenAI 把 o1 模型在 API 中正式发布,之前发布的是 o1 Preview 历史版本,正式版思考花费的 token 少了 60%。 2. 北京时间 9 月 13 号凌晨 1 点多,OpenAI 宣布推出模型 o1preview 与 o1mini,拥有 Plus 版本的用户会陆续收到新模型权限,可在 Web 客户端中尝鲜体验。 3. OpenAI 更新风控与账号共享识别力度,可能会偷偷降低 ChatGPT 模型的调用规格,如 o1pro 降级为 o1。 4. 奥特曼谈 AI 推理能力进展,o1(2024 年 9 月)排名全球第 9800 名,o3(2024 年 12 月)提升至第 175 名,现内部模型已达全球第 50 名,预计今年内登顶第一。
2025-02-17
openai发展史
OpenAI 的发展历程如下: 2015 年成立,一直将 AGI 作为战略目标之一。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级,分别为: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 组织(Organizations):最高级别,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 AI 的起源最早可追溯到上世纪: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开著名的达特茅斯会议,人工智能(Artificial Intelligence)一词被正式提出,并作为一门学科确立下来。此后接近 70 年,AI 的发展起起落落。 Sam Altman 于 2025 年 1 月 6 日发表反思,回首创业历程,包括经历解雇等事件,也提到 2025 年首批 AI Agent 将融入劳动力市场,ChatGPT 两周岁时已迈入能进行复杂推理的全新模型时代,强调随着 AGI 临近,要回顾公司发展历程,继续探索。
2025-01-26
openai 的产品分析
OpenAI 的产品具有以下特点和发展情况: 去年 11 月发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT,其具有强大的功能,能提供各种回答和完成多种任务,但也存在捏造事实的问题。ChatGPT 被视为 GPT4 的台标。 OpenAI 内部对于是否发布功能强大的工具存在争论,发布被视为让公众适应 AI 改变日常生活现实的战略一部分。 OpenAI 目前严重受限于 GPU,这影响了其多项计划,包括 API 的可靠性和速度、更长上下文窗口的推广、微调 API 以及专用容量的提供。 Sam Altman 分享了 OpenAI 近期路线,如 2023 年的首要任务是更便宜、更快的 GPT4,以及实现更长的上下文窗口、扩展微调 API 和推出有状态的 API。 2024 年 10 月有相关的视频和文章对 OpenAI 进行分析和介绍新产品,如剖析其从理想主义走向商业化的历程,以及介绍了四款创新 AI 产品。
2025-01-11
grok3 发布会亮点内容
Grok 3 发布会的亮点内容包括: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。 5. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容准确,并公开执行搜索步骤。 6. 可以调用 Big Brain 功能加强计算来解决问题。 7. 现场演示中,Grok 3 可以生成游戏设计方案。 8. Grok 3 语音模式在大约一周内推出。 9. Grok 3 API 几周后推出。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3。
2025-02-19
OpenAI过去12天的发布会总结
以下是 OpenAI 过去 12 天发布会的总结: 自媒体记录方面: 夕小瑶科技说:o3 发布,可能影响码农工作。 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。 MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。 南瓜博士:使用 o3 钱包和脑子可能不够。 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。 具体发布内容: Day12:o3 与 o3 mini 正式亮相。 Day11:ChatGPT 桌面应用,Option+空格快速唤起。 Day10:OpenAI 发布电话倾诉功能 18002428478。 Day9:o1 满血版 API 和 4o 实时语音 API 更新。 Day8:AI 搜索功能免费开放,并支持实时语音搜索。 Day7:ChatGPT 全新“项目”功能发布。 Day6:实时视频通话&圣诞老人模式正式上线。 Day5:ChatGPT 与 Apple 的深度合作。 Day4:直播“翻车”的 Canvas。 Day3:Sora 终于上线,有案例和功能详解。 Day2:微调 O1 模型,低成本高效率。 Day1:强化学习微调的实操案例。 宝玉日报 12 月 18 日: AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。 OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
2024-12-31
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
我是一个实体店家,我怎么能利用AI产生内容进而帮助我在流量平台拓客
以下是一些利用 AI 为实体店在流量平台拓客的方法和思路: 1. 借助抖音平台:利用抖音对实体商家的流量扶持,购买 AI 抖音发广告的软件。这需要懂软件开发的技术人员,并且熟悉抖音。 2. 利用 AI 私域做客户培育/用户旅程:通过 AI 软件自动跟进和培育客户,需求是懂软件开发的技术人员且熟悉微信。 3. 打造特定领域的 AI 工具:比如针对法律、健康、财务、教育、销售、HR 等领域,开发如“AI 合同助手”“AI 健康管家”“AI 课程生成器”“AI 销售助理”等垂类工具。 4. 作为引流者:把 AI 工具做成“公众号插件”“小程序入口”或“微信机器人”进行推广,获取分成。 5. 参考优秀作品:如商业综合体 AI 伴侣、客流诊断师、跨境商品不求人、公私域全流程内容规划师、公众号 10W+爆文工厂、营销内容文案合规检查、提示词定制神器、Nicole 咖啡门店分析师、3C 软文文案撰写、网购评论助手、万能 AI 营销助手、贴心平替推荐精灵、产品一键生成一篇高质量的知乎种草文、One thing AI 目标达成教练、润物等,从中获取灵感和思路。
2025-04-15
如何识别网页内容
识别网页内容通常可以通过以下步骤实现: 1. 内容识别:使用智能算法分析网页的 HTML 结构,确定网页的主要内容区域。 2. 文本提取:在识别出内容区域后,提取这些区域的文本内容,包括从 HTML 标签中获取可见文本,同时忽略脚本、样式和其他无需翻译的代码。 3. 预处理:对提取出的文本进行处理,清除不必要的空格、特殊字符和格式信息,进行标准化。 4. 翻译调用:将预处理后的文本拼接到 Prompt 模板中请求相关模型的 API 进行翻译。 5. 结果整合:翻译完成后,将原文和译文对照整合回网页、字幕中,常见的展示形式有原文保持不变,译文以悬浮框、下划线注释或平行文本呈现。 6. 用户界面交互:用户可通过鼠标悬停、点击等操作控制翻译的显示与否,工具会根据用户操作实时显示或隐藏译文。 另外,在获取网页内容时,初版提示词实验中对大模型对话产品的外链解析能力依赖较大,但这种方式易受平台反爬机制制裁。转换思路,通过用户浏览器以浏览器插件形式本地提取网页内容是一种稳定且经济的解决方案。开发时,可拿着初版提示词询问 AI 来确定需要插件获取哪些网页元素。例如 SeeAct 能力可以在多种不同网站上识别网页上的各种元素,执行不同任务。
2025-04-15
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
mcp 的内容
MCP(模型上下文协议)是一种创新的开放协议,由 Anthropic 公司在 2024 年 11 月推出并开源。 其主要特点和功能包括: 统一了交互标准,是链接所有 AI 应用与工具的桥梁,兼容所有 AI 应用。 具有三大功能:工具(Tools),底层使用 Function call 实现,与 OpenAI 格式兼容;资源(Resources),为 AI 提供参考信息;提示词(Prompts),预设对话模板。 主要接口路径包括获取工具列表、调用工具、获取资源列表、读取资源内容、获取提示词列表、获取提示词内容等。 转换步骤包括客户端向 MCP 服务器请求工具列表,将 MCP 工具定义转换为 Function call 格式,发送 Function Call 定义给 LLM,接收 LLM 生成的 Function call,将 Function call 转为 MCP 工具调用,发送工具调用结果给 LLM。 MCP 就像一个“转接头”或“通用插座”,其核心作用是统一不同外部服务,通过标准化接口与 AI 模型对接。它与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 MCP 最早由 Anthropic 公司开发,目的是帮助 AI 模型(如 Claude)更容易地连接工具和数据源,现在已成为一个开放协议,被越来越多的企业和开发者采用,逐渐成为 AI 与工具互动的新标准。 官方文档:https://modelcontextprotocol.io/
2025-04-13
知识库中的LangChain和LangGraph的内容有哪些 ?
以下是关于 LangChain 和 LangGraph 的相关内容: LangChain: LangChain 是一个由 Harrison Chase 开发的开源 Python 库,旨在支持使用大型语言模型(LLM)和外部资源(如数据源或语言处理系统)开发应用程序。 它提供了标准的接口,与其他工具集成,并为常见应用程序提供端到端链。 设计主张集中在模块化组件上,这些组件提供用于使用 LLM 的行为抽象,并为每个抽象提供实现的集合,从而允许开发人员构造新链或实现现成的链。 LangChain 和 RAG 的关系: LangChain 是一个用于构建高级语言模型应用程序的框架,提供了实现 RAG 所必需的工具和组件。 RAG 即检索增强生成,是一种结合了检索(检索外部知识库中相关信息)和生成(利用 LLM 生成文本)的技术。 LangChain 作为框架,与 RAG 的关系包括:是框架与技术的关系,允许通过模块化组件构建 RAG 应用程序,简化开发过程,提高性能,支持构建复杂的 RAG 应用。 关于大模型 RAG 应用中的 LangChain: 有从产品视角出发的分享,包括项目背景、初步体验和评测结果等。 预计会分成 3 篇分享,分别是 LangChain 框架初体验、调优思路分享、如何测评。
2025-04-12