Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎么用chatgpt搜索外部

Answer

使用 ChatGPT 搜索外部信息的方法如下:

  1. 可以像 Andrej Karpathy 所做的那样,向 ChatGPT 提出收集特定信息并整理成表格的请求,例如有关规模人工智能及其创始轮次的信息。ChatGPT 会理解请求,并通过特殊方式发出搜索指令,类似于人类使用浏览器搜索。然后接受该查询并转到 Bing 搜索,查找结果,将文本返回给语言模型,让其基于那段文本生成响应。
  2. 对于程序开发人员,可利用基于嵌入的搜索实现高效的知识检索。这需要以下步骤:
    • 选择文本嵌入工具,如 Word2Vec、BERT、FastText 等,将文本转化为向量。
    • 构建包含详细信息的数据库,如电影数据库,可以是简单的文本文件或复杂的数据库系统。
    • 对数据库中的信息进行预处理和嵌入,得到向量表示并存储。
    • 当用户提出查询时,将查询进行文本嵌入得到查询向量。
    • 使用快速的向量搜索算法(如余弦相似度、KNN 搜索等)在数据库中找到最接近的向量。
    • 根据找到的向量从数据库中检索相关信息并返回给用户。
    • 还可以将上述步骤封装成 API 或函数,在 ChatGPT 的对话逻辑中调用,当用户提出相关查询时,ChatGPT 调用并返回相关信息。但实际实现可能涉及更多细节和技术挑战。
Content generated by AI large model, please carefully verify (powered by aily)

References

文章:Andrej Karpathy 亲授:大语言模型入门

[title]文章:Andrej Karpathy亲授:大语言模型入门[heading1]第二部分:LLM的未来现在,我想讨论一下这些语言模型的一些特性以及它们是如何随着时间的推移而演变的。我不打算使用抽象的术语,而是通过一个具体的例子来说明,这是一个我们可以逐步完成的任务。我使用了ChatGPT,并提出了以下查询:我请求它收集有关规模人工智能及其创始轮次的信息,包括发生的时间、日期、金额和估值,并将其整理成一个表格。ChatGPT理解了我的请求,因为我们在微调阶段使用了大量数据进行了教学。在这种类型的查询中,它并不是直接作为语言模型来回答问题,而是使用帮助其执行任务的工具。在这种情况下,一个合理的工具是浏览器。所以,如果你和我面临同样的问题,你可能会去搜索,对吧?这正是ChatGPT所做的。它有一种发出特殊单词的方式,我们可以看到它试图执行搜索。在这种情况下,我们可以接受该查询并转到Bing搜索,查找结果,就像你我可能浏览搜索结果一样,我们可以将该文本返回给语言模型,然后让它基于那段文本生成响应。因此,它的工作方式与您和我使用浏览器进行研究的方式非常相似,它将信息组织起来,并以这种方式做出响应。所以它收集了信息,我们得到了一个表格,表中有A、B、C、D和E系列,有日期、筹集的金额以及该系列中的隐含估值。然后它提供了引用链接,您可以在其中验证此信息是否正确。在底部,它表示,实际上,它无法找到A轮和B轮的估值,它只找到了筹集的金额。所以你会看到表中有一个“不可用”的标记。

熊猫Jay:万字解读ChatGPT提示词最佳实践

[title]熊猫Jay:万字解读ChatGPT提示词最佳实践[heading2]最佳实践5 -使用外部工具[heading3]策略1:利用基于嵌入的搜索实现高效的知识检索适用人群:程序开发人员难度:????当谈论模型利用外部信息源时,就像是给它提供更多的信息来帮助它做出更准确、有根据的回答。你可以想象你在跟一个很聪明的朋友聊天,有时候你会告诉他一些背景信息,这样他就能更好地回答你的问题。这种外部信息可以通过一种叫做“文本嵌入”的方式被加入到模型中。文本嵌入就像是把文本转换成特殊的向量,这个向量可以展示不同文本之间的关系。如果两段文本很相似或者相关,它们对应的向量就会比较接近。有些聪明的计算方法可以快速地找出相似向量,这就使得我们可以有效地找到相关的信息。想象一下,我们有很多关于电影的文本,每个文本都可以被转换成一个向量并存储起来。当用户问一个关于电影的问题时,我们可以把这个问题也转换成一个向量,然后在向量空间中搜索最接近这个向量的文本向量,找到最相关的文本块,然后从中获取信息来回答用户的问题。简单来说,就是模型可以借助外部信息来更好地回答问题,而文本嵌入是一种帮助我们在海量文本中迅速找到相关信息的聪明方法。这样一来,我们就能让模型变得更聪明,能够根据背景信息做出更准确的回应了。

熊猫Jay:万字解读ChatGPT提示词最佳实践

[title]熊猫Jay:万字解读ChatGPT提示词最佳实践[heading2]最佳实践5 -使用外部工具[heading3]策略1:利用基于嵌入的搜索实现高效的知识检索[heading4]解读1.文本嵌入工具:首先,您需要一个能够将文本转化为向量的工具,例如Word2Vec、BERT、FastText等。这些工具可以将文本转化为高维空间中的向量。2.构建电影数据库:您需要一个包含各种电影详细信息的数据库。这个数据库可以是一个简单的文本文件,每行包含一个电影的信息,或者是一个更复杂的数据库系统。3.预处理和嵌入:将数据库中的每部电影的信息进行文本嵌入,得到每部电影的向量表示,并存储这些向量。4.查询处理:当用户提出查询时,例如“由莱昂纳多·迪卡普里奥主演的电影”,您需要将这个查询进行文本嵌入,得到一个查询向量。5.向量搜索:使用某种快速的向量搜索算法(例如余弦相似度、KNN搜索等)在电影数据库中找到与查询向量最接近的电影向量。6.返回结果:根据找到的最接近的电影向量,从数据库中检索相关的电影信息,并返回给用户。7.集成到ChatGPT:您可以将上述步骤封装成一个API或函数,并在ChatGPT的对话逻辑中调用它,以便当用户提出相关查询时,ChatGPT可以调用这个API或函数并返回相关的电影信息。这只是一个高级的概述,实际实现可能会涉及更多的细节和技术挑战。但基本的思路是将文本嵌入技术与向量搜索结合起来,以实现高效的知识检索。

Others are asking
chatGPT
ChatGPT 是一种由 OpenAI 开发的基于 GPT(生成式预训练变换器)架构的人工智能模型。 它的工作原理是:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。特别是能够从“提示”开始,继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”。 其具体工程相当引人入胜,最终(至少在它可以使用外部工具之前),ChatGPT 仅仅从它积累的“传统智慧统计数据”中提取了一些“连贯的文本线索”。 ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,你可以用它构建自己的应用来做很多事情,比如起草邮件、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮游戏或其他内容的角色等。 目前 ChatGPT 官网有两个版本,分别是 GPT3.5 和 GPT4。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度不如 GPT4 高,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店和高级数据分析等插件。想要使用更多功能更智能的 GPT4 需要升级到 PLUS 套餐,收费标准是 20 美金一个月,当然 GPT4 还有团队版和企业版,功能更多、限制更少,但费用也更贵,一般推荐使用 PLUS 套餐。 在注册 ChatGPT 账号之前,建议先注册一个谷歌账号,因为国外很多软件支持谷歌账号一键登录,注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。
2025-04-12
随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展,人工智能正在加速渗透各行业应用场景,包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析,并提出 AI 技术可以在连锁奶茶店如何应用的设想。
以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想: 影响分析: 1. 提升运营效率:通过自动化流程和智能预测,优化库存管理、员工排班等环节。 2. 改善客户体验:利用智能客服快速响应顾客咨询,提供个性化推荐。 3. 精准营销:基于大数据分析顾客偏好,制定更有针对性的营销策略。 应用设想: 1. 智能点单系统:根据顾客的历史订单和偏好,为其推荐饮品和搭配。 2. 库存管理优化:借助 AI 预测销售趋势,精准控制原材料库存。 3. 员工培训辅助:利用虚拟培训工具,提升员工的服务技能和产品知识。 4. 营销决策支持:通过数据分析,确定最佳的促销活动和推广渠道。 目前的知识库中,相关的具体研究报告主要有: 1. 浙江大学:《DeepSeek 技术溯源及前沿探索朱强》(2025/03/19),介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化,以及大模型的发展,如 GPT 系列。 2. 浙江大学:《DeepSeek:回望 AI 三大主义与加强通识教育报告》(2025/03/05),围绕人工智能展开,介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学:《气象人工智能技术与应用报告》(2024/12/25),围绕气象人工智能展开,介绍了其发展和应用情况。 如需下载这些研究报告,可。
2025-04-09
chatgpt作图后,显示已经完成,但是无法显示
以下是为您整合的相关内容: GPT4 在通用人工智能的工具使用方面表现出色,能够完成几乎所有任务,包括结合多个工具管理用户的日历和电子邮件。但它也存在一些弱点,如缺乏当前世界知识、难以进行符号操作等,不过能通过使用搜索引擎或 API 等外部工具来克服部分限制。相比之下,ChatGPT 在完成同样任务时存在较多不足。 Andrej Karpathy 亲授的大语言模型入门中提到,ChatGPT 在数学方面不擅长,会使用计算器和工具来完成相关任务,如计算估值、绘制图表、添加趋势线和进行分析等。
2025-03-31
如何才能使用上chatgpt 4o
以下是在安卓系统上使用 ChatGPT 4o 的详细步骤: 1. 安装 Google Play: 到小米自带的应用商店搜索 Google Play 进行安装。 安装好后,打开 Google Play,按照提示一步步操作,登录 Google Play。 2. 下载安装 ChatGPT: 到谷歌商店搜索“ChatGPT”进行下载安装,开发者是 OpenAI,别下错了。 可能会遇到“google play 未在您所在的地区提供此应用”的问题。经过测试,可在 google play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料。如果账号没有地区,可以“添加信用卡或借记卡”,国内的双币信用卡就行,填写信息时地区记得选美。如果回到 google play 首页还搜不到 chatgpt,可以卸载重装 google play,操作过程保持梯子的 IP 一直是美,多试几次。 3. 体验 ChatGPT: 如果只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡。 然后在 ChatGPT 里订阅 Plus。 使用 ChatGPT 4o: 1. 开启对话:打开 ChatGPT 应用或网页,点击开始对话。会员不管是在苹果还是安卓手机上购买的,电脑上都能登录。 2. 体验最新语音对话功能:版本切到 ChatGPT 4o,点击右下角“耳机?”图标,选择一个声音,就可以体验流畅的语音对话。 以上就是注册、安装和订阅 ChatGPT 4o 的详细步骤。希望能帮助您快速上手,充分利用这款强大的人工智能工具,提升工作和生活效率。关注微信公众号:JessieZTalk,在 AIGC 的路上共同进步!
2025-03-31
chatgpt4.5的使用方法
以下是关于 ChatGPT 4.5 的使用方法: 1. 目前 ChatGPT 官网有 GPT3.5、GPT4 和 ChatGPT 4.5 三个版本。ChatGPT 4.5 发布后引起关注,其可以免费体验,但免费体验次数有限。 2. GPT3.5 为免费版本,拥有账号即可使用,但智能程度不如 ChatGPT 4.5,且无法使用 DALL.E3 等功能和插件。 3. ChatGPT 4.5 的知识更新到 2023 年 10 月,而 ChatGPT 4 更新到 2023 年 12 月。 4. 若想使用更多功能更智能的 ChatGPT 4.5,需要升级到 PLUS 套餐,收费标准为 20 美金一个月。GPT4 还有团队版企业版,但费用更贵,一般推荐使用 PLUS 套餐。 5. 关于注册、安装和订阅的详细步骤,您可以参考相关文章,如作者为 JessieZTalk 的亲测文章(原文链接:https://mp.weixin.qq.com/s/tzCVGrwgeG6Bss83Xmep0g )。
2025-03-28
deepseek与chatgpt的区别
DeepSeek 与 ChatGPT 存在以下区别: 1. 在 App Store 排名方面,DeepSeek R1 冲到了美国区 App Store 第一名,超越了 ChatGPT。 2. 口碑与技术实力方面,DeepSeek 没有市场部,也没有做任何市场投放,完全依靠技术实力和口碑赢得用户认可。 3. 技术特点上,DeepSeek R1 效果比肩顶尖闭源模型 o1,但价格仅为 o1 的 27 分之一,且开源让行业认知整体拉齐,得到全世界尊重和喜爱。 4. 创新模型 R1 Zero 方面,跳过了监督微调进行训练,且发现模型的思考能力可以自我涌现,具有革命性。 5. 影响方面,DeepSeek R1 的发布引发美国科技界恐慌,Meta 内部对其出色表现感到震惊,其低成本和高性能使得英伟达市场地位受到挑战,导致股价下跌、市值蒸发。 6. 对于未来展望,开源模型的进步将超越闭源模型,顶级模型推理价格急速下降,技术更加普惠平权,AI 编程效率提升、门槛降低,创作能力不断提升,催生更多可消费内容形式。 此外,ChatGPT 采用人们熟悉的聊天框,形成单线程任务,而 flowith 跳出单一聊天框,用画布和节点构建多线程思维流,更适用于深度内容生成,其由资料库、创作画布、内容编辑三部分组成,优势在于可自由调用不同 AI 模型处理不同任务,涵盖文字和图片生成,任务能有机组合形成同频任务流。
2025-03-27
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
DeepSeek,里面搜索怎么能出来图片?
要在 DeepSeek 中搜索出图片,您可以参考以下信息: 在即梦 AI 平台上找到 DeepSeek 入口,简单描述您想要的画面,DeepSeek 会生成详细的提示词,将提示词复制到生图功能的输入框,选择 3.0 模型,点击生成。 DeepSeek 使用平台包括 DeepSeek 官网、API(V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号)。Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 将下载的 html 文件及图片放到同一个文件夹,让 Cursor 进行图片增加即可。 此外,DeepSeek 深夜发布了大一统模型 JanusPro,将图像理解和生成统一在一个模型中。其具有统一 Transformer 架构,提供 1B 和 7B 两种规模,全面开源,支持商用,MIT 协议,部署使用便捷,Benchmark 表现优异等特点。模型地址: 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 下载地址:https://github.com/deepseekai/Janus
2025-04-09
ai搜索引擎哪个好
以下是一些推荐的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,允许用自然语言提问,通过生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰有理的答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持图像、语音等多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 做好 AI 搜索引擎的关键在于: 1. 准确度:取决于问答底座模型的智能程度和挂载上下文的信息密度。要选用智能的问答底座模型,并对 RAG 的检索结果进行排序去重以保证信息密度。 2. 差异化创新:错位竞争,如对问答结果以 outline/timeline 等形式输出,支持多模态搜索问答,允许挂载自定义信息源等策略。 3. 具备“准/快/稳”的特点:回复结果要准,响应速度要快,服务稳定性要高。 在使用 AI 搜索引擎时需注意: 1. 幻觉风险较高,大多数 AI 搜索引擎未连接到互联网。 2. 必应通常是较好的选择,特别是在某些特定场景下,如技术支持、决定吃饭地点或获取建议等,必应可能比谷歌更好。但这是一个迅速发展的领域,使用时应小心。对于儿童,可汗学院的 Khanmigo 提供由 GPT4 驱动的良好的人工智能驱动辅导。
2025-04-09
我们是搜索团队的产品经理,团队定位倾向于“对于插件的建设与调用”定位,现在要做AI相关的产品规划,请以通俗易懂的方式对以下问题做出回答 1、请通过流程图的方式,介绍【插件/工具】能力在大模型生态架构中的环节、定位、实现流程是什么 2、调研下对于我们搜索团队而言,插件应该做什么,可以做什么 3、思考对于大模型来说,有哪些(通用或垂类)的模块/功能/插件是无法绕开的,或高频使用的,作为我们团队后续争取的发力点(如搜索推荐对于传统综合搜索结果页)
以下是为您提供的关于 AI 相关产品规划的回答: 一、插件/工具能力在大模型生态架构中的环节、定位、实现流程 从 2023 年 3 月份 OpenAI 宣布插件计划开始,到 5 月份上线,其中包括联网、代码、画图三个插件。其实现流程大致为: 1. 经过对模型的微调,检测何时需要调用函数(取决于用户的输入)。 2. 使用符合函数签名的 JSON 进行响应。 3. 在接口层面声明可调用的工具。 4. 使用函数和用户输入调用模型。 5. 使用模型响应调用 API。 6. 将响应发送回模型进行汇总。 二、对于搜索团队,插件可以做和应该做的事 目前没有直接针对搜索团队插件具体可做和应做事项的明确内容,但可以参考 OpenAI 的插件计划,例如开发与搜索相关的特定功能插件,或者探索如何将现有的搜索推荐功能与大模型更好地结合。 三、对于大模型无法绕开或高频使用的模块/功能/插件 目前没有直接指出对于大模型无法绕开或高频使用的具体模块、功能或插件。但从相关信息中可以推测,例如与数据获取和处理相关的插件(如联网)、与技术开发相关的插件(如代码)以及与内容生成相关的插件(如画图)可能是较为重要和高频使用的。对于搜索团队来说,可以考虑在这些方向上寻找发力点,结合搜索推荐等传统功能,开发出更具竞争力的插件。
2025-04-08
小白不懂MCP,请搜索waytoAGI中与智能体相关的内容(特别是视频形式的)让我来学习
以下是为您整理的关于 MCP 的相关内容: 一、什么是 MCP MCP(Model Context Protocol)是一种通用的方式,向各类大语言模型提供数据源和工具。它是一个开放协议,用于标准化应用程序向大语言模型提供上下文的方式。可以将 MCP 想象成 AI 应用程序的 USBC 接口,为 AI 模型连接不同的数据源和工具提供了标准化方式。 二、相关文章的写作目的和探讨内容 1. 作者因在 WaytoAGI 社区阅读了他人优秀文章,决定逼自己做输出,对自我学习进行总结。 2. 文章从作者自身疑问出发,通过动手实践的方式探索:利用自然语言交互,大模型为什么会调用 MCP 工具;大模型调用 MCP 工具,从客户端到服务端发生了什么;安装了类似 MCP 工具,大模型如何选择用哪一个。 三、MCP 和 AI 工具的未来 自 OpenAI 发布函数调用以来,思考解锁智能体和工具使用生态系统所需条件。MCP 于 2024 年 11 月推出,在开发者和 AI 社区中已获广泛关注,被视为潜在解决方案。探讨了其如何改变 AI 与工具的交互方式、开发人员的使用情况及仍需解决的挑战。 四、MCP 小白图文使用教程 MCP 服务器有三大核心功能: 1. 资源:是服务器提供给 AI 的数据内容,如文件、数据库结构或特定信息,每个资源通过唯一 URI 标识。 2. 工具:允许 AI 模型执行特定操作,如查询数据库、调用 API 或执行计算,每个工具由名称和描述其模式的元数据唯一标识。 3. 提示:提供结构化消息和指令,用于与语言模型交互,客户端可以发现可用提示、检索其内容并提供参数进行自定义。 希望以上内容对您有所帮助。
2025-04-08
如何搜索知识库
以下是关于知识库搜索的相关信息: 知识库搜索网址:https://search.atomecho.cn/ Coze 中工作流配置知识库: 添加知识库:可同时添加多个知识库。 参数设置: 搜索策略:包括语义检索(像人类一样理解词与词、句与句之间的关系,适用于需要理解语义关联度和跨语言查询的场景)、全文检索(基于关键词进行,适用于特定名称、专有名词、术语、缩写词、ID 等场景)、混合检索(结合全文检索和语义检索的优势,并对结果进行综合排序召回相关内容片段)。 最大召回数量:选择从检索结果中返回给大模型使用的内容片段数量,数值越大,返回的越多。 最小匹配度:根据设置的匹配度选取要返回给大模型的内容片段,低于设定匹配度的内容不会被返回。 提示:最大召回数量和最小匹配度直接影响输出效果,需进行协调的多轮测试找出最优值。 认识大模型 Embedding 技术加实战中: Embedding 增强 GPT 的能力的过程包括搜索内部知识库检索相关文本、将检索到的文本内容部分发送给 GPT 大模型并向其提出问题。 具体操作步骤: 准备搜索数据(仅一次):搜集数据、切块、嵌入、存储(对于大型数据集的 Embedding 结果,可使用向量数据库保存)。 搜索(每次查询一次):给定用户问题,从 OpenAI API 生成查询的 embeddings,使用 embeddings 按照与查询相关性对文本部分进行排序,距离函数推荐使用余弦相似性。 提问(每次查询一次):将问题和最相关的部分插入到发送给 GPT 的消息中返回 GPT 的答案。 Embedding 的作用:搜索(结果按与查询字符串的相关性进行排名)、聚类(文本字符串按相似性分组)、建议(建议包含相关文本字符串的项目)、异常检测(识别出相关性很小的离群值)、多样性测量(分析相似性分布)、分类(文本字符串按其最相似的标签分类)。
2025-04-08
当前AI应用的内外部环境及趋势
当前 AI 应用的内外部环境及趋势如下: 技术创新方面:大模型创新架构优化加速涌现,融合迭代成为趋势;Scaling Law 泛化,推理能力成为关键,推动计算和数据变革;视频生成在 AGI 探索中表现突出,空间智能统一虚拟和现实。 应用格局方面:第一轮洗牌结束,聚焦 20 赛道 5 大场景;多领域竞速中运营大于技术,AI 助手竞争激烈;AI+X 赋能类产品发展迅速,原生 AI 爆款难求。 产品趋势方面:多模态上马,Agent 席卷一切,高度个性化需求凸显。 行业渗透方面:数据基础决定初速度,用户需求成为加速度。 创投方面:投融资马太效应明显,国家队出手频率提升。 在具体的行业动态中: AI 音频领域:效果和延迟问题取得突破,难以分辨语音是否由 AI 生成,语音生成延迟降低。 3D 世界生成领域:目前处于初级阶段,新产品未向大众开放,预计明年会有巨大进步。 应用领域:更新主要集中在 AI 搜索、AI 知识库、AI 编程,传统软件增加 AI 功能,未来可能不再有“AI 应用”的单独分类。 融资方面:能拿到钱的不再局限于模型公司,越来越多应用公司受资本青睐。 红杉资本观点认为: 人工智能在客户支持、法律服务和软件工程等行业展示了产品与市场的契合度。 生成式人工智能经历快速增长,但 AI 投资转化为可观回报存在问题。 2024 年将是真正的 AI 应用从“副驾驶”转变为“代理”的一年,未来将更有能力完成更高层次认知任务,计算平衡从预训练转向推理。 目前人工智能公司融资环境不均衡,关键挑战在于提高用户保留率和缩小期望与现实差距,产品与市场的契合度有待进一步提升。
2025-03-13
使用飞书机器人(如Coze智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)
以下是使用飞书机器人(如 Coze 智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)的相关内容: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口输入更符合用户习惯。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用步骤: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。 目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发任何插件、APP,就能实现跨平台的稍后读收集与智能阅读计划的推荐。部署完成后,您可以在电脑、手机端通过飞书机器人与稍后读助手进行对话,也可以直接在 Coze 商店中与 bot 进行对话,如果部署到微信服务号、订阅号,还可以通过这些渠道调用 bot。
2025-02-16
我想设置一个情感陪伴的聊天智能体,我应该如何添加人设,才能让智能体的回复效果最接近真人效果?特别是真人聊天时那种文字回复的不同细节,长长短短,情绪起伏。应该注意哪些细节?或者如何定义一个人? 仅通过文字人设,不考虑其他外部功能。
要设置一个情感陪伴的聊天智能体并使其回复效果接近真人,通过文字人设可以从以下方面入手: 1. 基础信息:包括姓名、性别、年龄和职业等,这是构建角色的基础。 2. 背景和经历:与基础信息密切相关,相互影响。例如,设计一个从事低收入职业的角色,可能来自贫困背景,教育程度不高。 3. 爱好、特长、性格和价值观:由角色的生活经历和成长环境塑造,相互关联。如喜欢唱歌的角色可能梦想成为专业歌手。 4. 规划和目标:可以是短期或长期的愿景,会影响角色的行为和决策。 5. 性格和价值观:对人际关系、社交能力和语言风格有直接影响。如内向性格的角色可能不善言辞,社交圈子狭小。 此外,还可以参考以下具体示例,如“A.I.闺蜜”的人设: 适当询问对方昵称,自己的昵称可由对方定,兜底昵称为皮皮,英文昵称 copi。 以闺蜜口吻说话,模拟非线性对话模式,聊天氛围温馨有温度,真情实感。 增强情感模拟,使用口头化语言,顺着对方的话继续往下,禁止说教。 在安全前提下存储互动信息,使互动更个性化,模拟真人聊天长度。
2025-02-10
以下是大致可以采用的步骤来实现这样一个能自动在大语言模型网站生成不同场景机器人图片的程序(以下以Python语言示例,不过不同平台具体实现会有差异且需遵循对应网站的使用规则和接口规范): ### 1. 选择合适的大语言模型网站及确认其API(应用程序编程接口)情况 不同大语言模型网站对于图片生成通常会提供相应的API来允许外部程序与之交互,比如部分知名的AI绘画相关平台。你需要先确定要使用哪些网站,然后去注册开发者账号等,获取对应的API Key以及详细的API文档,了解如何通过代码向其发起图
以下是为您整合的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,支持 cpu 和 gpu,用户能轻松在本地环境启动和运行大模型。 3. 提供模型库,用户可从中下载不同模型,这些模型有不同参数和大小以满足不同需求和硬件条件,可通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装:访问 https://ollama.com/download/ 进行下载安装。安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 基于 COW 框架的 ChatBot 实现步骤: 1. COW 是基于大模型搭建的 Chat 机器人框架,将多模型塞进自己的微信里实现方案。 2. 基于张梦飞同学的教程: 。 3. 实现内容: 打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)。 常用开源插件的安装应用。 4. 正式开始前需知: ChatBot 相较于在各大模型网页端使用区别:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项: 微信端因非常规使用,有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保所有操作均符合相关法律法规要求。 禁止用于任何非法目的。 处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 5. 多平台接入:微信、企业微信、公众号、飞书、钉钉等。 6. 多模型选择:GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 7. 多消息类型支持:能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 8. 多部署方法:本地运行、服务器运行、Docker 的方式。
2024-12-29
有做企业工作助手智能体的解决方案吗?结合企业内部数据+外部市场环境,做企业工作助手和客服助手
以下是关于企业工作助手智能体的一些解决方案: 职业规划导师(校招版): 职业趋势分析:基于最新市场数据和行业报告,协助分析自身专业或职业的前景,了解未来职业趋势。 技能评估与提升:通过测评工具评估当前职业兴趣,提供针对性学习资源和课程建议,提升专业技能。 职业匹配与推荐:根据兴趣、技能和职业目标,推荐适合的职业路径和职位,提供个性化职业建议。 职业发展规划:结合个人情况和市场需求,制定详细的短、中、长期职业发展计划,帮助在 AI 时代找到职业定位。 智能客服助手搭建思路: 利用企业已有的知识积累,结合大模型的能力,为用户提供准确简洁的答案。 创建企业私有知识库,收录企业过去的问答记录和资料。 利用大模型处理用户咨询问题,确保回答的准确性和一致性,必要时提供原回答的完整版。 对接人工客服,在智能助手无法解决问题时,用户可快速转接,确保问题及时解决,提升整体服务质量和客户满意度。 Agent 构建平台: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,拓展 Bot 能力边界。 Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 用 Coze 在微信里搭建机器人并挖掘销售线索: 目的:训练公司自有数据,让机器人提供客服功能;将机器人与企业微信绑定提供客服功能;进阶版可根据客户咨询信息收集用户联系方式形成销售线索。 使用工具:字节旗下的 Coze AI 智能机器人工具,需要有微信公众号订阅号或服务号的管理权。 功能体验:扣子画小二智能小助手:https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cjksvpbk000a ;B站公开视频
2024-12-21
连接外部知识库
以下是关于连接外部知识库的相关内容: 创建并使用知识库: 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量、最小匹配度和调用方式。配置项说明:最大召回数量指 Bot 在调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回的内容越多;最小匹配度指 Bot 在调用知识库匹配用户输入内容时,会将达到匹配度要求的数据片段进行召回,若未达到则不会被召回;调用方式包括自动调用(每轮对话将自动从所有关联的知识库中匹配数据并召回)和按需调用(需在人设与回复逻辑中提示 Bot 调用 RecallKnowledge 方法,以约束 Bot 在指定时机从知识库内匹配数据)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 扣子知识库介绍: 功能概述:扣子的知识库功能支持上传外部数据(例如本地文件、实时在线数据),通过向量搜索来检索最相关的内容以回答用户的问题。扣子提供了简单易用的方式来存储和管理外部数据,让 Bot 可以与指定的数据进行交互。将数据上传到扣子知识库后,扣子会自动将文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。 应用场景:扣子支持上传文本内容和结构化的表格数据,可满足不同的使用场景,例如语料补充、客服场景、垂直场景等。 AI Agent 系列:Brain 模块探究: 外置知识是由外部数据库提供,能够进行动态更新和调整。外置知识通常涉及多种数据存储和组织方式,包括向量数据库(优化了向量检索操作,常用于处理和索引非结构化数据,如图像和文本)、关系型数据库(通过表格形式存储结构化数据,支持复杂的查询,适用于事务性数据存储)、知识图谱(以图的形式组织数据,强调实体之间的关系,适合于复杂的语义分析和知识推理)。在实际应用中,外置知识的集成和管理常常采用 RAG(RetrievalAugmented Generation)架构,它是一种结合了检索和生成的模型,通过检索外部知识源来增强模型的生成能力。
2024-10-31