Chat with Wiki - 怎么用chatgpt搜索外部

Answer

使用 ChatGPT 搜索外部信息的方法如下：

可以像 Andrej Karpathy 所做的那样，向 ChatGPT 提出收集特定信息并整理成表格的请求，例如有关规模人工智能及其创始轮次的信息。ChatGPT 会理解请求，并通过特殊方式发出搜索指令，类似于人类使用浏览器搜索。然后接受该查询并转到 Bing 搜索，查找结果，将文本返回给语言模型，让其基于那段文本生成响应。
对于程序开发人员，可利用基于嵌入的搜索实现高效的知识检索。这需要以下步骤：
- 选择文本嵌入工具，如 Word2Vec、BERT、FastText 等，将文本转化为向量。
- 构建包含详细信息的数据库，如电影数据库，可以是简单的文本文件或复杂的数据库系统。
- 对数据库中的信息进行预处理和嵌入，得到向量表示并存储。
- 当用户提出查询时，将查询进行文本嵌入得到查询向量。
- 使用快速的向量搜索算法（如余弦相似度、KNN 搜索等）在数据库中找到最接近的向量。
- 根据找到的向量从数据库中检索相关信息并返回给用户。
- 还可以将上述步骤封装成 API 或函数，在 ChatGPT 的对话逻辑中调用，当用户提出相关查询时，ChatGPT 调用并返回相关信息。但实际实现可能涉及更多细节和技术挑战。

Content generated by AI large model, please carefully verify (powered by aily)

References

[title]文章：Andrej Karpathy亲授：大语言模型入门[heading1]第二部分：LLM的未来现在，我想讨论一下这些语言模型的一些特性以及它们是如何随着时间的推移而演变的。我不打算使用抽象的术语，而是通过一个具体的例子来说明，这是一个我们可以逐步完成的任务。我使用了ChatGPT，并提出了以下查询：我请求它收集有关规模人工智能及其创始轮次的信息，包括发生的时间、日期、金额和估值，并将其整理成一个表格。ChatGPT理解了我的请求，因为我们在微调阶段使用了大量数据进行了教学。在这种类型的查询中，它并不是直接作为语言模型来回答问题，而是使用帮助其执行任务的工具。在这种情况下，一个合理的工具是浏览器。所以，如果你和我面临同样的问题，你可能会去搜索，对吧？这正是ChatGPT所做的。它有一种发出特殊单词的方式，我们可以看到它试图执行搜索。在这种情况下，我们可以接受该查询并转到Bing搜索，查找结果，就像你我可能浏览搜索结果一样，我们可以将该文本返回给语言模型，然后让它基于那段文本生成响应。因此，它的工作方式与您和我使用浏览器进行研究的方式非常相似，它将信息组织起来，并以这种方式做出响应。所以它收集了信息，我们得到了一个表格，表中有A、B、C、D和E系列，有日期、筹集的金额以及该系列中的隐含估值。然后它提供了引用链接，您可以在其中验证此信息是否正确。在底部，它表示，实际上，它无法找到A轮和B轮的估值，它只找到了筹集的金额。所以你会看到表中有一个“不可用”的标记。

熊猫Jay：万字解读ChatGPT提示词最佳实践

[title]熊猫Jay：万字解读ChatGPT提示词最佳实践[heading2]最佳实践5 -使用外部工具[heading3]策略1：利用基于嵌入的搜索实现高效的知识检索适用人群：程序开发人员难度：????当谈论模型利用外部信息源时，就像是给它提供更多的信息来帮助它做出更准确、有根据的回答。你可以想象你在跟一个很聪明的朋友聊天，有时候你会告诉他一些背景信息，这样他就能更好地回答你的问题。这种外部信息可以通过一种叫做“文本嵌入”的方式被加入到模型中。文本嵌入就像是把文本转换成特殊的向量，这个向量可以展示不同文本之间的关系。如果两段文本很相似或者相关，它们对应的向量就会比较接近。有些聪明的计算方法可以快速地找出相似向量，这就使得我们可以有效地找到相关的信息。想象一下，我们有很多关于电影的文本，每个文本都可以被转换成一个向量并存储起来。当用户问一个关于电影的问题时，我们可以把这个问题也转换成一个向量，然后在向量空间中搜索最接近这个向量的文本向量，找到最相关的文本块，然后从中获取信息来回答用户的问题。简单来说，就是模型可以借助外部信息来更好地回答问题，而文本嵌入是一种帮助我们在海量文本中迅速找到相关信息的聪明方法。这样一来，我们就能让模型变得更聪明，能够根据背景信息做出更准确的回应了。

熊猫Jay：万字解读ChatGPT提示词最佳实践

[title]熊猫Jay：万字解读ChatGPT提示词最佳实践[heading2]最佳实践5 -使用外部工具[heading3]策略1：利用基于嵌入的搜索实现高效的知识检索[heading4]解读1.文本嵌入工具：首先，您需要一个能够将文本转化为向量的工具，例如Word2Vec、BERT、FastText等。这些工具可以将文本转化为高维空间中的向量。2.构建电影数据库：您需要一个包含各种电影详细信息的数据库。这个数据库可以是一个简单的文本文件，每行包含一个电影的信息，或者是一个更复杂的数据库系统。3.预处理和嵌入：将数据库中的每部电影的信息进行文本嵌入，得到每部电影的向量表示，并存储这些向量。4.查询处理：当用户提出查询时，例如“由莱昂纳多·迪卡普里奥主演的电影”，您需要将这个查询进行文本嵌入，得到一个查询向量。5.向量搜索：使用某种快速的向量搜索算法（例如余弦相似度、KNN搜索等）在电影数据库中找到与查询向量最接近的电影向量。6.返回结果：根据找到的最接近的电影向量，从数据库中检索相关的电影信息，并返回给用户。7.集成到ChatGPT：您可以将上述步骤封装成一个API或函数，并在ChatGPT的对话逻辑中调用它，以便当用户提出相关查询时，ChatGPT可以调用这个API或函数并返回相关的电影信息。这只是一个高级的概述，实际实现可能会涉及更多的细节和技术挑战。但基本的思路是将文本嵌入技术与向量搜索结合起来，以实现高效的知识检索。