Chat with Wiki - AI的主要大模型有哪些

Answer

目前主要的 AI 大模型包括：

OpenAI 系列：
- GPT-3.5：于 11 月启动了当前的 AI 热潮。
- GPT-4：在春季首次发布，功能更强大。有新的变种使用插件连接到互联网和其他应用程序，如 Code Interpreter 是一个强大的版本，可运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合，通常是 GPT-4 家族中首个推出新功能的模型，能创建和查看图像，可在网页浏览器中阅读文档并连接到互联网。
谷歌：Bard，由各种基础模型驱动，最近是名为 PaLM 2 的模型。
Anthropic：Claude 2，其最显著的特点是有非常大的上下文窗口，本质上是 LLM 的记忆，几乎可以保存一整本书或许多 PDF，且与其他大型语言模型相比，不太可能恶意行事。

Content generated by AI large model, please carefully verify (powered by aily)

References

首先我们给出一些常见缩写和专业词汇的“人话”解释，它们十分基础，但理解他们至关重要。为了讨论更加聚焦，接下来的内容将主要围绕大语言模型为主进行展开（对于其他模态的大模型，我们暂且放放）：LLM：Large language model的缩写，即大语言模型，前面百团大战中的各类大模型，说的都是大语言模型（极其应用）Prompt：中文译作提示词，就是我们输入给大模型的文本内容，可以理解为你和大模型说的话，下达的指令。提示词的质量好坏，会显著影响大模型回答的质量，很多时候如果你觉得大模型回答的太差了，AI味儿太浓了，很可能是你的提示词写的不够好，换言之，不是AI不行，而是你不行?Token：就像人类有着不同的语言，大模型也有着自己的语言体系，如图9，我们发送文本给大模型时，大模型会先把文本转换为他自己的语言，并推理生成答案，而后再翻译成我们看得懂的语言输出给我们。正如人类不同语言都有最小的字词单元（汉语的字/词，英语的字母/单词），大模型语言体系中的最小单元就称为Token。这种人类语言到大模型语言的翻译规则，也是人类定义的，以中文为例，由于不同厂商的大模型采用了不同的文本切分方法，因此一个Token对应的汉字数量也会有所不同，但在通常情况下，1Token≈1-2个汉字。请注意，大模型的收费计算方法，以及对输入输出长度的限制，都是以token为单位计量的。上下文：英文通常翻译为context，指对话聊天内容前、后的内容信息。使用时，上下文长度和上下文窗口都会影响AI大模型回答的质量。上下文长度限制了模型一次交互中能够处理的最大token数量，而上下文窗口限制了模型在生成每个新token时实际参考的前面内容的范围（关于这一点，你需要看完3.2中关于GPT的讨论，方能更好理解）

Ranger：【AI 大模型】非技术背景，一文读懂大模型（长文）

首先为方便大家对大模型有一个整体的认知，我们先从大模型的整体架构着手，来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看，目前大模型整体架构可以分为以下几层：[heading3]1.基础层：为大模型提供硬件支撑，数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集，而是企业根据自己的特性，维护的垂域数据。分为静态的知识库，和动态的三方数据集[heading3]3.模型层：LLm或多模态模型[content]LLm这个大家应该都知道，large-language-model，也就是大语言模型，例如GPT，一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型，训练所用的数据与llm不同，用的是图文或声音等多模态的数据集[heading3]4.平台层：模型与应用间的平台部分[content]比如大模型的评测体系，或者langchain平台等，提供模型与应用间的组成部分[heading3]5.表现层：也就是应用层，用户实际看到的地方[content]这个就很好理解了，就不用我多作解释了吧

如何使用 AI 来做事：一份带有观点的指南

前四个（包括Bing）都是OpenAI系统。今天有两大主要的OpenAI AI：3.5和4。3.5模型在11月启动了当前的AI热潮，4.0模型在春季首次发布，功能更强大。一个新的变种使用插件连接到互联网和其他应用程序。有很多插件，其中大部分不是很有用，但你应该随需要自由探索它们。Code Interpreter是一个非常强大的ChatGPT版本，可以运行Python程序。如果您从未为OpenAI付费，那么您只能使用3.5。除了插件变种和一个暂时停用的带有浏览功能的GPT-4版本之外，这些模型都没有连接到互联网。微软的Bing使用4和3.5的混合，通常是GPT-4家族中首个推出新功能的模型。例如，它既可以创建也可以查看图像，而且它可以在网页浏览器中阅读文档。它连接到互联网。[Bing使用有点奇怪，但功能强大。](https://oneusefulthing.substack.com/p/power-and-weirdness-how-to-use-bing)谷歌一直在测试自己的人工智能供消费者使用，他们称之为Bard，但是由各种基础模型驱动，最近是一个名叫PaLM 2的模型。对于开发出LLM技术的公司来说，他们非常令人失望，尽管昨天宣布的改进表明他们仍在研究基础技术，所以有希望。它已经获得了运行有限代码和解释图像的能力，但我目前通常会避免它。最后一家公司Anthropic发布了Claude 2。Claude最值得注意的是有一个非常大的上下文窗口-本质上是LLM的记忆。Claude几乎可以保存一整本书或许多PDF。与其他大型语言模型相比，它不太可能恶意行事，这意味着，在实际上，它倾向于对你做一些事情进行责骂。现在，来看看一些用途：