Chat with Wiki - 如何训练chatgpt

Answer

ChatGPT 的训练过程较为复杂，主要包括以下方面：

数据获取：从网络、书籍等来源获取大量人类创作的文本样本，数量达数百万亿字。
硬件支持：使用现代 GPU 硬件，以并行计算数千个示例的结果。
训练方式：
- 基本概念：训练神经网络生成“类似”的文本，能够从“提示”开始，然后继续生成“类似于训练内容”的文本。
- 操作过程：神经网络由简单元素组成，基本操作是为每个新单词（或单词部分）生成“输入”，然后将其“通过其元素”。
训练目的：不是记忆，而是学习“提问和回答的通用规律”，以实现举一反三。但可能存在混淆记忆、无法直接查看和更新所学、高度依赖学习材料等缺点，导致缺乏及时性和准确性。
规模与效果：在训练中，一些文本会被重复使用多次，而其他文本只会使用一次。尽管没有根本的理论确定所需的训练数据量和网络规模，但实践中，ChatGPT 成功地从大量文本中进行了训练，其成功表明神经网络在实现基于人类语言算法内容的模型时相当有效。

Content generated by AI large model, please carefully verify (powered by aily)

References

使用现代GPU硬件，可以并行计算数千个示例的结果。但是，当涉及实际更新神经网络中的权重时，目前的方法基本上要求一次一批地执行此操作。（是的，这可能是实际的大脑将计算和内存元素相结合的优势。)即使在我们之前讨论过的学习数值函数的看似简单的情况下，我们发现通常需要使用数百万个示例才能成功训练网络，至少是从头开始。那么，为了训练一个“类人类语言”的模型，需要多少示例呢？理论上似乎没有任何根本的方式可以知道。但是在实践中，ChatGPT成功地从数百万亿字的文本中进行了训练。一些文本会被重复使用多次，而其他文本只会使用一次。但是，它以某种方式从看到的文本中“得到了它所需的”。但是，考虑到这么多的文本进行训练，需要多大的网络才能“很好地学习它”呢？同样，我们还没有根本的理论。最终——正如我们将在下面进一步讨论的——人类语言及其典型使用可能存在一定的“算法”。但是，下一个问题是，神经网络在实现基于该算法内容的模型时有多么高效；我们还不知道，尽管ChatGPT的成功表明它相当有效。

ChatGPT 是在做什么，为什么它有效？

ChatGPT的基本概念在某种程度上相当简单。从网络、书籍等来源中获取大量人类创作的文本样本。然后训练神经网络生成“类似”的文本。特别是让它能够从“提示”开始，然后继续生成“类似于训练内容”的文本。正如我们所见，ChatGPT中的实际神经网络由非常简单的元素组成，尽管有数十亿个。神经网络的基本操作也非常简单，基本上是为每个新单词（或单词部分）生成“输入”，然后将其“通过其元素”（没有任何循环等）。但是，这个过程能够产生成功地“类似于”网络、书籍等内容的文本，这是非常卓越和出乎意料的。它不仅是连贯的人类语言，而且“说的话”是“遵循其提示”的，利用其“读到”的内容。它并不总是说出“全局意义上的话”（或对应于正确的计算），因为（例如，没有访问Wolfram|Alpha的“计算超能力”）它只是根据训练材料中的“声音类似”的东西“说出”“听起来正确”的东西。

YoYo：小白 AI 初识知识点扫盲

它为什么叫做ChatGPT呢？先说GPT：Generative Pre-Training Transformer；Generative生成式，Pre-Training预训练。Transformer转换器示意图ChatGPT实质功能：本质是「单字接龙」，长文由单字接龙的回归所生成GPT作为大脑，也就是模型是需要训练的。训练方式是通过材料学习，不断的形成模型。eg.未学习前，胡乱生成，学习后，概率抽样生成，可以对比小朋友学习前后训练的目的不是记忆，是学习，“提问和回答的通用规律”学习后的模型，可以实现举一反三Chat Gpt并不是搜索引擎的升级版，材料学习作业时调整模型，生成模型；可以给出没有记忆中的内容，这也是出现“幻觉”的原因，对现实不存在的东西，出现合乎规律的捏造，通过提前训练才能生成想要的问答，这样的训练是为了让它学会「能举一反三的规律」缺点是可能混淆记忆，无法直接查看和更新所学，且高度依赖学习材料，也是缺乏及时性，准确性的原因