Chat with Wiki - 大模型全栈

Answer

大模型全栈包括以下几个方面：

基础层：为大模型提供硬件支撑和数据支持，例如 A100、数据服务器等。
数据层：企业根据自身特性维护的垂域数据，分为静态的知识库和动态的三方数据集。
模型层：包括 LLm（大语言模型，如 GPT，一般使用 transformer 算法实现）和多模态模型（如文生图、图生图等模型，训练所用数据为图文或声音等多模态数据集）。
平台层：模型与应用间的平台部分，如大模型的评测体系或 langchain 平台等。
表现层：即应用层，是用户实际看到的地方。

多模态大模型方面：

BuboGPT 通过学习共享语义空间构建，用于全面理解 MM 内容，探索不同模式间的细粒度关系。
ChatSpot 引入简单有效的方法微调 MM-LLM 的精确引用指令，促进细粒度交互。
Qwen-VL 是支持英文和中文的多语言 MM-LLM，允许在训练阶段输入多个图像。
NExT-GPT 是端到端、通用的 any-to-any MM-LLM，支持多种自由输入输出，采用轻量级对齐策略。
MiniGPT-5 集成生成 voken 的反演以及与稳定扩散的集成，擅长 MM 生成执行交错 VL 输出。

大模型的架构特点：

encoder-only 模型通常适用于自然语言理解任务，如分类和情感分析，代表模型是 BERT。
encoder-decoder 模型同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容，用例包括翻译和摘要，代表是 google 的 T5。
decoder-only 模型更擅长自然语言生成任务，如故事写作和博客生成，众多 AI 助手基本采用此结构。

大模型的特点：

预训练数据量大，往往来自互联网，包括论文、代码、公开网页等，一般用 TB 级别的数据进行预训练。
参数多，如 Open 在 2020 年发布的 GPT-3 已达到 170B 的参数。

此外，GPT-3 可根据用户输入的任务描述或给出的详细例子完成任务，而 ChatGPT 只需像和人类对话即可完成任务，且两者在安全性上有差别。

Content generated by AI large model, please carefully verify (powered by aily)

References

Ranger：【AI 大模型】非技术背景，一文读懂大模型（长文）

首先为方便大家对大模型有一个整体的认知，我们先从大模型的整体架构着手，来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看，目前大模型整体架构可以分为以下几层：[heading3]1.基础层：为大模型提供硬件支撑，数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集，而是企业根据自己的特性，维护的垂域数据。分为静态的知识库，和动态的三方数据集[heading3]3.模型层：LLm或多模态模型[content]LLm这个大家应该都知道，large-language-model，也就是大语言模型，例如GPT，一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型，训练所用的数据与llm不同，用的是图文或声音等多模态的数据集[heading3]4.平台层：模型与应用间的平台部分[content]比如大模型的评测体系，或者langchain平台等，提供模型与应用间的组成部分[heading3]5.表现层：也就是应用层，用户实际看到的地方[content]这个就很好理解了，就不用我多作解释了吧

多模态大模型入门指南-长文慎入【持续更新】

[title]多模态大模型入门指南-长文慎入【持续更新】[heading2]4.多模态大模型总结：[heading3]4.1 26个多模态大模型全面比较：(15)BuboGPT是通过学习共享语义空间构建的模型，用于全面理解MM内容。它探索图像、文本和音频等不同模式之间的细粒度关系。(16)ChatSpot引入了一种简单而有效的方法来微调MM-LLM的精确引用指令，促进细粒度的交互。由图像级和区域级指令组成的精确引用指令的结合增强了多粒度VL任务描述的集成。(17)Qwen-VL是一个多语言MM-LLM，支持英文和中文。Qwen-VL还允许在训练阶段输入多个图像，提高其理解视觉上下文的能力。(18)NExT-GPT是一款端到端、通用的any-to-any MM-LLM，支持图像、视频、音频、文本的自由输入输出。它采用轻量级对齐策略，在编码阶段利用以LLM为中心的对齐方式，在解码阶段利用指令跟随对齐方式。(19)MiniGPT-5郑等人。是一个MM-LLM，集成了生成voken的反演以及与稳定扩散的集成。它擅长为MM生成执行交错VL输出。在训练阶段加入无分类器指导可以提高生成质量。

从 0 到 1 了解大模型安全，看这篇就够了

[title]从0到1了解大模型安全，看这篇就够了encoder-only:这些模型通常适用于可以自然语言理解任务，例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的，在transformer中，包括Encoder，Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢？第一，大模型的预训练数据非常大，这些数据往往来自于互联网上，包括论文，代码，以及可进行爬取的公开网页等等，一般来说，现在最先进的大模型一般都是用TB级别的数据进行预训练。第二，参数非常多，Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中，模型可以根据用户输入的任务描述，或给出详细的例子，完成任务但这与我们熟知的ChatGPT仍然有着很大的差距，使用ChatGPT只需要像和人类一样对话，就可以完成任务。除了形式上的不同之外，还有一个更加重要的差距，那就是安全性上的差别。