Chat with Wiki - 国内有哪些大模型

Answer

以下是国内的一些大模型：

北京企业机构：
- 百度：文心一言，https://wenxin.baidu.com
- 抖音：云雀大模型，https://www.doubao.com
- 智谱 AI：GLM 大模型，https://chatglm.cn
- 中科院：紫东太初大模型，https://xihe.mindspore.cn
- 百川智能：百川大模型，https://www.baichuan-ai.com/
上海企业机构：
- 商汤：日日新大模型，https://www.sensetime.com/
- MiniMax：ABAB 大模型，https://api.minimax.chat
- 上海人工智能实验室：书生通用大模型，https://intern-ai.org.cn
其他：
- 阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中。
- 据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品。

在专业与技能的测评中，表现不俗的有：

文心一言 4.0，取得 79.62 的高分。
通义千问 2.0、Moonshot 等。在开源模型中，阿里云的 Qwen-72B-Chat 表现可圈可点，是国内开源模型中唯一超过 60 分的模型。但总体来看，在专业与知识能力上，国内第一梯队大模型与国外最好模型依然有较大距离，不过差距正在不断缩小。

部分大模型的特点：

能生成 Markdown 格式的：智谱清言、商量 Sensechat、MiniMax
目前不能进行自然语言交流的：昇思、书生
受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有 15 元的预充值额度进行体验，完成企业认证后可以进行充值）
特色功能：昇思——生图，MiniMax——语音合成

Content generated by AI large model, please carefully verify (powered by aily)

References

8月正式上线的国内大模型

5⃣️五家北京企业机构：百度（文心一言）https://wenxin.baidu.com抖音（云雀大模型）https://www.doubao.com智谱AI（GLM大模型）https://chatglm.cn中科院（紫东太初大模型）https://xihe.mindspore.cn百川智能（百川大模型）https://www.baichuan-ai.com/3⃣️三家上海企业机构：商汤（日日新大模型）https://www.sensetime.com/MiniMax（ABAB大模型）https://api.minimax.chat上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn今天这8个大模型，在聊天状态下——能生成Markdown格式的：智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的：昇思（可以对文本进行是否由AI生成的检测，类似论文查重，准确度不错）、书生受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有15元的预充值额度进行体验，完成企业认证后可以进行充值）特色功能：昇思——生图，MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中，广东省2家和其他省市1家也将陆续开放据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品

02-基础通识课

[heading2]总结大语言模型的介绍与原理国内大模型的分类：国内大模型有通用模型如文心一言、讯飞星火等，处理自然语言；还有垂直模型，专注特定领域如小语种交流、临床医学、AI蛋白质结构预测等。大模型的体验：以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例，体验了Kimi、通义千问、豆包等大模型的回答和续写能力，发现回复有差异，且大模型基于统计模型预测生成内容。大语言模型的工作原理：大语言模型工作原理包括训练数据、算力、模型参数，在训练数据一致情况下，模型参数越大能力越强，参数用b链形容大小。Transformer架构：Transformer是大语言模型训练架构，17年出现用于翻译，具备自我注意力机制能理解上下文和文本关联，其工作原理是单词预测，通过嵌入、位置编码、自注意力机制生成内容，模型调教中有控制输出的temperature。关于大语言模型的原理、应用及相关概念Transformer模型原理：通过不断检索和匹配来寻找依赖关系，处理词和词之间的位置组合，预测下一个词的概率，是一个偏向概率预测的统计模型。大模型幻觉：大模型通过训练数据猜测下一个输出结果，可能因错误数据导致给出错误答案，优质数据集对其很重要。Prompt的分类和法则：分为system prompt、user prompt和assistant prompt，写好prompt的法则包括清晰说明、指定角色、使用分隔符、提供样本等，核心是与模型好好沟通。Fine tuning微调：基于通用大模型，针对特定领域任务提供数据进行学习和调整，以适应特定领域的需求。RAG概念：未对RAG的具体内容进行详细阐述，仅提出了这个概念。

2023年度中文大模型基准测评报告.pdf

测评表现测评分析专业与技能，考察模型的能力包括：计算、逻辑与推理、代码。在专业技能与知识的测评中，GPT-4 Turbo领先幅度较大，总分97分是唯一过90分且接近满分的大模型。国内大模型中文心一言4.0表现不俗，取得79.62的高分。较GPT4的API版本仅低1.53分，是国内模型中唯一接近80分的大模型。仅随其后的是通义千问2.0、Moonshot等模型。其中有11个大模型有超过GPT3.5的表现。在开源模型中，阿里云的Qwen-72B-Chat表现可圈可点，是国内开源模型中唯一超过60分的模型。总体来看，在专业与知识能力上，国内第一梯队大模型与国外最好模型依然有较大距离，但可以看到的是差距正在不断缩小。