Chat with Wiki - 百川大模型在国内的表现如何

Answer

百川大模型在国内的表现较为出色。

百川智能于 6 月 15 日开源 Baichuan1、9 月 6 日开源 Baichuan2，10 月 31 日发布 Baichuan2192K，是中文开源模型的主导力量。

Baichuan2-13B-Chat 在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名 200 亿参数量级国内模型第一，其中逻辑推理能力超过 34B 参数量级的大模型，生成与创作能力超过 72B 参数量级的模型。但在计算和代码能力上有一定优化空间。综合来看，在同等量级开源模型中非常有竞争力。

在中文大模型基准测评 2023 年度报告中，虽然与国外顶尖模型仍有差距，但过去 1 年国内大模型已有长足进步，百川大模型也是表现较好的模型之一。

百川大模型可应用的场景相对广泛且可以私有化部署，重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景。同时，它可以部署在教育、医疗、金融等垂直行业中应用，也可部署在低算力终端处理基础智能任务。

8 月正式上线的国内大模型中，百川智能的百川大模型位列其中，其网址为：https://www.baichuan-ai.com/

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

[title]VIRTUAL[heading1]国内大模型关键进展Baichuan2-13B-Chat是百川智能自主训练的开源大语言模型。百川智能于6月15日开源Baichuan1、9月6日开源Baichuan2，10月31日发布Baichuan2192K。是中文开源模型的主导力量。模型特点：Baichuan2-13B-Chat在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名200亿参数量级国内模型第一，其中逻辑推理能力超过34B参数量级的大模型，生成与创作能力超过72B参数量级的模型，表现不俗。在计算和代码能力上有一定优化空间。综合来看，Baichuan2-13B-Chat在同等量级开源模型中非常有竞争力。适合应用：Baichuan2-13B-Chat可应用的场景相对广泛且可以私有化部署。重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景。另外，Baichuan2-13B-Chat可以部署在教育、医疗、金融等垂直行业中应用，同时可部署在低算力终端处理基础智能任务。优秀模型：智谱清言（清华&智谱AI）简介：

2023年度中文大模型基准测评报告.pdf

外大模型。其中国内最好模型文心一言[heading4]4.0(API)总分79.02分，距离GPT4-Turbo有[content]11.61分，距离GPT4(网页)有4.9分的差距。必须看到的是，过去1年国内大模型已经有了长足的进步。综合能力超过G P T 3.5和Gemini-Pro的模型有11个，比如百度的文心一言4.0、阿里云的通义千问2.0和Qw e n 72B-Chat、OPPO的AndesGPT、清华&智谱AI的智谱清言、字节跳动的云雀大模型等都有比较好的表现。•在SuperCLUE测评中，国外模型的平均成绩为69.42分，国内模型平均成绩为65.95分，差距在4分左右。另外国内开源模型在中文上表现要好于国外开源模型，如百川智能的Baichuan2-13B-Chat、•可以看出，国内外的平均水平差距在缩小，11月差距在10分左右。阿里云的Qwen-72B、Yi -34B-Cha t均优于Llama2-13B-Chat。

8月正式上线的国内大模型

5⃣️五家北京企业机构：百度（文心一言）https://wenxin.baidu.com抖音（云雀大模型）https://www.doubao.com智谱AI（GLM大模型）https://chatglm.cn中科院（紫东太初大模型）https://xihe.mindspore.cn百川智能（百川大模型）https://www.baichuan-ai.com/3⃣️三家上海企业机构：商汤（日日新大模型）https://www.sensetime.com/MiniMax（ABAB大模型）https://api.minimax.chat上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn今天这8个大模型，在聊天状态下——能生成Markdown格式的：智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的：昇思（可以对文本进行是否由AI生成的检测，类似论文查重，准确度不错）、书生受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有15元的预充值额度进行体验，完成企业认证后可以进行充值）特色功能：昇思——生图，MiniMax——语音合成