Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

中文大模型

Answer

以下是关于中文大模型的相关信息:

  • 中文大模型基准测评 2023 年度报告中的测评模型列表:
    • 9. Qwen-72B-Chat:阿里巴巴开源的 72B 的 Chat 版本
      1. 讯飞星火 V3.0:科大讯飞官方发布的 V3.0 版本的 API
      1. 序列猴子:出门问问官方发布的 API 版本
      1. Minimax(应事):稀宇科技官方网页版产品【应事】
      1. Yi-34B-Chat:零一万物开源的 34B 的 Chat 版本
      1. ChatGLM3-6B:清华&智谱 AI 开源的第三代 6B 版本
      1. PCI-TransGPT:佳都科技小范围内测 API 版本
      1. Chinese-Alpaca2-13B:yiming cui(个人开发者)个人开源的基于 Llama2 的汉化版中文模型
      1. 360GPT_Pro:360 360 智脑的 API 升级版本 Pro
      1. Llama_2_13B_Chat:Meta 官方开源的 2 代 13B 的 Chat 版本。本次测评数据选取了 SuperCLUE-12 月测评结果,模型选取了国内外有代表性的 26 个大模型在 12 月份的版本。
  • 专项基准中的 SuperCLUE 基准-专业与技能:
    • 测评表现:在专业技能与知识的测评中,GPT-4 Turbo 领先幅度较大,总分 97 分是唯一过 90 分且接近满分的大模型。国内大模型中文心一言 4.0 表现不俗,取得 79.62 的高分。较 GPT4 的 API 版本仅低 1.53 分,是国内模型中唯一接近 80 分的大模型。仅随其后的是通义千问 2.0、Moonshot 等模型。其中有 11 个大模型有超过 GPT3.5 的表现。
    • 开源模型中,阿里云的 Qwen-72B-Chat 表现可圈可点,是国内开源模型中唯一超过 60 分的模型。总体来看,在专业与知识能力上,国内第一梯队大模型与国外最好模型依然有较大距离,但差距正在不断缩小。
  • Llama 中文大模型:
    • 已经基于大规模中文数据,从预训练开始对 Llama2 模型进行中文能力的持续迭代升级。
    • 相关链接:
      • Llama 中文大模型:https://github.com/LlamaFamily/Llama-Chinese
      • 在线体验:https://llama.family
      • 基于 Llama2 的开源中文预训练大模型 Atom-7B:https://huggingface.co/FlagAlpha/Atom-7B-Chat
Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

9.Qwen-72B-Chat阿里巴巴开源的72B的Chat版本22.讯飞星火V3.0科大讯飞官方发布的V3.0版本的API10.序列猴子出门问问官方发布的API版本23.Minimax(应事)稀宇科技官方网页版产品【应事】11.Yi-34B-Chat零一万物开源的34B的Chat版本24.ChatGLM3-6B清华&智谱AI开源的第三代6B版本12.PCI-TransGPT佳都科技小范围内测API版本25.Chinese-Alpaca2-13B yiming cui(个人开发者)个人开源的基于Llama2的汉化版中文模型13.360GPT_Pro 360 360智脑的API升级版本Pro26.Llama_2_13B_Chat Meta官方开源的2代13B的Chat版本本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。SuperCLUE模型象限

2023年度中文大模型基准测评报告.pdf

测评表现测评分析专业与技能,考察模型的能力包括:计算、逻辑与推理、代码。在专业技能与知识的测评中,GPT-4 Turbo领先幅度较大,总分97分是唯一过90分且接近满分的大模型。国内大模型中文心一言4.0表现不俗,取得79.62的高分。较GPT4的API版本仅低1.53分,是国内模型中唯一接近80分的大模型。仅随其后的是通义千问2.0、Moonshot等模型。其中有11个大模型有超过GPT3.5的表现。在开源模型中,阿里云的Qwen-72B-Chat表现可圈可点,是国内开源模型中唯一超过60分的模型。总体来看,在专业与知识能力上,国内第一梯队大模型与国外最好模型依然有较大距离,但可以看到的是差距正在不断缩小。

Llama 介绍

欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。Llama中文大模型:https://github.com/LlamaFamily/Llama-Chinese在线体验:https://llama.family基于Llama2的开源中文预训练大模型Atom-7B:https://huggingface.co/FlagAlpha/Atom-7B-Chat

Others are asking
朗读中文的ai工具有哪些
以下是一些朗读中文的 AI 工具: 1. 秘塔写作猫:https://xiezuocat.com/ 写作猫是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章属性并打分。 2. 笔灵 AI 写作:https://ibiling.cn/ 是得力的智能写作助手,适用于多种文体写作,支持一键改写/续写/扩写,智能锤炼打磨文字。 以下是一些常见的文章润色 AI 工具: 1. Wordvice AI 集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT 由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot 人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite 基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune AI 驱动的文本改写和润色工具,帮助用户优化文章的语言表达。 6. Smodin 提供 AI 驱动的论文撰写功能,可根据输入生成符合要求的学术论文。 以下是一些翻译 PDF 的 AI 产品: 1. DeepL(网站) 点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件) 安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用) 下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页) 使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页) 点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(进阶功能基本都需要付费)。 6. 彩云小译(App) 下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(有免费次数限制且进阶功能需要付费)。 7. 微信读书(App) 下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-14
用中文脚本,生成视频的ai有哪些
以下是一些能够生成视频的 AI 工具: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作且支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,能在图片基础上直接生成视频,由 Stability AI 开源。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:视频转视频 AI,可将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 另外,根据视频脚本生成短视频的工具包括: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化视频内容。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 如果想用 AI 把小说做成视频,可参考以下制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场以提高质量。 8. 审阅与调整:观看视频,根据需要调整场景或音频等。 9. 输出与分享:完成编辑后输出最终视频并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异,AI 工具的可用性和功能也可能变化,建议访问工具网址获取最新信息和使用指南。
2025-04-14
有没有自动降低文章的aigc率的工具,中文的
目前尚未有专门用于自动降低文章 AIGC 率的中文工具。但您可以通过人工修改、调整表述方式、增加独特的观点和内容等方法来降低文章的 AIGC 特征。
2025-03-25
coze中文版和英文版的区别
Coze 中文版和英文版主要有以下区别: 1. 支持的大模型不同:中文版支持 kimi、云雀;英文版支持 chatgpt4。 2. 网址不同:中文版网址为 https://www.coze.cn/;英文版网址为 https://coze.com/。 3. 产品定位相同,均为新一代 AI 原生应用开发服务平台,即 Nextgeneration AI chatbot building platform。 4. 在使用过程中,如创建机器人的具体操作流程等方面可能存在细微差异,但具体情况需根据实际使用体验确定。
2025-03-22
需要一个能在看YouTube英语视频的时候把每句话都实时翻译成中文 挂在字幕上的ai工具
以下为您推荐一款可能满足您需求的 AI 工具:Memo AI (https://memo.ac/zh/)。它可以对 YouTube、播客、本地音频视频轻松进行转文字、字幕翻译、语音合成,还可以由多种 AI 模型提炼内容精华总结,生成思维导图。并且支持中文、英语等多语言。
2025-03-19
midjourney中文站和官方网站上的内容是一样的吗
Midjourney 中文站和官方网站的内容不完全一样。 Midjourney 官网具有以下特点和操作细节: 已向生成 100 张以上图片的用户开放使用权限,登录官网后,左侧为各种页面入口,顶部有生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,随时可用 prompt 框和搜索框,无需频繁切换页面。 可通过点击 prompt 框最右侧的图标设置常用参数默认值,包括画面比例和个性化模型开关。 图片参考在官网上变得简单直观,点击 prompt 框最左侧的图片按钮或直接拖入图片即可,官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,如需多种参考逻辑可按住 shift 键点选多个图标。 创作页面的最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片会进入单图调整模式,常用的操作指令集中在右下角的按键中,并且上线了全新的 Editor 编辑器功能。 此外,关于 Midjourney 还有以下相关内容: 有关于 Midjourney v5.1 的 AIGC Weekly23 相关介绍。 有 Midjourney 的隐私政策,包括适用范围、变更情况、定义等。
2025-03-18
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14