通义千问是由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。
国内免费的大模型 APP 包括通义千问、Kimi 智能助手、文心一言等。其中,Kimi 智能助手是由 Moonshot AI 出品的有着超大“内存”的智能助手;文心一言是百度出品的 AI 对话产品,能写文案、想点子,又能陪你聊天、答疑解惑。
通义千问在模型方面有以下进展:
1. 发布一个模型开源两个模型,其中一个 AI 视觉智能体能力大幅增强,另一个百万 Tokens 处理速度提升近 7 倍。
开源的 Qwen2.51M 大模型,推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速,首次将开源 Qwen 模型的上下文扩展到 1M 长度。
通义千问旗舰版模型全新升级发布,包括 Qwen2.5Max 比肩 Claude3.5Sonnet,并几乎全面超越了 GPT4o、DeepSeekV3 及 Llama3.1405B;Qwen2.5VL 全新视觉模型实现重大突破,增强物体识别与场景理解,支持文本、图表、布局分析,可处理长达 1 小时视频内容,具备设备操作的 Agent 能力。
2. 在长文本处理能力方面,在上下文长度为 100 万 Tokens 的大海捞针任务中,Qwen2.51M 能够准确地从 1M 长度的文档中检索出隐藏信息,仅有 7B 模型出现了少量错误。对于更复杂的长上下文理解任务,通义官方选择了等测试集。从这些结果中得出关键结论:显著超越 128K 版本,Qwen2.51M 系列模型在大多数长上下文任务中显著优于之前的 128K 版本,特别是在处理超过 64K 长度的任务时表现出色;性能优势明显,Qwen2.514BInstruct1M 模型不仅击败了 Qwen2.5Turbo,还在多个数据集上稳定超越 GPT4omini,因此可以作为现有长上下文模型的优秀开源替代。
2025-02-10