DeepSeek 的产生对 AI 行业具有多方面的影响:
1. 华尔街分析师的反应:
DeepSeek 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。
Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。
高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。
2. 实际使用体验:
在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。
数学能力经过优化,表现不错;编程能力略逊于 GPT,据用户反馈。
GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
3. 训练成本方面:
训练成本远高于传闻的 600 万美元,总计约 13 亿美元。
定价低于实际成本,导致高额亏损。
MixtureofExpert 方法降低计算需求,但大规模内存使用可能反而增加总成本。
4. 竞争格局影响:
以低成本开发顶级 AI 模型的 Mistral AI 被中国 DeepSeek 迅速赶超。
DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。
2025-02-17