DeepSeek 是一家具有独特特点的公司。
首先,DeepSeek 不是“中国式创新”的产物,将其比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,其论文也在 AI 研究界被广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”,形成平行时空的感觉。这表明 DeepSeek 的秘方是硅谷味儿的。
其次,如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展无人知晓,但有趣的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。
此外,DeepSeek 在输出结果方面有一些神来之笔,如在独白文本中“自作主张”地加入括号中的场景描述,增强画面感,还能预判用户需求。例如对于“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”的提示词,能给出符合预期且具有文学性的输出。但值得商榷的是,根据史实,魏征是在玄武门之变之后才见到李世民。
2025-02-05