Chat with Wiki - 清华 deepseek

Answer

以下是关于清华 deepseek 的相关信息：

1 月 8 日：《DeepSeek 的秘方是硅谷味儿的》DeepSeek 是一家位于杭州的人工智能创业公司，其大语言模型 DeepSeek-V3 在全球引发广泛关注。该模型以 550 万美元和 2000 块低配版英伟达 H800 GPU 训练，超越了多个顶级模型，获得硅谷研究者的高度评价。DeepSeek 的成功被视为中国式创新的典范，但其独特之处在于其更像一个研究机构，注重技术创新而非商业化运作，吸引了大量年轻的顶尖研究人才。
1 月 9 日：清华大学计算机科学与技术系助理教授，KVCache.AI 团队负责人章明星从大模型当前的发展阶段出发，分享了他关于模型架构演进、大模型 Scaling Law 的发展趋势及相应趋势对系统层面影响的看法，并探讨了未来的发展方向。
2 月 18 日：清华大学沈少阳发布《DeepSeek+DeepResearch 应用报告》。其它一些报告发布在研究报告板块和知识星球，包括智灵动力的《DeepSeek 行业应用实践报告》、厦门大学的《2025 年大模型概念、技术与应用实践》、国海证券的《人工智能系列深度：DeepSeek 十大关键问题解读》、全球数据资产理事会的《DeepSeek 使用教程蓝皮书-从入门到进阶完整指南》、北航&清华大学的《DeepSeek+DeepResearch——让科研像聊天一样简单》、中泰证券的《DeepSeek 将如何改变 AI 应用？》。
1 月 28 日：DeepSeek 以小成本实现媲美领先 AI 产品的性能，并在全球主要市场 App Store 登顶。高盛认为 DeepSeek 或改变科技格局，降低 AI 行业的进入门槛。中文场景表现优秀，日常写作和表达习惯贴近人类，但专业论文总结略弱。数学能力不错，编程能力逊于 GPT。采用 GRPO 算法替代传统 PPO，提升语言评价灵活性与训练速度。

Content generated by AI large model, please carefully verify (powered by aily)

References

《[大模型Scaling Law“放缓”的真相与未来方向](https://mp.weixin.qq.com/s/g0OxsI1o5e95jTuu4eg5Tw)》清华大学计算机科学与技术系助理教授，KVCache.AI团队负责人章明星。章老师从大模型当前的发展阶段出发，分享了他关于模型架构演进、大模型Scaling Law的发展趋势及相应趋势对系统层面影响的看法，并探讨了未来的发展方向。《[DeepSeek的秘方是硅谷味儿的](https://mp.weixin.qq.com/s/kuYFL2Ks-HEO9CTGLYbE3A)》DeepSeek是一家位于杭州的人工智能创业公司，其大语言模型DeepSeek-V3在全球引发广泛关注。该模型以550万美元和2000块低配版英伟达H800 GPU训练，超越了多个顶级模型，获得硅谷研究者的高度评价。DeepSeek的成功被视为中国式创新的典范，但其独特之处在于其更像一个研究机构，注重技术创新而非商业化运作，吸引了大量年轻的顶尖研究人才。《[AI音视频界的“瑞士军刀”，华人AI初创已与超过2000家知名企业合作](https://mp.weixin.qq.com/s/Ohu2kJU6WbZp7fQQTcrBgg)》Akool是一家成立于2022年的AI音视频初创公司，总部位于加州圣克拉拉，致力于提供高效、智能的视频生成解决方案。其功能包括AI换脸、实时换脸、定制数字人、视频翻译等，旨在服务企业客户，提升其内容创作效率和质量。创始人吕家俊丰富的AI背景，曾在苹果和谷歌工作，强调团队和热情在商业成功中的重要性。

2月19日社区动态速览

清华大学沈少阳：《[DeepSeek+DeepResearch应用报告](https://waytoagi.feishu.cn/record/FjWorH其它一些报告发布在[研究报告板块](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe)和[知识星球](https://t.zsxq.com/18DnZxlrl)：智灵动力：《[DeepSeek行业应用实践报告](https://waytoagi.feishu.cn/record/JIpXrzhoFeJdSCcHxtjcqqcUngk)》厦门大学：《[2025年大模型概念、技术与应用实践](https://waytoagi.feishu.cn/record/MAqxr0cIve3SMicMNgRc4JM2nk1)》国海证券：《[人工智能系列深度：DeepSeek十大关键问题解读](https://waytoagi.feishu.cn/record/HEPorLzqseeYUWcwLFdcImXznPg)》全球数据资产理事会：《[DeepSeek使用教程蓝皮书-从入门到进阶完整指南](https://waytoagi.feishu.cn/record/PG5xrINLwekNiKcdO26c4M59nuh)》北航&清华大学：《[DeepSeek+DeepResearch——让科研像聊天一样简单](https://waytoagi.feishu.cn/record/FEzmrbbSFe4Sz5cag3SctlgvnIc)》中泰证券：《[DeepSeek将如何改变AI应用？](https://waytoagi.feishu.cn/record/U1GRrOtzIe8rdhcbw89c6fcLnko)》

1月28日社区动态速览

1⃣️?华尔街分析师对DeepSeek的反应DeepSeek以小成本实现媲美领先AI产品的性能，并在全球主要市场App Store登顶。高盛认为DeepSeek或改变科技格局，降低AI行业的进入门槛。[?详情](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验中文场景表现优秀，日常写作和表达习惯贴近人类，但专业论文总结略弱。数学能力不错，编程能力逊于GPT。采用GRPO算法替代传统PPO，提升语言评价灵活性与训练速度。[?更多信息](https://x.com/imxiaohu/status/1883843200756170873)|?[GRPO详情](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型中文语音体验近似GPT-4o高级语音，响应时间低于200毫秒，支持打断和自然互动。可生成多情感、多风格语音，包含方言、戏剧化台词等；多语言适配，嘈杂环境下仍具备强逻辑推理能力。[?相关推文](https://x.com/imxiaohu/status/1883739294315274331)|?[项目主页](https://github.com/OpenMOSS/SpeechGPT-2.0-preview)|?[在线体验](https://sp2.open-moss.com)4⃣️?阿里巴巴推出Qwen2.5-1M模型