Chat with Wiki - 可以简单说下deepseek的原理么

Answer

DeepSeek 是中国大模型创业公司中的一员，其背后的量化私募巨头幻方一年前储备了万张 A100 芯片。DeepSeek 发布的 DeepSeek V2 开源模型以低成本的性价比成为行业关注热点，推动了中国大模型价格战的爆发。

DeepSeek 的成功不仅在于技术创新，如提出的 MLA 架构和 DeepSeekMoESparse 结构，还在于其商业模式，即专注于研究和技术创新，而非追求快速商业化。其创始人梁文锋强调了原创式创新的重要性，并讨论了中国 AI 技术创新的未来趋势，以及与硅谷技术社区的差异和交流。

此外，DeepSeek 网站为 https://www.deepseek.com/zh ，使用方便，国内能访问，网页登录便捷，目前完全免费。在生成 2048 游戏代码方面，DeepSeek 对新手较为友好。在 MT-Bench 上表现优异，中文能力强且性价比高，拥有 2360 亿参数，其中 21B 在生成过程中被激活，60 位专家参与了混合开源模型，在数学、编码和推理方面表现出色。

Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC Weekly #81

AI投资与收入的不平衡问题持续恶化，收入缺口从2000亿美元飙升至6000亿美元。AI泡沫正逼近临界点，接下来如何应对至关重要。疯狂囤积GPU引发的问题：1.缺乏定价权：GPU数据中心的情况下，定价权要少得多。GPU计算越来越成为一种按小时计费的商品。2.投资泡沫：即便是在铁路行业以及许多新兴技术领域，投机性的投资热潮往往会导致大量资本损失。3.设备折旧：半导体的性能往往会不断提升。英伟达将继续生产像B100这样更好的下一代芯片。这将导致上一代芯片价值迅速贬值。4.赢家与输家：我们需要仔细看待赢家和输家在过度基础设施建设期间总会有赢家。主要会对投资者造成伤害。[heading2][揭秘DeepSeek:一个更极致的中国技术理想主义故事](https://mp.weixin.qq[content]文章详细介绍了DeepSeek，作为中国大模型创业公司中的一员，如何通过技术创新掀起了AI领域的价格战，并成为了业界关注的焦点。DeepSeek背后的量化私募巨头幻方，一年前储备了万张A100芯片，而一年后，DeepSeek发布的DeepSeek V2开源模型以其低成本的性价比成为了行业关注的热点，推动了中国大模型价格战的爆发。DeepSeek的成功不仅在于它的技术创新，如提出的MLA架构和DeepSeekMoESparse结构，而且在于它的商业模式，即专注于研究和技术创新，而非追求快速商业化。DeepSeek的创始人梁文锋以其技术理想主义者的身份，强调了原创式创新的重要性，并讨论了中国AI技术创新的未来趋势，以及与硅谷技术社区的差异和交流。

一起来玩2048：读了元子的Cursor补充

使用cursor可以不用下载上一步中的Pycharm网址：https://www.cursor.com/这个教程很多，通过对话获得代码即可。因为这里面用的是大语言模型Claude3.5sonnet、GPT4o等语言模型，包括我用cursor small也试了，最好是指令更详细一些，比如：我想做个2048游戏，请用上pygame库。。等等[heading4]Deepseek（新手推荐这个，2→3.2→4这样路径）[content]网址：https://www.deepseek.com/zh我们只需要获得游戏代码即可，Deepseek很方便，国内能访问，网页登录很方面，目前完全免费！点击开始对话，左边选择代码助手：直接向神龙许愿吧：[heading4]通义灵码[content]在Pytharm中，“文件”-“设置”-“插件”-红色框位置搜索“通义灵码”（如图：），安装通义灵码插件：（目前免费）[heading4]JetBrains自身的助手插件[content]在Pytharm中，“文件”-“设置”-“插件”-红色框位置搜索“Jetbrains AI assistant”（如图：），安装Jetbrain AI assistant插件：（收费，目前有7天免费试用）[heading4]Marscode及Tencent cloud AI code Assistant等等...[content]见上图绿色部分[heading4]无影的晓颖AI助手[content]在云栖大会上有过使用。晓颖助手内置在云电脑里，无影也是阿里旗下的，晓颖助手的使用很流畅，只是需要在无影的云电脑中。高能力的通用语言大模型通过明确的指令也可以得到python代码，不过我这边使用下来还是Deepseek和晓颖AI助手在生成2048游戏上更为简便准确，这句话仅供参考，不知道大家实践下来有什么新发现可以交流。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景，实现沉浸式互动。?项目地址：http://vcai.mpi-inf.mpg.de/projects/holochar/?详细介绍：https://xiaohu.ai/p/74845️⃣?DeepSeek发布2360亿参数的DeepSeek-V2：-60位专家混合开源模型，数学、编码和推理表现出色。-236B参数，21B在生成过程中被激活。-在MT-Bench上表现优异，中文能力强且性价比高。?详细介绍：https://xiaohu.ai/p/74686️⃣?Google Gemini网络安全产品：-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。?详细：https://xiaohu.ai/p/74607️⃣?Wayve获超10亿美元C轮融资：-开发“驾驶GPT”基础模型，实现具身体智能自动驾驶。-使车辆在各种环境中操作，几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。?详细内容：https://xiaohu.ai/p/74538️⃣?CURE模型预测治疗结果：-利用300万患者数据进行预训练并针对特定健康状况微调。