与知识库对话 - Deepseek详细介绍及优势

回答

DeepSeek 是一家中国杭州的人工智能创业公司。其发布的 DeepSeek-V2 具有以下特点：

由 60 位专家混合的开源模型，在数学、编码和推理方面表现出色。
拥有 2360 亿参数，其中 210 亿在生成过程中被激活。
在 MT-Bench 上表现优异，中文能力强且性价比高。

DeepSeek-V3 则引发了人工智能界的震撼：

以 550 万美元和 2000 块英伟达 H800 GPU（中国市场的低配版 GPU）训练出的开源模型。
多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等顶级开源模型，与 GPT-4o 和 Claude 3.5-Sonnet 等世界顶级闭源模型不相上下，而训练后者的成本保守估计要数亿美元和几十万块最强劲的英伟达 H100。

DeepSeek 收获了广泛而真诚的赞誉，尤其是在开源社区，受到开发者的支持。

详细介绍可参考以下链接：

https://xiaohu.ai/p/7468

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景，实现沉浸式互动。?项目地址：http://vcai.mpi-inf.mpg.de/projects/holochar/?详细介绍：https://xiaohu.ai/p/74845️⃣?DeepSeek发布2360亿参数的DeepSeek-V2：-60位专家混合开源模型，数学、编码和推理表现出色。-236B参数，21B在生成过程中被激活。-在MT-Bench上表现优异，中文能力强且性价比高。?详细介绍：https://xiaohu.ai/p/74686️⃣?Google Gemini网络安全产品：-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。?详细：https://xiaohu.ai/p/74607️⃣?Wayve获超10亿美元C轮融资：-开发“驾驶GPT”基础模型，实现具身体智能自动驾驶。-使车辆在各种环境中操作，几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。?详细内容：https://xiaohu.ai/p/74538️⃣?CURE模型预测治疗结果：-利用300万患者数据进行预训练并针对特定健康状况微调。

XiaoHu.AI日报

DeepSeek 的秘方是硅谷味儿的

中国杭州的人工智能创业公司DeepSeek是近一段时间硅谷的AI研究者和开发者的心魔。它在2024年12月发布的大语言模型DeepSeek-V3被认为实现了诸多的不可能：550万美元和2000块英伟达H800 GPU（针对中国市场的低配版GPU）训练出的开源模型，多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等顶级开源模型，亦与GPT-4o和Claude 3.5-Sonnet这样世界顶级的闭源模型不相上下——而训练后者的成本保守估计也要数亿美元和几十万块最强劲的英伟达H100。可以想象它在人工智能界引发的震撼——尤其是在AI领域的研究人员、创业者、资金、算力和资源最扎堆的硅谷。不少硅谷AI领域的重要人士都不吝惜对DeepSeek的称赞，比如OpenAI联合创始人Andrej Kaparthy和Scale.ai的创始人Alexandr Wang。尽管OpenAI CEO Sam Altman发了一条疑似影射DeepSeek抄袭借鉴其它先进成果的推文（很快就被人回怼“是指把Google发明的Transformer架构拿过来用么？），但DeepSeek收获的赞誉确实是广泛而真诚的，尤其是在开源社区，开发者用脚投票。