Chat with Wiki - Deepseek最新的模型是什么

Answer

DeepSeek 最新发布的模型是 Janus-Pro，它将图像理解和生成统一在一个模型中。

Janus-Pro 是一种新型的自回归框架，通过将视觉编码解耦为独立的路径解决了先前方法的局限性，同时利用单一的统一变压器架构进行处理。解耦缓解了视觉编码器在理解和生成中的角色冲突，增强了框架的灵活性。

Janus-Pro 超越了之前的统一模型，并匹配或超过了特定任务模型的性能，其简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。

模型（7B）：https://huggingface.co/deepseek-ai/Janus-Pro-7B 模型（1B）：https://huggingface.co/deepseek-ai/Janus-Pro-1B

此外，2 月 7 日的社区动态中提到 DeepSeek 最新模型 V3 与 R1 采用混合专家（MoE）架构，显著提升计算效率，V3 引入多头潜注意力（MLA），将 KV 缓存压缩至新低，提升计算性能。R1 则通过强化学习激活推理能力，首次验证无需监督微调即可实现推理。

Content generated by AI large model, please carefully verify (powered by aily)

References

详解：DeepSeek深度推理+联网搜索目前断档第一

微信公众号：DeepSeek小红书：@DeepSeek（deepseek_ai)X(Twitter):DeepSeek(@deepseek_ai)最新消息：[DeepSeek深夜发布大一统模型Janus-Pro将图像理解和生成统一在一个模型中](https://waytoagi.feishu.cn/wiki/SneLwRmsYiUaI6kvxltcEBPPnhb)deepseek刚刚发布了新模型-一个强大的框架，它将图像理解和生成统一在一个模型中！！！上一个是智源开源的Emu3模型（7B）：https://huggingface.co/deepseek-ai/Janus-Pro-7B模型（1B）：https://huggingface.co/deepseek-ai/Janus-Pro-1BJanus-Pro是一种新型的自回归框架，它统一了多模态理解和生成。它通过将视觉编码解耦为独立的路径来解决先前方法的局限性，同时仍然利用单一的统一变压器架构进行处理。解耦不仅缓解了视觉编码器在理解和生成中的角色冲突，还增强了框架的灵活性。Janus-Pro超越了之前的统一模型，并匹配或超过了特定任务模型的性能。Janus-Pro的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。DeepSeek爆火，价格亲民却实力超群，智慧开源领航者，实时联网深度推理双冠王，用技术普惠重新定义AI边界！便宜+开源+能联网，东方神秘力量Appstore排行第一，导致算力股大跌

详解：DeepSeek深度推理+联网搜索目前断档第一

2月7日社区动态速览

《[陈巍：DeepSeek是否有国运级的创新？从V3到R1的架构创新与误传的万字长文分析（上）](https://zhuanlan.zhihu.com/p/21208287743)》DeepSeek最新模型V3与R1采用混合专家（MoE）架构，显著提升计算效率，挑战OpenAI的闭源模型。V3引入多头潜注意力（MLA），将KV缓存压缩至新低，提升计算性能。R1则通过强化学习激活推理能力，首次验证无需监督微调即可实现推理。DeepSeek正以“国运级的创新”打破算力壁垒，开启大模型新时代。《[AI「视觉图灵」时代来了！字节OmniHuman，一张图配上音频，就能直接生成视频](https://mp.weixin.qq.com/s/0OYlkcxoFvx6Z9IN-aq90w)》字节跳动推出的新技术OmniHuman，利用单张图片和音频生成生动的视频，突破了传统技术的局限。它通过多模态混合训练，解决了高质量数据稀缺的问题，实现了对任意尺寸图像的支持，生成自然的人物运动。《[甲子光年：2025 DeepSeek开启AI算法变革元年](https://waytoagi.feishu.cn/record/S5Jtrlw9neyXMccQ6CAcZsxHnXu)》DeepSeek的出现标志着算力效率拐点显现，其通过优化算法架构，显著提升了算力利用效率，打破了算力至上的传统认知。同时，AI基础大模型的参数量迎来拐点，2025年发布的大模型呈现低参数量特征，为本地化部署到AI终端运行提供了可能。此外，报告强调2025年是算法变革的元年，DeepSeek的推理模型开启了算法变革，其训练过程聚焦于强化学习，提升了模型的推理能力。