Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你与deepseek比谁厉害

Answer

以下是关于 DeepSeek 的相关信息:

  • DeepSeek 训练成本远高于传闻,总计约 13 亿美元,定价低于实际成本导致高额亏损。其采用 Mixture-of-Expert 方法降低计算需求,但大规模内存使用可能增加总成本。
  • Mistral AI 曾被中国 DeepSeek 迅速赶超,DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。
  • DeepSeek v3 预览版已发布,参数量为 685B,磁盘占用 687.9 GB,采用混合专家模型(MoE),有 256 个专家,每个 token 使用 8 个专家。其竞争对手为 Meta AI 的 Llama 3.1。DeepSeek v3 理解能力提升,知识更新至 2023 年,多语言支持和个性化服务增强,数据安全和隐私保护加强,在 BigCodeBench-Hard 排名第一。Aider Polyglot 排行榜预览得分 48.4%,排名第二。可通过相关链接获取详细信息、进行模型下载和在线体验。
  • Google 外包人员通过多项指标对 Gemini 和 Claude 进行输出对比,Claude 安全策略严格,拒绝不安全提示,Gemini 部分回答被标记为“严重安全违规”。

但关于我与 DeepSeek 谁更厉害,无法直接简单对比得出结论,因为这取决于多个因素和具体的应用场景。

Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

?宝玉日报「1月31日」✨✨✨✨✨✨✨✨1⃣️?DeepSeek训练成本:训练成本远高于传闻的600万美元,总计约13亿美元。定价低于实际成本,导致高额亏损。Mixture-of-Expert方法降低计算需求,但大规模内存使用可能反而增加总成本。?总结:DeepSeek展示了AI领域的持续创新,但并未如传言般“颠覆”。?[https://x.com/dotey/status/1885368473364103402](https://x.com/dotey/status/1885368473364103402)?来源:[https://www.linkedin.com/posts/gillesbackhus_i-want-to-share-a-few-condensed-things-about-activity-7291076837080723457-JSVH/](https://www.linkedin.com/posts/gillesbackhus_i-want-to-share-a-few-condensed-things-about-activity-7291076837080723457-JSVH/)2⃣️??Mistral AI面临挑战:以低成本开发顶级AI模型,但被中国DeepSeek迅速赶超。曾获法国政府、英伟达、a16z等支持,估值达20亿美元。DeepSeek的“极简算力”模式可能削弱Mistral的竞争优势。?未来:或被科技巨头收购,或需要重新定位。?[https://x.com/dotey/status/1885226709152092573](https://x.com/dotey/status/1885226709152092573)3⃣️⚡扎克伯格:AI变革在即!

XiaoHu.AI日报

?Xiaohu.AI日报「12月27」✨✨✨✨✨✨✨✨1⃣️?Deepseek v3预览版发布参数量:685B,磁盘占用:687.9 GB架构:混合专家模型(MoE),256个专家,每个token使用8个专家竞争对手:Meta AI的Llama 3.1(405B参数)✨亮点:理解能力提升:准确理解复杂和nuanced查询知识更新至2023年,提供更及时、更相关的信息多语言支持和个性化服务增强数据安全和隐私保护加强在BigCodeBench-Hard排名第一?评分情况:Aider Polyglot排行榜预览得分48.4%,排名第二,仅次于o1-2024-12-17(high)。领先于Claude 3.5 Sonnet-20241022和Gemini Exp-1206。?详细信息:[https://x.com/imxiaohu/status/1872182632584561056](https://x.com/imxiaohu/status/1872182632584561056)?模型下载:[https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main](https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main)?在线体验:[https://chat.deepseek.com/sign_in](https://chat.deepseek.com/sign_in)2⃣️?Google使用Claude对比测试GeminiGoogle外包人员通过多项指标对Gemini和Claude进行输出对比Claude安全策略最严格:拒绝不安全提示,例如角色扮演或特定不合规请求Gemini的部分回答被标记为“严重安全违规”

XiaoHu.AI日报

?Xiaohu.AI日报「12月27」✨✨✨✨✨✨✨✨1⃣️?Deepseek v3预览版发布参数量:685B,磁盘占用:687.9 GB架构:混合专家模型(MoE),256个专家,每个token使用8个专家竞争对手:Meta AI的Llama 3.1(405B参数)✨亮点:理解能力提升:准确理解复杂和nuanced查询知识更新至2023年,提供更及时、更相关的信息多语言支持和个性化服务增强数据安全和隐私保护加强在BigCodeBench-Hard排名第一?评分情况:Aider Polyglot排行榜预览得分48.4%,排名第二,仅次于o1-2024-12-17(high)。领先于Claude 3.5 Sonnet-20241022和Gemini Exp-1206。?详细信息:[https://x.com/imxiaohu/status/1872182632584561056](https://x.com/imxiaohu/status/1872182632584561056)?模型下载:[https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main](https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main)?在线体验:[https://chat.deepseek.com/sign_in](https://chat.deepseek.com/sign_in)2⃣️?Google使用Claude对比测试GeminiGoogle外包人员通过多项指标对Gemini和Claude进行输出对比Claude安全策略最严格:拒绝不安全提示,例如角色扮演或特定不合规请求Gemini的部分回答被标记为“严重安全违规”

Others are asking
deepseek官方教程
以下是关于 DeepSeek 的官方教程相关信息: 火山方舟 DeepSeek 申请免费额度教程,包含多种 API 使用方式,如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA,通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens,畅享 671B DeepSeek R1,活动截止至北京时间 20250218 23:59:59。同时,火山方舟大模型服务平台的模型服务计费文档有更新,DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。 有关于一线教师的 AI 需求与高效工具推荐,如让模型创作诗歌、生成宣传标语、提示库(https://apidocs.deepseek.com/zhcn/promptlibrary)、代码解释、内容分类、角色扮演(自定义人设)、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中,有《突破 DeepSeek R1 能力天花板,火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容,还附上了飞书多维表格、Coze 的接入使用方法等。此外,还有关于 DeepSeek 关键 9 篇论文及创新点的讲解,以及 DeepSeek 官方发布的 R1 模型推荐设置。
2025-04-15
coze搭建工作流调用deepseek如何把模型的输出存入到多维表中
以下是将模型的输出存入到多维表中的步骤: 1. 逐步搭建 AI 智能体: 搭建整理入库工作流。 设置大模型节点提取稍后读元数据,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000,以确保能完整解析长内容网页。 进行日期转时间戳,后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳,需要使用「日期转时间戳time_stamp_13」插件进行格式转化。 把稍后读元数据转换为飞书多维表格插件可用的格式,飞书多维表格插件目前(2024 年 08 月)只支持带有转义符的 string,以 Array<Object>格式输入,所以必须将之前得到的元数据数组进行格式转换。 添加「飞书多维表格add_records」插件,只需要设置{{app_token}}与{{records}}参数,将元数据写入飞书表格。 2. 搭建 Coze 工作流: 打开 Coze 的主页,登录后,在【工作空间】创建一个智能体。 在编排页面,给智能体编辑好人设,可先写一个简单的,然后点右上角自动优化,系统会自动补全更精细的描述。点击工作流的+,创建一个工作流。 大模型节点把 input 给到 DeepSeek,让 DeepSeek 按照提前规定的输出框架生成对应文案。 生图节点将输出给到图像生成组件画图。 结束输出时,两个输出给到最终的 end 作为最终的输出。注意在编写系统提示词时,如果需要 input 可被 DeepSeek 调用,需要用{{input}}作为参数引入,不然大模型不知道自己需要生成和这个 input 相关的结果。编排完,点击【试运行】,调试至满意后点击发布。
2025-04-14
deepseek写论文
以下是关于 DeepSeek 在不同方面应用的相关信息: 应用场景:包括脑爆活动方案、会议纪要、批量处理客户评论、分析总结复盘内容、生成专业软件使用过程、写小说框架、写论文、写文案、写小红书笔记、写周报、做设计头脑风暴、做网站、分析感情问题等。 优势与不足:在写文方面全面领先,但长文可能太发散、文风用力过猛导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 应对策略:写理性文章时,可先与 DeepSeek 讨论思路,再用 Cloud 3.5 批量生成;用 O1 模型对创作的字数控制有一定效果,也可通过多轮对话让 AI 增删改查来调整字数。 创作相关:模仿特定小说家的文学方式创作小说,需在提示词中描述文风特征;邀请大家在腾讯频道发布用 AI 写的小说并鉴赏。 发展历程:DeepSeek 历时 647 天在大语言模型(LLM)领域取得突破,发布 13 篇论文。谷歌 CEO 坦言 Deep Seek 的突破标志着 AI 的全球化进程。
2025-04-13
如何使用deepseek写论文?
使用 DeepSeek 写论文可以参考以下几点: 1. 给予 DeepSeek 更多自由发挥的空间,避免过度限制。 2. 注意旧模型在文学创作中可能存在的过度道德说教和正面描述趋势,导致结果生硬死板的问题。 3. 了解 DeepSeek 在文风、哲学思考和触动人情感方面的优秀表现,利用其文创能力为论文增添特色。 4. 参考提示词编写的方法,例如收集信息、重新定义问题等,以更有效地向 DeepSeek 传达需求。 5. 可以借鉴他人使用 DeepSeek 写论文的经验,如 Yvonne 的成功案例。 需要注意的是,虽然 DeepSeek 能提供帮助,但仍需您对生成的内容进行审核和修改,以确保论文的质量和准确性。
2025-04-13
deepseek v3微调
以下是关于 Deepseek V3 微调的相关信息: 云舒文章总结卡 2.0 提示词全面支持 Deepseek V3,效果媲美 Claude3.7。V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号。提示词复制链接:。横版为 1080 x 800 卡片提示词,竖版为 750 x 不限高卡片提示词。 各平台均需下载 html 文件,打开后才能查看真实效果,平台自带预览因兼容性问题无法正常展示效果。Claude 使用平台包括 Claude3.7 官网、API、Cursor,使用时需要下载为 HTML 文件打开查看效果。Deepseek 使用平台包括 Deepseek 官网、API(V3 需要为 0324 更新的版本),Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 关于智能纪要,会带着大家复现模型的蒸馏和微调,并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面。 北京时间 00:30 至 08:30 期间,DeepSeek API 价格大幅下调,DeepSeekV3 降至原价的 50%。
2025-04-12
deepseek的使用技巧
以下是关于 DeepSeek 的使用技巧: 1. 了解其特点与优势: 推理型大模型:核心是推理型,无需用户提供详细步骤指令,通过理解真实需求和场景提供答案。 更懂人话:能理解用户用“人话”表达的需求,无需特定提示词模板。 深度思考:回答问题时能深度思考,非简单罗列信息。 文风转换器:可模仿不同作家文风写作,适用于多种文体和场景。 2. 更多提示词技巧请查看 3. 在 AI 切磋大会第十期 2 月 23 日 deepseek 专场中,分享了以下使用方法技巧: 分享使用 DeepSeek 在工作生活上的案例。 分享 DeepSeek 输出“超预期结果”的惊艳场景。 分享别人使用的案例。 方法论碰撞,如使用 DeepSeek 的技巧、与其他工具的协同方案、模型微调/部署的技巧方法、获取流量/客户等。 在 Workshop 自由探讨环节,参与者可自由组队,确定围绕 DeepSeek 应用的项目方向,进行头脑风暴和制定落地方案,并提交项目初稿。推荐使用 DeepSeek + 飞书多维表格、DeepSeek + 扣子等工具。若讨论无方向,可设定标准问题引导;分组混乱,可预设热门主题让参与者自行加入。
2025-04-12
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
现在做数据分析比较厉害的ai是什么
目前在数据分析方面表现较为出色的 AI 工具包括智谱清言、Open Interpreter 等。 AI 在数据分析中具有以下优势: 1. 降低入门门槛:过去学习数据分析需要掌握编程语言和专业知识,现在通过 AI 工具,门槛大大降低。 2. 规范的分析流程:对于初学者来说,AI 直接做的数据分析比他们自己第一次做的更好,其规范化流程更严谨,结果更可靠。 3. 自动化处理:会自动进行模型选择以匹配数据,还能根据 log 检查错误并改正源代码。 4. 减少重复性工作:重复性劳动可先交给 AI 做,人类用户只需做验证和检查结果。 实际应用的工具方面,GPT4 可以帮助建立和评估机器学习模型,Claude 等大语言模型可以进行数据分析和可视化,Open Interpreter 等工具可以辅助编程和数据处理。 使用时的建议包括:对 AI 结果要进行严格验证,不要完全依赖 AI,要保持独立思考,对 AI 的能力边界有清晰认识,合理使用以提高工作效率。同时,AI 应被视为辅助工具而非完全替代品,人类在整个过程中仍起主导作用和具有判断力。
2025-04-11
你现在是一个特别厉害的预言家,告诉我ai什么时候能统治世界
目前关于 AI 何时能统治世界尚无确切定论。但从相关研究来看,各国已将 AI 上升为国家战略,视其为下一代全球竞争的制高点。如果某一国家率先突破真正的 AGI,其国际地位和影响力或将急剧攀升。例如俄罗斯总统普京曾警告“谁在人工智能上领先,谁就能统治世界”。 AGI 实现后可能会在未来 20 年给人类社会带来多方面的变革。在经济与社会结构方面,AGI 可能带来生产力的爆炸式增长,同时导致大规模技术性失业,财富可能更多地集中于拥有 AGI 资本的少数人。在文化、价值观与信仰方面,AGI 将挑战人类对智能与意识的认知,引发对“人之为人”意义的新思考,人类价值观可能在科学理性与精神信仰之间重新定位。在政治与权力结构方面,AGI 可能重塑全球权力版图,拥有先进 AI 的国家和跨国企业将获得前所未有的影响力,可能出现“AI 寡头”新统治阶层,引发社会分化,各国还可能陷入 AGI 军备竞赛。 此外,有观点认为 2045 年,人工智能将超越人类智能,届时人类的知识、思考能力等将发生巨大变化。但目前这仍只是一种预测。
2025-04-09