Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期之事。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,相关论文也在 AI 研究界被广泛分享和讨论。而当时在国内,DeepSeek 被描绘成“大模型价格战的发起者”。

DeepSeek 的秘方是硅谷味儿的。如果 V-3 是其 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。

在案例方面,Deepseek 的输出有诸多神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求,在简洁的提示词输入下,自然想到给输出增加文学性,展现出“高级的智能”,但存在与史实不符的商榷点。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek

第四,Deepseek这个输出结果另一个神来之笔,就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作,一下就让整个输出的画面感扑面而来,读者仿如亲历,而这完全没有在提示词中提出。(“夜风掀动案头《韩非子》,停在"夫妻者,非有骨肉之恩也"那页”)、“(墨迹在"弑"字上晕开一团)这些句子的确很难相信是AI写的。而(“忽然扔笔,抓起铜镜”)这句也隐喻了魏征的名言“以铜为镜,可以正衣襟;以史为镜,可以知兴衰;以人为镜,可以知得失”。你说这AI成精了,我都信。第五,最重要的,DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”我的输入已经非常简洁了,不能再压缩了,并且没有任何形容词,没有任何倾向性。但神奇的是,它显然知道我要什么,比如这当然不是一个要求精确的数理题,它自然想到要给输出加上文学性,这种预判在很大程度上表现出了“高级的智能”。当然,一个值得商榷的点是,根据史实,魏征是在玄武门之变之后才见到李世民

Others are asking
deepseek的使用方法
以下是 DeepSeek 的使用方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 操作步骤: 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 3. 特点与优势: 核心是推理型大模型,不需要用户提供详细的步骤指令,而是通过理解用户的真实需求和场景来提供答案。 能够理解用户用“人话”表达的需求,不需要用户学习和使用特定的提示词模板。 在回答问题时能够进行深度思考,不是简单地罗列信息。 可以模仿不同作家的文风进行写作,适用于多种文体和场景。 4. 更多提示词技巧请查看
2025-02-07
deepseek与其他大模型有什么区别
DeepSeek 与其他大模型的区别主要体现在以下几个方面: 1. 模型类型:DeepSeek 是推理型大模型,与指令型大模型不同,不需要用户提供详细步骤指令,而是通过理解用户真实需求和场景提供答案。 2. 语言理解:能够理解用户用“人话”表达的需求,不需要用户学习和使用特定提示词模板。 3. 思考深度:在回答问题时能够进行深度思考,而非简单罗列信息。 4. 文风转换:可以模仿不同作家的文风进行写作,适用于多种文体和场景。 5. 技术路线:DeepSeek R1 与 OpenAI 现在最先进的模型 o1、o3 同属于基于强化学习 RL 的推理模型,在回答用户问题前会先进行“自问自答”式的推理思考,提升最终回答质量。 6. 发展路径:从一开始,DeepSeek 与国内诸多大模型新秀选择的不是同一个战场。它不拿融资,不抢座次,不比国内舆论声势,不搞产品投放投流,而是选择走全球开源社区,分享直接的模型、研究方法和成果,吸引反馈,再迭代优化。开源彻底,包括模型权重、数据集、预训练方法和高质量论文。
2025-02-07
deepseek学习资料
以下是关于 DeepSeek 的学习资料: 2025 年 2 月 6 日的智能纪要中,分享了 DP 模型的使用,其功能包括自然语言理解与分析、编程、绘图等。使用优势是能用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容,但存在思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本的问题。审核方法可以用其他大模型来解读其给出的内容。使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。使用场景包括阅读、育儿、写作、随意交流等方面,还有案例展示,如与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互。此外,还分享了音系学和与大模型互动的内容,如通过对比不同模型的回答来深入理解音系学,与大模型进行多轮对话来取队名。DeepSeek 的相关文档在 3 群和 4 群有分享,也可在 v to a gi 的飞书知识库中搜索获取,介绍了 DeepSeek 的模型、收录内容、提示词使用技巧和好玩的案例等,未来活动预告有明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek。 1 月 27 日的宝玉日报中,包括拾象关于 DeepSeek r1 闭门学习讨论,讨论了其在全球 AI 社区的意义,如技术突破与资源分配策略,突出了长上下文能力、量化商业模式及对 AI 生态系统的影响,分析了创新路径及中国在 AI 追赶中的潜力与挑战。还有转关于 DeepSeek 的研究和思考,深入解析其在架构和工程上的创新,如 MoE、MLA、MTP 和 FP8 混合精度训练,强调不是简单模仿,对开源与闭源竞争进行了反思,并指出 AI 生态未来发展方向。 非技术人角度的研究总结,主要围绕天才养成记、“填鸭”之困、自学成才、纯强化学习等话题,力求帮助非技术读者深度理解 Deepseek R1,更好开展工作与生活。
2025-02-07
未来类似deepseek这种推理大模型普及,结构化提示词是不是会成为过时的知识
未来类似 DeepSeek 这种推理大模型普及,结构化提示词不会成为过时的知识。 虽然未来模型可能在某些情况下无需提示词,仅通过简单对话就能理解用户意图,但基础的如何与模型对话的认知仍需具备,这就涉及提示词。例如李继刚老师的结构化提示词能让模型给出更优质、完整的答案。操作过程中有很多有意思的提示词,如“酷老师”“抬杠高手”等,近期提示词有升级,李继刚老师将其玩到新高度,cloud 等大语言模型可直接显示编译结果内容。输入特定提示词可生成卡片,小创业项目可利用并改变提示词形成独到见解或小应用。 从工程视角看,AI 提示词在游戏创作及优化中也有应用。此外,提示工程的本质是提供足够的信息来明确指定要求,即使模型在理解上下文方面变得更好,能够清晰地陈述目标始终很重要,仍需要明确预期结果的能力和技巧。未来可能会更多地利用提示工程来让模型为我们生成、调整提示词,对于没有太多提示工程经验的人来说,提示词生成器可以帮助他们。未来的提示可能更像是一种自省,模型会尝试理解用户真正在思考什么、需要什么。 在 R1 时代,使用 AI 提示词的关键在于提供足够的背景信息,而非复杂的结构。简单大白话仍然有效,但信息量不足则难以得到理想结果。示例和框架可帮助理清思路,但最终影响在于用户的思考和表达。利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考,从而激发更高的创意和效果。“有用的不是技巧,而是你的思考!”
2025-02-07
我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。
以下是关于 DeepSeekR1 提示词的相关信息: 历史更新: 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。 DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。 提示词方法论: 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出。 高级调试策略:包括模糊指令优化、迭代优化法。 行业应用案例:涵盖技术开发场景、商业分析场景。 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。 在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。
2025-02-07
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷风格: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方只是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试并对比。 使用方法:包括搜索 www.deepseek.com 点击“开始对话”、发送装有提示词的代码、阅读开场白后正式开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并存储在文件,实现多种功能优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-07