以下是关于学习 DeepSeek 的一些内容:
相关讨论和研究:包括 DeepSeek 在全球 AI 社区的意义、技术突破、资源分配策略、长上下文能力、量化商业模式以及对 AI 生态系统的影响,还有其在架构和工程上的创新,如 MoE、MLA、MTP 和 FP8 混合精度训练等。您可以通过以下链接获取详细信息:
核心原理认知:
多模态理解:支持文本/代码/数学公式混合输入。
动态上下文:对话式连续记忆(约 4K tokens 上下文窗口)。
任务适应性:可切换创意生成/逻辑推理/数据分析模式。
系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。
基础指令框架:
不知道如何表达时可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。
进阶控制技巧:
思维链引导:分步标记法、苏格拉底式追问。
知识库调用:领域限定指令、文献引用模式。
多模态输出。
提示词使用:
效果对比:可通过 Coze 做小测试对比。
使用方法:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。
设计思路:将 Agent 封装成 Prompt 并储存在文件,实现同时使用联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定。
完整提示词:v 1.3
特别鸣谢:李继刚、Thinking Claude、Claude 3.5 Sonnet 等为相关工作提供了帮助和灵感。
2025-02-05