Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。

Answer

以下是关于 DeepSeek-R1 提示词的相关信息:

  • 历史更新:
    • 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。
    • DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。
  • 提示词方法论:
    • 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。
    • 基础指令框架:包括四要素模板、格式控制语法等。
    • 进阶控制技巧:如思维链引导、知识库调用、多模态输出。
    • 高级调试策略:包括模糊指令优化、迭代优化法。
    • 行业应用案例:涵盖技术开发场景、商业分析场景。
    • 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。
    • 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。

在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

4.4 历史更新

《[AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频](https://mp.weixin.qq.com/s/0OYlkcxoFvx6Z9IN-aq90w)》字节跳动推出的新技术OmniHuman,利用单张图片和音频生成生动的视频,突破了传统技术的局限。它通过多模态混合训练,解决了高质量数据稀缺的问题,实现了对任意尺寸图像的支持,生成自然的人物运动。《[甲子光年:2025 DeepSeek开启AI算法变革元年](https://waytoagi.feishu.cn/record/S5Jtrlw9neyXMccQ6CAcZsxHnXu)》DeepSeek的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。同时,AI基础大模型的参数量迎来拐点,2025年发布的大模型呈现低参数量特征,为本地化部署到AI终端运行提供了可能。此外,报告强调2025年是算法变革的元年,DeepSeek的推理模型开启了算法变革,其训练过程聚焦于强化学习,提升了模型的推理能力。《[R1之后,提示词技巧的变与不变](https://mp.weixin.qq.com/s/-51tjTWRdi19sEBCQMe1sw)》在R1时代,使用AI提示词的关键在于提供足够的背景信息,而非复杂的结构。简单大白话仍然有效,但信息量不足则难以得到理想结果。示例和框架可帮助理清思路,但最终影响在于你的思考和表达。利用乔哈里视窗分析信息需求,避免过度指令化,让AI自由思考,从而激发更高的创意和效果。“有用的不是技巧,而是你的思考!”

DeepSeek 提示词方法论

1.AI特性定位多模态理解:支持文本/代码/数学公式混合输入动态上下文:对话式连续记忆(约4K tokens上下文窗口)任务适应性:可切换创意生成/逻辑推理/数据分析模式1.系统响应机制采用意图识别+内容生成双通道处理自动检测prompt中的:任务类型/输出格式/知识范围反馈敏感度:对位置权重(开头/结尾)、符号强调敏感[heading2]二、基础指令框架[content]如果不知道如何表达,还是可以套用框架指令[heading3]1.四要素模板[content]示例:[heading3]2.格式控制语法[content]强制结构:使用```包裹格式要求占位符标记:用{{}}标注需填充内容xq优先级符号:>表示关键要求,!表示禁止项示例:[heading2]三、进阶控制技巧[heading3]1.思维链引导[content]分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差[heading3]2.知识库调用[content]领域限定指令:基于2023版中国药典,说明头孢类药物的配伍禁忌文献引用模式:以Nature 2022年发表的论文为参考,解释CRISPR-Cas9最新突破[heading3]3.多模态输出

DeepSeek 提示词方法论

虽然R1推理能力比较强,有些你想表达的不一定完全与模型吻合,因此建议可以多加清晰指令[heading3]1.模糊指令优化[content]|问题类型|修正方案|示例对比||-|-|-||宽泛需求|添加维度约束|原句:"写小说"→修正:"创作以AI觉醒为背景的悬疑短篇,采用多视角叙事结构"||主观表述|量化标准|原句:"写得专业些"→修正:"符合IEEE论文格式,包含5项以上行业数据引用"|[heading3]2.迭代优化法[content]1.首轮生成:获取基础内容2.特征强化:请加强第三段的技术细节描述3.风格调整:改用学术会议报告语气,添加结论部分4.最终校验:检查时间逻辑一致性,列出可能的事实性错误[heading2]五、行业应用案例[heading3]1.技术开发场景[heading3]2.商业分析场景[heading2]六、异常处理方案[content]信息幻觉:追加请标注所有不确定陈述,并提供验证方法格式偏离:使用严格遵循以下模板:第一行...第二行...深度不足:触发请继续扩展第三章节内容,添加案例佐证[heading2]七、效能监测指标[content]1.首次响应准确率:目标>75%2.多轮对话效率:问题解决平均轮次<33.复杂任务分解:支持5级子任务嵌套

Others are asking
有关 ai agent 的科普文章
以下是为您提供的关于 AI Agent 的科普内容: AI Agent 是一个融合了多学科精髓的综合实体,包括语言学、心理学、神经学、逻辑学、社会科学和计算机科学等。它不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。 目前,关于 AI Agent 存在一些情况。例如,网络上对其的介绍往往晦涩难懂,让人感觉神秘莫测,其自主性、学习能力、推理能力等核心概念,以及如何规划和执行任务、理解并处理信息等方面,都像是笼罩在一层神秘面纱之下。 另外,以国与国之间的外交为例来解释相关协议。假设每个 AI 智能体(Agent)就是一个小国家,它们各自有自己的语言和规矩。各国大使馆试图互相沟通、做生意、交换情报,但现实中存在诸多问题,如协议各异、要求不同等。 如果您想了解更多关于 AI Agent 的详细内容,可访问: 。
2025-04-15
AI通识科普文章
以下是为您提供的 AI 通识科普相关内容: 对于对 AI 都没太多概念的纯纯小白: 现有常见 AI 工具小白扫盲:(1 小时 32 分开始)。 AI 常见名词、缩写解释: 。 新手学习 AI 的步骤: 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程按照自己的节奏学习,并有机会获得证书。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 入门经典必读:作者为 。文中提到人工智能的研究正在以指数级别的速度增长,对于初学者来说跟上新发布的内容很难,因此分享了一份用于更深入了解现代 AI 的精选资源列表,称为“AI 典藏”,包括对 Transformer 和 Latent Diffusion 模型的介绍、技术学习资源、构建大型语言模型的实用指南、AI 市场的分析以及里程碑式研究成果的参考列表等。
2025-04-14
自媒体文章创作提示词教学
以下是关于自媒体文章创作提示词教学的相关内容: 一、宝玉日报中的提示词教学 1. 提示词四要素包括指令、上下文、输出格式、角色。明确表达需求,学会结构化 Prompt,能让 AI 效果立竿见影。 2. 相关链接: 二、工具教程:清影中的提示词优化原则 1. 强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。 2. 聚焦出现内容:尽量让提示集中在场景中应该出现的内容上。 3. 规避负面效果:在提示词中写明不需要的效果,保障视频生成质量。 写提示词的步骤: 1. 明确场景中的人物和冲突,这是推动场景发展的关键因素。 2. 对场景进行详细描述,包括地点、人物形象、任务动作等细节,使用生动的动词营造动态和戏剧化氛围。 3. 加强镜头语言,常用的镜头运动包括推、拉、摇、移、升、降等,每种镜头运动都有其特定作用和效果。 三、关于律师如何写好提示词用好 AI 1. 第一部分:说清楚本文要解决的问题、问题的背景以及可能导致的损失。 2. 第二部分:以案例引入,案例需改写自【基础材料】的【类案参考】部分,包括案号、案件事实经过、法院裁判结果、关键依据等与文章有关的要点。 3. 第三部分:对案例进行进一步分析,写明需要注意的关键点,分析可改写自【基础材料】的【问答结果及分析】部分,这部分不要给建议。 4. 第四部分:给出具体的操作建议,分为事前应注意事项、事中需要注意留存的证据、事后可以采取的补救措施三个部分,每个部分分别给出三条清晰具体的建议。 5. 第五部分:结语及对于本文作者的宣传。 文章结构要点: 1. 定义身份(边界),整体流程和所需资源描述。 2. 对所需资源及如何使用进行描述。 3. 对最终输出的结果进行描述。 注意事项: 1. 所有结论均应有相对应的案例基础,不能违反法律规定,不能编造。 2. 文字需要简练精准,有足够的信息密度,给出的建议必需具体细致且易于操作。
2025-04-12
文章AI度检测
文章原创度检测通常包括以下两大步骤: 1. 从互联网或文章库中定位相似内容: 将文章细分为小句或段落,便于逐个对照。 从每个细分内容中提炼关键词或词组,在网络或专业数据库中搜寻可能的相似内容。 2. 评估文章与搜索出的内容的相似程度评估原创度。 此外,文中还提到了一种将文章手搓成 Token 炸弹的有趣玩法,包括编码和解码的方法。例如,在特定网站进行操作,将按钮切换到“Decode”可解码,切换到“Encode”可编码,输入隐藏信息并选择表情或字母,然后复制生成的内容。由于 Unicode 的特性,隐藏信息跨平台时不会被格式化,但在微信发送时有 1.5 万个 token 左右的极限值,超过则无法发送。在爬虫和不同系统中也有不同的表现,如在 Windows 系统导出 txt 文件会出现乱码,而在 Mac 系统打开则基本正常。这种 Token 炸弹玩法还可以用于躲避信息审核员、传输信息或当作数字水印。
2025-04-12
文章配图的智能体或者软件
以下是为您整理的关于文章配图的智能体或软件的相关内容: 在《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》中提到,智能时代,智能应用会从有形界面消失,变成无所不在的助理或智能体,辅助甚至直接完成任务。文中还配有图 2.10:智能代理将改变企业组织架构。 在《XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路》中,个人实操案例部分提到为本篇文章配图的相关情况,但生成结果显示问题描述不够清楚。之后换提示词“那你给我生成搞笑图片吧,让人一看就有继续看下去的动力那种,需要一张公众号封面和一张配图”,得到了相应结果。同样的提示词,元器某应用也有生成。此外,文中还提到在搭建 bot 过程中存在工作流未成功触发导致访谈记录未成功存储入库的问题。
2025-04-11
文章风格提取
以下是关于文章风格提取的相关内容: 该提示词用于抽取不同风格文章的核心要素,抽取到的字段可作为 prompt,结合指定主题进行风格迁移。整体创作思路见文末 PDF。 具体使用方法为:拷贝文章风格提取提示词,输入给任意大模型,随后提供要抽取的文本。 已抽取的一些风格参考包括万维钢风格、史铁生《我与地坛》文风、李娟《我的阿勒泰》文风、许倬云《说中国》文风、鲁迅《狂人日记》文风、王小波《万寿寺》文风、飞书多维表格工作流自动化抽取等。 使用 DeepSeek V3 进行实验时,智能体地址为 https://www.coze.cn/s/VM9pUn9HdmA/ 。初级使用方法是输入公众号文章标题或内容,智能体会自动提取相关信息,默认风格是“炫彩”。高级使用方法需按照要求输入几个要素,如标题、副标题、分享封面、标签、风格等。
2025-04-11
我公司想部署一个deepseek-R1,用云服务器请问大概需要多少钱?
部署 DeepSeekR1 模型使用云服务器的价格因云计算厂商而异: 华为昇腾社区:部署 DeepSeekR1 模型用 BF16 权重进行推理至少需要 4 台 Atlas 800I A2(864G)服务器,用 W8A8 量化权重进行推理则至少需要 2 台 Atlas 800I A2。服务器调用 Docker 下载部署权重资源,非 API 调用模式。 阿里云(人工智能平台 PAI):以 R1 为例,所需计算资源价格 316.25/小时。模型部署成在线服务,在人工智能平台 PAI 下的模型部署下的模型在线服务 EAS。 阿里云(阿里云百炼):免费额度:10000000/10000000,通过 API 调用。 腾讯云(自建服务器):多机分布式部署,节点数量:2 个,单节点配置:HCCPNV6 机型,可在线体验(需开通 T1 平台服务)。 腾讯云(调用 API):API 调用 DeepSeek 系列模型限时免费。即日起至北京时间 2025 年 2 月 25 日 23:59:59,所有腾讯云用户均可享受 DeepSeekV3、DeepSeekR1 模型限时免费服务,单账号限制接口并发上限为 5。在此之后,模型价格将恢复至原价。 京东云:“deepseekr1:1.5b、“deepseekr1:7b”、“deepseekr1:32b”,1.89/小时起;服务器部署的方式。 gitee ai:R1 价格 0.1 元/次,基于沐曦曦云 GPU 及曦源一号国产替代算力集群,有在线体验。 需要注意的是,价格可能会有所变动,具体以各云计算厂商的最新公布为准。
2025-03-25
DeepSeek R1卡顿如何解决
以下是解决 DeepSeek R1 卡顿的方法: 1. 拥有扣子专业版账号:如果您还是普通账号,请自行升级或注册专业号后使用。 2. 开通 DeepSeek R1 大模型: 访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze 打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务。 添加在线推理模型,添加后在扣子开发平台才能使用。 3. 创建智能体:点击创建,先完成一个智能体的创建。 4. 创建工作流: 创建一个对话流,命名为 r1_with_net。 开始节点,直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek,输入包括搜索结果和开始节点的 USER_INPUT,开启对话历史并设置 10 轮。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。 测试并发布工作流:输入测试问题,测试完成后直接发布工作流。 此外,您还可以通过以下途径获取更多相关信息: 1. 2 月 14 日 8 点直播进行中:火山引擎解决方案专家带大家在 Coze 搭建满血版 R1 bot,飞书会议直播结束,回放看: 2. 学习文档: 3. 模板更新了:
2025-03-20
我想从Nanobrowser里植入DeepSeek的R1模型,来让它帮我做网页搜索之类的工作,我该怎么做,给出详细教程
以下是从 Nanobrowser 里植入 DeepSeek 的 R1 模型来进行网页搜索的详细教程: 1. 阿里云百炼平台相关: 模型广场:百炼平台的模型广场有各种模型,包括音频理解、视频理解等,通义的一些强模型也在其中。 无需部署:百炼平台无需部署,可直接使用 Deepseek R1 模型。 价格与免费额度:Deepseek R1 模型价格与各大平台差不多,有大量免费额度,如 100 万 token,不同版本的模型如 7B、14B、32B 等也送了 100 万 token,LLAVA 限时免费。 授权与实名认证:使用 Deepseek R1 模型需要解锁和授权,没有授权按钮的需要对阿里云进行实名认证,可通过支付宝扫码或在右上角头像处进行,共学群里有相关指引。 模型效果对比:在首页体验模型页面可对比不同模型的效果,如 V3 和 R1,R1 会先思考,速度较快。 多模态能力:多模态可以识别更多输入信息,如读文件、图片等,而 Deepseek R1 本身不是多模态模型。 连接 Chat Box:通过模型广场的 API 调用示例获取链接,截断后粘贴到 Chat Box 的设置中,添加自定义提供方,设置模型名称为 Deepseek R1,并获取 API key。 API key 重置:可删除旧的 API key 并重新创建,方便本地软件连接。 2. 工作流创建: 创建一个对话流,命名为 r1_with_net。 开始节点,直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek(即火山方舟里配置的 DeepSeek R1 模型),输入包括搜索结果(选择搜索节点 data 下的 webPages)和开始节点的 USER_INPUT,开启对话历史,设置 10 轮,默认不开启对话历史,开启后默认是 3 轮,系统提示词不需要输入,用户提示词为空。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。测试完成后,直接发布工作流。 3. 网页聊天相关: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL 为 https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 打开联网功能,支持联网搜索使用 R1。
2025-03-20
以DeepSeek R1为代表的推理模型,与此前模型(如 ChatGPT-4、Claude 3.5 sonnet、豆包、通义等)的差异点主要在于
以 DeepSeek R1 为代表的推理模型与此前模型(如 ChatGPT4、Claude 3.5 sonnet、豆包、通义等)的差异点主要在于: 1. 技术路线:DeepSeek R1 与 OpenAI 现在最先进的模型 o1、o3 一样,属于基于强化学习 RL 的推理模型。 2. 思考方式:在回答用户问题前,R1 会先进行“自问自答”式的推理思考,模拟人类的深度思考,从用户初始问题出发,唤醒所需的推理逻辑与知识,进行多步推导,提升最终回答的质量。 3. 训练方式:在其他模型还在接受“填鸭式教育”时,DeepSeek R1 已率先进入“自学成才”的新阶段。 4. 模型制作:R1 是原生通过强化学习训练出的模型,而蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。此外,DeepSeek R1 还能反过来蒸馏数据微调其他模型,形成互相帮助的局面。 5. 与 Claude 3.7 Sonnet 相比,Claude 3.7 Sonnet 在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色,扩展思考模式在数学和科学领域带来显著提升,在某些方面与 DeepSeek R1 各有优劣。
2025-03-19
我想在飞书云中用DeepSeek-R1模型提取链接中的信息,请问如何写指令呢?我刚刚进行了尝试,发现提取出的信息和我点开链接看到的信息不一致,这个问题又该如何解决呢?
在飞书云中使用 DeepSeekR1 模型提取链接中的信息并解决提取信息不一致的问题,您可以参考以下内容: 对于指令编写: 虽然 R1 推理能力较强,但您想表达的不一定完全与模型吻合,因此建议多加清晰指令。 模糊指令优化方面,比如对于宽泛需求可添加维度约束,如原句“写小说”可修正为“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;对于主观表述可量化标准,如原句“写得专业些”可修正为“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 迭代优化法包括首轮生成获取基础内容、特征强化(如加强第三段的技术细节描述)、风格调整(如改用学术会议报告语气,添加结论部分)、最终校验(检查时间逻辑一致性,列出可能的事实性错误)。 对于提取信息不一致的问题: 信息幻觉:追加请标注所有不确定陈述,并提供验证方法。 格式偏离:使用严格遵循以下模板:第一行...第二行... 深度不足:触发请继续扩展第三章节内容,添加案例佐证。 另外,关于获取字节火山 DeepSeek 系列 API 完整教程及使用方法: 1. 注册并登录火山引擎,点击立即体验进入控制台。 2. 创建一个接入点,点击在线推理创建推理接入点。 3. 为接入点命名为 DeepSeekR1。 4. 若有提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 5. 确认无误后,点击“确认接入”按钮。 6. 自动返回创建页面,复制多出的接入点名为“DeepSeekR1”的推理点 ID 并保存。 7. 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。 8. 若已有 API key 直接查看并复制,没有则点击【创建 API key】。 9. 复制并保存好 API key。 在实现新闻播报自动化工作流方面: 第一步是内容获取,输入新闻链接,系统自动提取核心内容。开始节点的入参包括新闻链接和视频合成插件 api_key。添加网页图片链接提取插件,获取网页里的图片。接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片。然后使用链接读取节点,将文字内容提取出来。在提取链接后面接上一个大模型节点,用 DeepSeekR1 模型生成有吸引力的口播内容。若想加上自己的特征,可在提示词里写“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。
2025-03-18
Deepseek-R1的系统提示词
以下是关于 DeepSeekR1 的系统提示词的相关内容: 核心原理认知: AI 特性定位:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 8K tokens 上下文窗口,换算成汉字是 4000 字左右)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 四要素模板。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 进阶控制技巧: 思维链引导:分步标记法,苏格拉底式追问。 知识库调用:领域限定指令,文献引用模式。 多模态输出。 此外,还有关于 DeepSeekR1 的其他相关报道,如宝玉日报 1 月 26 日中对其的介绍,以及利用 DeepSeekR1 一分钟生成小红书爆款单词视频的相关内容,包括生成单词的步骤、角色、技能和限制等。
2025-03-18
DeepSeek辅助写论文
以下是关于 DeepSeek 辅助写论文的相关信息: DeepSeek 在写文方面全面领先,但长文可能太发散、文风用力过猛,导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 写理性文章时,可先与 DeepSeek 讨论思路,再用 Cloud 3.5 批量生成。 用 O1 模型对 AI 创作的字数控制有一定效果,也可通过多轮对话让 AI 增删改查来调整字数。 有人用 DeepSeek 辅助写论文,如 Yvonne。 此外,还有以下关于 DeepSeek 的其他信息: 清华大学发布了《DeepSeek 政府应用场景与解决方案(2025 年)》报告,围绕其在政务领域的应用展开,指出政务数字化正迈向“AI+政务”阶段,DeepSeek 在城市治理、便民服务、数据安全等方面有广泛应用,还可辅助公文写作,采用混合部署,涉及本地知识库、模型微调等多种技术。 人们还利用 DeepSeek 做了很多其他事情,如脑爆活动方案、会议纪要、分析总结复盘内容、生成专业专用软件详细使用过程、代码编写、分析感情问题、写营销方案、写小红书笔记、做设计头脑风暴、写周报等。
2025-04-12
请问DeepSeek如何与生产型企业进行结合创造效益 ?
DeepSeek 与生产型企业的结合可以从以下几个方面创造效益: 1. 模型优化与性能提升:英伟达基于 FP4 优化的 DeepSeekR1 检查点现已在 Hugging Face 上开源。这种优化将模型Transformer 模块内的线性算子的权重和激活量化到了 FP4,适用于 TensorRTLLM 推理。每个参数从 8 位减少到 4 位,使磁盘空间和 GPU 显存的需求减少约 1.6 倍。使用 TensorRTLLM 部署时,需要支持 TensorRTLLM 的英伟达 GPU(如 B200),并且需要 8 个 GPU 来实现 tensor_parallel_size=8 的张量并行。代码利用 FP4 量化、TensorRT 引擎和并行计算,实现高效、低成本的推理,适合生产环境或高吞吐量应用。 2. 部署指南:社区伙伴 Hua 投稿的《在 Azure AI Foundry 部署 DeepSeek 大模型全指南》,手把手指导在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 3. 为企业带来实质提升:DeepSeek 的强化学习和联网搜索能力改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。其开源策略打破了技术垄断,让国内大模型能力迅速提升。在企业级部署方面,通过行业知识蒸馏和领域自适应训练,实现对企业非结构化数据的深度解析能力。特别是在实时决策支持、多模态交互及复杂知识图谱构建方面,为企业打造具备持续进化能力的数字神经中枢。这种“AI 即服务”的部署模式,重构了传统工作流效率,并通过预测性分析和认知自动化开启企业智能化的第二增长曲线。同时,还可以考虑垂直场景强化学习机制的增加,如在智能制造场景中嵌入设备故障模式自发现的奖惩机制;以及可信计算架构的升级,针对金融、医疗等高合规需求场景。
2025-04-10
DeepSeek,里面搜索怎么能出来图片?
要在 DeepSeek 中搜索出图片,您可以参考以下信息: 在即梦 AI 平台上找到 DeepSeek 入口,简单描述您想要的画面,DeepSeek 会生成详细的提示词,将提示词复制到生图功能的输入框,选择 3.0 模型,点击生成。 DeepSeek 使用平台包括 DeepSeek 官网、API(V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号)。Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 将下载的 html 文件及图片放到同一个文件夹,让 Cursor 进行图片增加即可。 此外,DeepSeek 深夜发布了大一统模型 JanusPro,将图像理解和生成统一在一个模型中。其具有统一 Transformer 架构,提供 1B 和 7B 两种规模,全面开源,支持商用,MIT 协议,部署使用便捷,Benchmark 表现优异等特点。模型地址: 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 下载地址:https://github.com/deepseekai/Janus
2025-04-09
DeepSeek使用技巧
以下是关于 DeepSeek 的使用技巧: 1. 了解其特点与优势: 推理型大模型:通过理解用户真实需求和场景提供答案,无需详细步骤指令。 更懂人话:能理解用户自然表达的需求,无需特定提示词模板。 深度思考:回答问题时能深度思考,非简单罗列信息。 文风转换器:可模仿不同作家文风写作,适用于多种文体和场景。 2. 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 3. 更多提示词技巧请查看 。 4. 在“AI 切磋大会第十期2 月 23 日 deepseek 专场”中,分享了使用 DeepSeek 的方法技巧,包括: 运用在工作生活上的案例。 输出“超预期结果”的惊艳场景。 与其他工具的协同方案。 模型微调/部署的技巧方法。 用 DeepSeek 获取流量/客户等。
2025-03-23
推荐网内有关DeepSeek知识
以下是为您推荐的有关 DeepSeek 的知识: 微博上热搜,主流媒体全报道。 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,链接:https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧,链接:https://zhuanlan.zhihu.com/p/20544736305(错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,类型:提示词破解,链接:https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,类型:基础认知,链接:https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,类型:基础认知,链接:https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,类型:基础认知,链接:https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,类型:基础认知,链接:https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,类型:基础认知,链接:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,类型:进阶思考,链接:https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 此外,在《雪梅 May 的 AI 学习日记》中也有相关内容,如: 学习材料: 还有 1 月 30 日社区动态速览中的《》,详细讲述了 DeepSeek 相关的基本术语、省钱原因、蒸馏工作原理等。
2025-03-21
个人用户使用DeepSeek 卡顿怎么办
个人用户使用 DeepSeek 卡顿可参考以下解决方法: 1. 创建工作流: 创建一个对话流,命名为 r1_with_net。 开始节点直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词设为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:这里需要在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek,输入包括搜索结果、选择开始节点的 USER_INPUT,开启对话历史并设置 10 轮。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。 测试并发布工作流:输入测试问题,测试完成后直接发布工作流。 2. 核心路径:通过工作流+DeepSeek R1 大模型,实现联网版的 R1 大模型。 3. 拥有扣子专业版账号:如果还是普通账号,请自行升级或注册专业号后使用。 4. 开通 DeepSeek R1 大模型:访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze ,打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务,添加在线推理模型,添加后在扣子开发平台才能使用。 5. 创建智能体:点击创建,先完成一个智能体的创建。 6. 多种可以使用的方法和途径: 使用 Coze 接入:2 月 14 日 8 点直播进行中,火山引擎解决方案专家带大家在 Coze 搭建满血版 R1 bot。飞书会议直播结束,回放看: 。 创建账号:如果还是普通账号,请自行升级或注册专业号后使用。创建智能体:点击创建,先完成一个智能体的创建。如果在最上面的教程里已经创建好自己的推理点了,那么直接在 Bot 编排里就可以直接看到和选择创建好的推理模型了。测试一下,可以用了直接发布。注意事项:如果发布到公共空间,其他人用的是你的 API,要注意 Token 消耗(也可以设置成仅自己使用)。如果想搭建联网及复杂的工作流,可以看完整搭建教程:
2025-03-20
你是一名DEEPSEEK专家,请用大白话交给小白掌握deepseek的使用,举例说明
DeepSeek 的使用对于小白来说可能有点复杂,但我尽量用大白话给您解释清楚。 比如说,您想让 DeepSeek 帮您生成“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”这样的内容。 DeepSeek 会这样来处理: 1. 先回顾玄武门之变的历史背景,比如这场政变发生在 626 年,李世民杀了兄弟,逼父亲退位等。 2. 思考李世民当晚的心理,可能有释然、愧疚、恐惧、自责等多种复杂情绪,还要考虑他是被迫还是早有预谋。 3. 要让生成的独白不仅符合历史事实,还要有文学性,体现人性的复杂。比如要平衡他的野心与自责,对未来的抱负与对过去的悔恨。 4. 考虑当时的文化背景,像儒家思想对孝悌的重视,李世民的行为违背了这些伦理,他可能会内心挣扎,还可能为自己的行为找正当理由。 5. 按照您的需求,给独白加上一些文学修辞,像比喻、对仗、意象等,增强画面感。 另外,DeepSeek 还有个很厉害的地方,就是它能在独白文本中“自作主张”地加入括号里的场景描述,让整个输出更有画面感。比如“(夜风掀动案头《韩非子》,停在‘夫妻者,非有骨肉之恩也’那页)”、“(墨迹在‘弑’字上晕开一团)”、“(忽然扔笔,抓起铜镜)”这些句子,很难相信是 AI 写的。 总之,使用 DeepSeek 时要考虑很多方面的因素,它能根据您的提示词和需求,生成很精彩的内容。
2025-03-13
langchain 大白话解释一下给我听
LangChain 是一个用于构建高级语言模型应用程序的框架。它能简化开发人员使用语言模型构建端到端应用程序的流程,提供了一系列工具、组件和接口,让创建由大型语言模型和聊天模型支持的应用程序更轻松。 其核心概念包括组件和链,组件是模块化的构建块,可组合创建强大应用,链则是一系列组件或其他链的组合,用于完成特定任务。 主要特点有: 1. 模型抽象:提供对大型语言模型和聊天模型的抽象,方便开发人员选择合适模型并利用组件构建应用。 2. 提示模板和值:支持创建和管理提示模板,引导语言模型生成特定输出。 3. 链:允许开发人员定义一系列处理步骤,按顺序执行完成复杂任务。 4. 代理:支持构建代理,能使用语言模型做决策,并根据用户输入调用工具。 LangChain 支持多种用例,如针对特定文档的问答、聊天机器人、代理等,能与外部数据源交互收集数据,还提供内存功能维护状态。它旨在为开发人员提供强大工具集,构建适应性强、高效且能处理复杂用例的高级语言模型应用程序。
2025-02-08