Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek在世界上是什么水平

Answer

DeepSeek 在世界上具有一定的水平:

  1. 华尔街分析师的反应:展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但也有不同观点,如 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变竞争格局并降低行业进入门槛。
  2. 实际使用体验:在文字能力上表现突出,尤其在中文场景中符合日常写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT。
  3. 在文学创作方面:很火,在 Benchmark 表现出色,做数学和代码题达 O1 标准,处于国际领先。文风优秀,有哲学思考,能触动人情感,文创能力顶尖,甚至因其“发疯”在创作上更出色。但使用时需在控制和自由间平衡,旧模型在文学创作时存在一些弊端。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️?华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。?[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。?[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)?[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型:

XiaoHu.AI日报

?Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️?华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。?[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。?[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)?[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型:

?全新AI整活计划:DeepSeek小说家 2025年2月9日

[heading2]智能章节[12:39](https://waytoagi.feishu.cn/minutes/obcnmo3hj6o3pw99e79386lx?t=759000)旧模型文学创作弊端与Deepseek使用建议本章节财猫指出,旧模型在文学创作时有过度道德说教和正面描述趋势,会导致结果生硬死板,是一种对齐税,因人类复杂,仅正面故事难共鸣、人物单薄。还提到大语言模型做概率预测会使生成内容同质化严重,使用Deepseek时需在控制和自由间平衡,建议给Deepseek ie更多自由发挥空间。[14:52](https://waytoagi.feishu.cn/minutes/obcnmo3hj6o3pw99e79386lx?t=892000)Deepseek写小说及特色解析本章节围绕如何用deepseek写小说展开。指出deepseek很火,在Benchmark表现出色,做数学和代码题达O1标准,处于国际领先。其真正火的原因是文风优秀,有哲学思考,能触动人情感,文创能力顶尖,与其他模型不同,甚至被认为因其“发疯”而在创作上更出色。[20:14](https://waytoagi.feishu.cn/minutes/obcnmo3hj6o3pw99e79386lx?t=1214000)Deepseek R1大模型的特点与创作表现

Others are asking
deepseek官方教程
以下是关于 DeepSeek 的官方教程相关信息: 火山方舟 DeepSeek 申请免费额度教程,包含多种 API 使用方式,如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA,通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens,畅享 671B DeepSeek R1,活动截止至北京时间 20250218 23:59:59。同时,火山方舟大模型服务平台的模型服务计费文档有更新,DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。 有关于一线教师的 AI 需求与高效工具推荐,如让模型创作诗歌、生成宣传标语、提示库(https://apidocs.deepseek.com/zhcn/promptlibrary)、代码解释、内容分类、角色扮演(自定义人设)、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中,有《突破 DeepSeek R1 能力天花板,火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容,还附上了飞书多维表格、Coze 的接入使用方法等。此外,还有关于 DeepSeek 关键 9 篇论文及创新点的讲解,以及 DeepSeek 官方发布的 R1 模型推荐设置。
2025-04-15
coze搭建工作流调用deepseek如何把模型的输出存入到多维表中
以下是将模型的输出存入到多维表中的步骤: 1. 逐步搭建 AI 智能体: 搭建整理入库工作流。 设置大模型节点提取稍后读元数据,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000,以确保能完整解析长内容网页。 进行日期转时间戳,后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳,需要使用「日期转时间戳time_stamp_13」插件进行格式转化。 把稍后读元数据转换为飞书多维表格插件可用的格式,飞书多维表格插件目前(2024 年 08 月)只支持带有转义符的 string,以 Array<Object>格式输入,所以必须将之前得到的元数据数组进行格式转换。 添加「飞书多维表格add_records」插件,只需要设置{{app_token}}与{{records}}参数,将元数据写入飞书表格。 2. 搭建 Coze 工作流: 打开 Coze 的主页,登录后,在【工作空间】创建一个智能体。 在编排页面,给智能体编辑好人设,可先写一个简单的,然后点右上角自动优化,系统会自动补全更精细的描述。点击工作流的+,创建一个工作流。 大模型节点把 input 给到 DeepSeek,让 DeepSeek 按照提前规定的输出框架生成对应文案。 生图节点将输出给到图像生成组件画图。 结束输出时,两个输出给到最终的 end 作为最终的输出。注意在编写系统提示词时,如果需要 input 可被 DeepSeek 调用,需要用{{input}}作为参数引入,不然大模型不知道自己需要生成和这个 input 相关的结果。编排完,点击【试运行】,调试至满意后点击发布。
2025-04-14
deepseek写论文
以下是关于 DeepSeek 在不同方面应用的相关信息: 应用场景:包括脑爆活动方案、会议纪要、批量处理客户评论、分析总结复盘内容、生成专业软件使用过程、写小说框架、写论文、写文案、写小红书笔记、写周报、做设计头脑风暴、做网站、分析感情问题等。 优势与不足:在写文方面全面领先,但长文可能太发散、文风用力过猛导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 应对策略:写理性文章时,可先与 DeepSeek 讨论思路,再用 Cloud 3.5 批量生成;用 O1 模型对创作的字数控制有一定效果,也可通过多轮对话让 AI 增删改查来调整字数。 创作相关:模仿特定小说家的文学方式创作小说,需在提示词中描述文风特征;邀请大家在腾讯频道发布用 AI 写的小说并鉴赏。 发展历程:DeepSeek 历时 647 天在大语言模型(LLM)领域取得突破,发布 13 篇论文。谷歌 CEO 坦言 Deep Seek 的突破标志着 AI 的全球化进程。
2025-04-13
如何使用deepseek写论文?
使用 DeepSeek 写论文可以参考以下几点: 1. 给予 DeepSeek 更多自由发挥的空间,避免过度限制。 2. 注意旧模型在文学创作中可能存在的过度道德说教和正面描述趋势,导致结果生硬死板的问题。 3. 了解 DeepSeek 在文风、哲学思考和触动人情感方面的优秀表现,利用其文创能力为论文增添特色。 4. 参考提示词编写的方法,例如收集信息、重新定义问题等,以更有效地向 DeepSeek 传达需求。 5. 可以借鉴他人使用 DeepSeek 写论文的经验,如 Yvonne 的成功案例。 需要注意的是,虽然 DeepSeek 能提供帮助,但仍需您对生成的内容进行审核和修改,以确保论文的质量和准确性。
2025-04-13
deepseek v3微调
以下是关于 Deepseek V3 微调的相关信息: 云舒文章总结卡 2.0 提示词全面支持 Deepseek V3,效果媲美 Claude3.7。V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号。提示词复制链接:。横版为 1080 x 800 卡片提示词,竖版为 750 x 不限高卡片提示词。 各平台均需下载 html 文件,打开后才能查看真实效果,平台自带预览因兼容性问题无法正常展示效果。Claude 使用平台包括 Claude3.7 官网、API、Cursor,使用时需要下载为 HTML 文件打开查看效果。Deepseek 使用平台包括 Deepseek 官网、API(V3 需要为 0324 更新的版本),Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 关于智能纪要,会带着大家复现模型的蒸馏和微调,并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面。 北京时间 00:30 至 08:30 期间,DeepSeek API 价格大幅下调,DeepSeekV3 降至原价的 50%。
2025-04-12
deepseek的使用技巧
以下是关于 DeepSeek 的使用技巧: 1. 了解其特点与优势: 推理型大模型:核心是推理型,无需用户提供详细步骤指令,通过理解真实需求和场景提供答案。 更懂人话:能理解用户用“人话”表达的需求,无需特定提示词模板。 深度思考:回答问题时能深度思考,非简单罗列信息。 文风转换器:可模仿不同作家文风写作,适用于多种文体和场景。 2. 更多提示词技巧请查看 3. 在 AI 切磋大会第十期 2 月 23 日 deepseek 专场中,分享了以下使用方法技巧: 分享使用 DeepSeek 在工作生活上的案例。 分享 DeepSeek 输出“超预期结果”的惊艳场景。 分享别人使用的案例。 方法论碰撞,如使用 DeepSeek 的技巧、与其他工具的协同方案、模型微调/部署的技巧方法、获取流量/客户等。 在 Workshop 自由探讨环节,参与者可自由组队,确定围绕 DeepSeek 应用的项目方向,进行头脑风暴和制定落地方案,并提交项目初稿。推荐使用 DeepSeek + 飞书多维表格、DeepSeek + 扣子等工具。若讨论无方向,可设定标准问题引导;分组混乱,可预设热门主题让参与者自行加入。
2025-04-12
gemini-2.5目前是什么水平
Gemini 2.5 是一款全能思考模型,具有以下特点和优势: 多领域达到 SOTA 水平,逻辑、代码、任务处理能力大幅提升。 支持 100 万 tokens 上下文,具备强大的阅读能力。 统一架构原生多模态支持,图文音码协同处理,并非外挂而是原生融合。 您可以通过以下链接获取更多详细信息:https://www.xiaohu.ai/c/xiaohuai/googlegemini25proexperimental
2025-04-13
请预测,随着国内AI水平的发展,2030年,可能会代替多少打工人的工作?
根据现有资料,关于 2030 年国内 AI 发展可能替代打工人工作的数量,不同的研究和观点有所不同。 咨询公司麦肯锡发布最新预测:截止到 2030 年时,50%工作将被 AI 取代。吴恩达认为 2023 年 AI 将会替代 4 亿 8 亿工作岗位,同时 AI 会增加 5.55 8.90 亿新岗位。总体而言,越具体、重复性高的工作越容易被取代,而灵活、非常规、创造性的岗位更难被取代。 需要注意的是,对于 AI 对就业的影响,还需要综合更多因素进行辩证看待。
2025-03-21
我是景区小卖部的老板,我想通过学习AI提高自己的经营管理水平
对于您作为景区小卖部老板希望通过学习 AI 来提高经营管理水平的需求,目前暂时没有相关的具体内容。但一般来说,您可以考虑以下几个方面: 1. 利用数据分析工具:通过收集和分析小卖部的销售数据、顾客流量数据等,了解顾客的消费习惯和需求,以便更精准地进货和调整商品布局。 2. 借助智能库存管理系统:实现对库存的实时监控和预测,避免缺货或积压现象。 3. 运用智能营销手段:例如基于顾客的消费行为和偏好,推送个性化的促销信息。 您可以持续关注 AI 领域的新发展和应用,结合自身实际情况,探索适合小卖部经营管理的有效方法。
2025-03-14
阿里的千问大模型在行业内处于一个什么样的水平
阿里的通义千问大模型在行业内处于领先水平。 通义千问 2.5 正式发布并开源 1100 亿参数模型,在多模态和专有能力模型方面影响力强大,始终坚持开源路线,已推出多款开源模型,受到开发者和生态伙伴的热情支持。百炼平台也升级支持企业 RAG 链路,提供更灵活的企业级检索增强服务。通义灵码推出企业版,满足企业定制化需求,已在多个领域落地应用。 Qwen2.5Max 基于 SFT 和 RLHF 策略训练,在多项基准如 Arena Hard、LiveBench、LiveCodeBench、GPQADiamond 上超越 DeepSeek V3,引发社区关注。支持官方 Chat、API 接口、Hugging Face Demo 等多种方式,展示其顶尖性能与灵活应用场景。 Qwen2.5VL 是新一代视觉语言模型,可解析 1 小时以上视频内容并秒级定位事件,识别从金融文档到通用物体,动态适配高分辨率图像。具备复杂任务执行能力,覆盖更多实际场景如票据解析、商业分析等。 10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0,8 大行业模型同步上线。
2025-03-14
修改以下内容,降低论文查重率:  首先需要高层管理者的重视和支持,为社交媒体营销提供必要的资源和政策支持。其次,要加强员工培训,提高全员的社交媒体素养和营销能力。再次,要建立完善的社交媒体管理制度,规范员工行为,防范潜在风险。最后,要注重技术创新,积极应用人工智能、大数据等新技术,提高社交媒体营销的智能化水平
以下是为您修改后的内容,以降低论文查重率: 首先,高层管理者的重视与支持不可或缺,应为社交媒体营销给予必需的资源及政策支撑。其次,强化员工培训工作,提升全体员工的社交媒体素养与营销能力。再次,构建完备的社交媒体管理体制,对员工行为加以规范,预防潜在风险。最后,注重技术的创新,积极运用人工智能、大数据等新型技术,增强社交媒体营销的智能化程度。
2025-03-07
如何基于你的模型对一台工业设备(钢板划线印字装备)进行故障诊断和预测性维护,从以下几个方面进行分析 1.技术栈:数据采集与通讯,数据库,算法,前端,微服务、应用等,并进行软件选型 2.硬件选型:工业设备、边缘计算设备,软件部署硬件,分别列出性能最优和国产化替代方案 3.算法创新性:要求可发表高水平论文和申请发明专利 4.算法通用性:考虑如何通过一个通用模型经过简单配置适应不同船舶建造工业设备的故障诊断和预测性维护 5.考虑前后合理性,若以此进行招标,如何描述招标内容
以下是为您整合的相关内容: Transformer 模型和 BERT 模型: 模型训练与评估:定义模型后,传递训练数据集和验证数据集及训练时期数,训练完成后评估性能,如达到 85%准确率。 模型性能可视化:绘制准确性和随时间的损失图。 保存与加载模型:使用 model.save 方法导出并保存模型到本地路径,保存后可加载进行预测。 预测示例:对不同情感的评论句子进行预测。 部署模型到 Vertex AI:检查模型签名,上传本地保存的模型到 Google Cloud 存储桶,在 Vertex 上部署模型并获得在线预测。 提示工程: 策略:将复杂任务分解为更简单的子任务。 技巧:使用意图分类识别用户查询中最相关的指令。例如在故障排除场景中,根据客户查询分类提供具体指令,如检查路由器连接线、询问路由器型号、根据型号提供重启建议等。模型会在对话状态变化时输出特定字符串,使系统成为状态机,更好控制用户体验。 OpenAI 官方指南: 战术:将复杂任务拆分为更简单的子任务。 策略:使用意图分类来识别与用户查询最相关的指令。例如在故障排除场景中,基于客户查询分类向 GPT 模型提供具体指令。已指示模型在对话状态变化时输出特殊字符串,将系统变成状态机,通过跟踪状态等为用户体验设置护栏。
2025-02-12