Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

以DeepSeek R1为代表的推理模型,与此前模型(如 ChatGPT-4、Claude 3.5 sonnet、豆包、通义等)的差异点主要在于

Answer

以 DeepSeek R1 为代表的推理模型与此前模型(如 ChatGPT-4、Claude 3.5 sonnet、豆包、通义等)的差异点主要在于:

  1. 技术路线:DeepSeek R1 与 OpenAI 现在最先进的模型 o1、o3 一样,属于基于强化学习 RL 的推理模型。
  2. 思考方式:在回答用户问题前,R1 会先进行“自问自答”式的推理思考,模拟人类的深度思考,从用户初始问题出发,唤醒所需的推理逻辑与知识,进行多步推导,提升最终回答的质量。
  3. 训练方式:在其他模型还在接受“填鸭式教育”时,DeepSeek R1 已率先进入“自学成才”的新阶段。
  4. 模型制作:R1 是原生通过强化学习训练出的模型,而蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。此外,DeepSeek R1 还能反过来蒸馏数据微调其他模型,形成互相帮助的局面。
  5. 与 Claude 3.7 Sonnet 相比,Claude 3.7 Sonnet 在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色,扩展思考模式在数学和科学领域带来显著提升,在某些方面与 DeepSeek R1 各有优劣。
Content generated by AI large model, please carefully verify (powered by aily)

References

非技术人 10 分钟读懂 Deepseek R1|天才模型养成与 AI 超越人类的破晓时刻

就我观察而言,大多数人讨论的DeepSeek,基本指的是它的深度思考版本——DeepSeek R1。DeepSeek R1不同于先前的普通模型(如ChatGPT-4、Claude 3.5 sonnet、豆包、通义等),它与OpenAI现在最先进的模型o1、o3一样,同属于一条技术路线:基于强化学习RL的推理(Reasoning)模型。其标志性表现就是,在回答用户问题前,R1会先进行“自问自答”式的推理思考,凭此提升最终回答的质量。这种“自问自答”,并非简单的自言自语,而是AI在模拟人类的深度思考。从用户初始问题“先有鸡还是先有蛋”出发,AI唤醒解决该问题所需的推理逻辑与知识,对问题进行多步推导,为最终回答提供更加完备的思考准备。这种能力,并非凭空而来。如果把AI比作人类,那么DeepSeek R1的“聪明”,源于其背后独特的“教育方式”。——在许多其他的AI模型还在接受“填鸭式教育”时,DeepSeek R1已经率先进入了“自学成才”的新阶段。

智能纪要:02-26 | DeepSeek部署+蒸馏 2025年2月26日

关于AI模型部署与相关知识的讲解本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。免费额度说明:指出在freely.aliyun.com可领取500元免费额度,但有使用限制,不能部署满血版和较大的增流模型。平台服务差异:介绍了DLC、DSW和EAS等模型部署平台服务的差别。模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。Deepseek R1模型的制作及相关模型比较R1模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。R1模型的蒸馏与微调:用Deepseek RE Zero蒸馏出带思考的数据,基于Deepseek V3微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成R1。R1与其他模型的差别:R1是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。模型的相互帮助:Deepseek R1反过来蒸馏数据微调V3,形成互相帮助的局面,使两个模型都更强。

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

相较于最新Grok 3 Beta模型,Claude 3.7 Sonnet(64k extended thinking)在推理方面几乎打成平手。而在数学、视觉推理方面,又略逊色于Grok 3 Beta。与o3-mini、DeepSeek R1相比,除了数学,带有扩展思考模式的Claude 3.7 Sonnet拿下最高分。Claude 3.7 Sonnet在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色,扩展思考模式在数学和科学领域带来了显著提升。除了传统基准测试外,它甚至在宝可梦游戏测试中超越了所有先前模型AI编码智能体,一次完成45分钟任务

Others are asking
随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展,人工智能正在加速渗透各行业应用场景,包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析,并提出 AI 技术可以在连锁奶茶店如何应用的设想。
以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想: 影响分析: 1. 提升运营效率:通过自动化流程和智能预测,优化库存管理、员工排班等环节。 2. 改善客户体验:利用智能客服快速响应顾客咨询,提供个性化推荐。 3. 精准营销:基于大数据分析顾客偏好,制定更有针对性的营销策略。 应用设想: 1. 智能点单系统:根据顾客的历史订单和偏好,为其推荐饮品和搭配。 2. 库存管理优化:借助 AI 预测销售趋势,精准控制原材料库存。 3. 员工培训辅助:利用虚拟培训工具,提升员工的服务技能和产品知识。 4. 营销决策支持:通过数据分析,确定最佳的促销活动和推广渠道。 目前的知识库中,相关的具体研究报告主要有: 1. 浙江大学:《DeepSeek 技术溯源及前沿探索朱强》(2025/03/19),介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化,以及大模型的发展,如 GPT 系列。 2. 浙江大学:《DeepSeek:回望 AI 三大主义与加强通识教育报告》(2025/03/05),围绕人工智能展开,介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学:《气象人工智能技术与应用报告》(2024/12/25),围绕气象人工智能展开,介绍了其发展和应用情况。 如需下载这些研究报告,可。
2025-04-09
什么是ChatGPT
ChatGPT 是一种基于 GPT(生成式预训练变换器)架构的人工智能模型,由 OpenAI 开发。 它是一种自然语言处理(NLP)工具,能够理解和生成接近人类水平的文本。目前 ChatGPT 官网有两个版本,分别是 GPT3.5 和 GPT4。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度不如 GPT4 高,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店、高级数据分析等插件。若想使用更多功能更智能的 GPT4,需升级到 PLUS 套餐,收费标准为 20 美金一个月,此外还有团队版和企业版,功能更多、限制更少,但费用更贵,一般推荐使用 PLUS 套餐。 ChatGPT 的基本概念是从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本,特别是能够从“提示”开始,继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由简单元素组成,尽管数量庞大。其基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”。但这个过程能产生成功地“类似于”网络、书籍等内容的文本,不仅是连贯的人类语言,而且“说的话”遵循其提示,利用其“读到”的内容。 ChatGPT 实质功能是“单字接龙”,长文由单字接龙的回归所生成。GPT 作为大脑,也就是模型需要通过材料学习不断训练,训练方式不是记忆而是学习“提问和回答的通用规律”,学习后的模型可以实现举一反三。但它不是搜索引擎的升级版,可能会出现“幻觉”,混淆记忆,无法直接查看和更新所学,且高度依赖学习材料,存在缺乏及时性和准确性的缺点。
2025-03-21
怎么安装ChatGPT
以下是安装 ChatGPT 的详细步骤: 安卓系统 1. 打开系统自带的谷歌服务框架 打开系统设置 拉到最底下,点击更多设置 点击账号与同步 点击谷歌基础服务 打开基础服务按钮 2. 安装 Google Play 到小米自带的应用商店搜索 Google Play 进行安装 安装好后打开谷歌商店,点击右上角登录谷歌账号 3. 安装 ChatGPT 到谷歌商店搜索 ChatGPT 进行下载安装,建议把谷歌邮箱也安装上,平时接收验证码那些比较方便。 如果您只想体验 ChatGPT 3.5 版本,不升级 GPT4,可跳转到第 4 步第 6 小步进行登录使用,如果想直接订阅 GPT4 Plus 版本,请接着往下看: 4. 订阅 GPT4 Plus 版本 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在 ChatGPT 里订阅 Plus 苹果系统 1. 在 Apple Store 下载 ChatGPT 中国区正常下载不了,需要切换到美区才可以下载,美区 Apple ID 注册教程参考如下知乎链接:【账号指南】美区 Apple ID 注册教程(保姆教程)https://zhuanlan.zhihu.com/p/696727277 。最终在 Apple Store 搜到 ChatGPT 结果如下,下载安装即可,注意别下错啦。 2. 支付宝 购买苹果礼品卡 充值 订阅付费 App 打开支付,地区切换到【美区任意区】,往下滑,找到【品牌精选 折扣礼品卡】,点击进去,可以看到【大牌礼品卡】,往下滑找到【App Store&iTunes US】礼品卡,按需要的金额购买即可,建议先买 20 刀就行。 支付宝购买礼品卡 在 apple store 中兑换礼品卡 在 chatgpt 中购买订阅 gpt plus,如果中途不想继续订阅了,可到订阅列表中取消订阅即可。 完成上述步骤后,就可以开始使用 ChatGPT 4o 了!
2025-03-19
现在最好用的AI工具是ChatGPT吗
目前,ChatGPT 在 AI 聊天机器人类别中访问量遥遥领先,占总访问量的 76.31%。但角色 AI 以 19.86%的访问量位居第二。其他如 Google 的 Bard、Janitor AI、Perplexity AI、You.com、Crushon AI 和 Personal AI 等竞争者各自产生的访问量不到总访问量的 2%,不过 Bard 正在成长,直到 2023 年 3 月才推出。 基于 2022 年 9 月至 2023 年 8 月访问量,ChatGPT 在 10 个最佳人工智能工具榜单上排名第一,拥有 146 亿次访问量。 在写作方面,GPT4 是目前功能最强的人工智能写作工具,可通过 Bing(选择“创新模式”)免费访问或购买 ChatGPT 的$20/月订阅来使用。Claude 紧随其后,也提供有限免费选项。同时,这些工具也被集成到常见办公应用程序中,如 Microsoft Office 将包括由 GPT 提供支持的副驾驶,Google Docs 将整合 Bard 的建议。
2025-03-19
如何免费试用 ChatGPT 4.5
目前关于免费试用 ChatGPT 4.5 的信息如下: 数周或数月内将推出代号“Orion”的 GPT4.5,这是最后一款“非链式思维“模型。后期将融合 o 系与 GPT 系列,推出整合多项新功能的 GPT5,同时结合画布,搜索,深度研究等能力。ChatGPT 的免费用户也将可以使用到 GPT 5。订阅用户会享有更高智能的 GPT5,越高订阅等级,智能越强。 如有任何问题请联系后台,电子邮箱:[email protected]
2025-03-19
ChatGPT
ChatGPT 是一种基于 GPT 架构的人工智能模型,由 OpenAI 开发。 它的工作原理是:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。具体来说,它能够从“提示”开始,继续生成“类似于训练内容”的文本。 其神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”(无循环等)。但这个过程能产生成功“类似于”网络、书籍等内容的文本,不仅语言连贯,且“说的话”遵循提示,利用所“读到”的内容。 ChatGPT 在生成文本方面表现出色,结果接近人类所产生的。但它不像大脑一样工作,其基本人工神经网络结构基于大脑的理想化模型。在训练和硬件方面,ChatGPT 与大脑不同,且内部无“循环”或“重新计算数据”,限制了计算能力。 目前 ChatGPT 官网有 GPT3.5 和 GPT4 两个版本。GPT3.5 免费,拥有账号即可使用,但智能程度不如 GPT4,且无法使用 DALL.E3 等插件。GPT4 的 PLUS 套餐收费 20 美金/月,还有团队版和企业版,功能更多、限制更少,一般推荐 PLUS 套餐。 在注册 ChatGPT 账号前,建议先注册谷歌账号,因国外很多软件支持谷歌账号一键登录,注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。
2025-03-12
DeepSeek辅助写论文
以下是关于 DeepSeek 辅助写论文的相关信息: DeepSeek 在写文方面全面领先,但长文可能太发散、文风用力过猛,导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 写理性文章时,可先与 DeepSeek 讨论思路,再用 Cloud 3.5 批量生成。 用 O1 模型对 AI 创作的字数控制有一定效果,也可通过多轮对话让 AI 增删改查来调整字数。 有人用 DeepSeek 辅助写论文,如 Yvonne。 此外,还有以下关于 DeepSeek 的其他信息: 清华大学发布了《DeepSeek 政府应用场景与解决方案(2025 年)》报告,围绕其在政务领域的应用展开,指出政务数字化正迈向“AI+政务”阶段,DeepSeek 在城市治理、便民服务、数据安全等方面有广泛应用,还可辅助公文写作,采用混合部署,涉及本地知识库、模型微调等多种技术。 人们还利用 DeepSeek 做了很多其他事情,如脑爆活动方案、会议纪要、分析总结复盘内容、生成专业专用软件详细使用过程、代码编写、分析感情问题、写营销方案、写小红书笔记、做设计头脑风暴、写周报等。
2025-04-12
请问DeepSeek如何与生产型企业进行结合创造效益 ?
DeepSeek 与生产型企业的结合可以从以下几个方面创造效益: 1. 模型优化与性能提升:英伟达基于 FP4 优化的 DeepSeekR1 检查点现已在 Hugging Face 上开源。这种优化将模型Transformer 模块内的线性算子的权重和激活量化到了 FP4,适用于 TensorRTLLM 推理。每个参数从 8 位减少到 4 位,使磁盘空间和 GPU 显存的需求减少约 1.6 倍。使用 TensorRTLLM 部署时,需要支持 TensorRTLLM 的英伟达 GPU(如 B200),并且需要 8 个 GPU 来实现 tensor_parallel_size=8 的张量并行。代码利用 FP4 量化、TensorRT 引擎和并行计算,实现高效、低成本的推理,适合生产环境或高吞吐量应用。 2. 部署指南:社区伙伴 Hua 投稿的《在 Azure AI Foundry 部署 DeepSeek 大模型全指南》,手把手指导在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 3. 为企业带来实质提升:DeepSeek 的强化学习和联网搜索能力改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。其开源策略打破了技术垄断,让国内大模型能力迅速提升。在企业级部署方面,通过行业知识蒸馏和领域自适应训练,实现对企业非结构化数据的深度解析能力。特别是在实时决策支持、多模态交互及复杂知识图谱构建方面,为企业打造具备持续进化能力的数字神经中枢。这种“AI 即服务”的部署模式,重构了传统工作流效率,并通过预测性分析和认知自动化开启企业智能化的第二增长曲线。同时,还可以考虑垂直场景强化学习机制的增加,如在智能制造场景中嵌入设备故障模式自发现的奖惩机制;以及可信计算架构的升级,针对金融、医疗等高合规需求场景。
2025-04-10
DeepSeek,里面搜索怎么能出来图片?
要在 DeepSeek 中搜索出图片,您可以参考以下信息: 在即梦 AI 平台上找到 DeepSeek 入口,简单描述您想要的画面,DeepSeek 会生成详细的提示词,将提示词复制到生图功能的输入框,选择 3.0 模型,点击生成。 DeepSeek 使用平台包括 DeepSeek 官网、API(V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号)。Deepseek 需要复制代码到 html 文件里,然后保存进行查看。 将下载的 html 文件及图片放到同一个文件夹,让 Cursor 进行图片增加即可。 此外,DeepSeek 深夜发布了大一统模型 JanusPro,将图像理解和生成统一在一个模型中。其具有统一 Transformer 架构,提供 1B 和 7B 两种规模,全面开源,支持商用,MIT 协议,部署使用便捷,Benchmark 表现优异等特点。模型地址: 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 下载地址:https://github.com/deepseekai/Janus
2025-04-09
DeepSeek使用技巧
以下是关于 DeepSeek 的使用技巧: 1. 了解其特点与优势: 推理型大模型:通过理解用户真实需求和场景提供答案,无需详细步骤指令。 更懂人话:能理解用户自然表达的需求,无需特定提示词模板。 深度思考:回答问题时能深度思考,非简单罗列信息。 文风转换器:可模仿不同作家文风写作,适用于多种文体和场景。 2. 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 3. 更多提示词技巧请查看 。 4. 在“AI 切磋大会第十期2 月 23 日 deepseek 专场”中,分享了使用 DeepSeek 的方法技巧,包括: 运用在工作生活上的案例。 输出“超预期结果”的惊艳场景。 与其他工具的协同方案。 模型微调/部署的技巧方法。 用 DeepSeek 获取流量/客户等。
2025-03-23
推荐网内有关DeepSeek知识
以下是为您推荐的有关 DeepSeek 的知识: 微博上热搜,主流媒体全报道。 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,链接:https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧,链接:https://zhuanlan.zhihu.com/p/20544736305(错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,类型:提示词破解,链接:https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,类型:基础认知,链接:https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,类型:基础认知,链接:https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,类型:基础认知,链接:https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,类型:基础认知,链接:https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,类型:基础认知,链接:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,类型:进阶思考,链接:https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 此外,在《雪梅 May 的 AI 学习日记》中也有相关内容,如: 学习材料: 还有 1 月 30 日社区动态速览中的《》,详细讲述了 DeepSeek 相关的基本术语、省钱原因、蒸馏工作原理等。
2025-03-21
个人用户使用DeepSeek 卡顿怎么办
个人用户使用 DeepSeek 卡顿可参考以下解决方法: 1. 创建工作流: 创建一个对话流,命名为 r1_with_net。 开始节点直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词设为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:这里需要在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek,输入包括搜索结果、选择开始节点的 USER_INPUT,开启对话历史并设置 10 轮。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。 测试并发布工作流:输入测试问题,测试完成后直接发布工作流。 2. 核心路径:通过工作流+DeepSeek R1 大模型,实现联网版的 R1 大模型。 3. 拥有扣子专业版账号:如果还是普通账号,请自行升级或注册专业号后使用。 4. 开通 DeepSeek R1 大模型:访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze ,打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务,添加在线推理模型,添加后在扣子开发平台才能使用。 5. 创建智能体:点击创建,先完成一个智能体的创建。 6. 多种可以使用的方法和途径: 使用 Coze 接入:2 月 14 日 8 点直播进行中,火山引擎解决方案专家带大家在 Coze 搭建满血版 R1 bot。飞书会议直播结束,回放看: 。 创建账号:如果还是普通账号,请自行升级或注册专业号后使用。创建智能体:点击创建,先完成一个智能体的创建。如果在最上面的教程里已经创建好自己的推理点了,那么直接在 Bot 编排里就可以直接看到和选择创建好的推理模型了。测试一下,可以用了直接发布。注意事项:如果发布到公共空间,其他人用的是你的 API,要注意 Token 消耗(也可以设置成仅自己使用)。如果想搭建联网及复杂的工作流,可以看完整搭建教程:
2025-03-20
推理类模型,以deepseek为代表,与此前的聊天型ai,比如chatgpt3.5,有什么差异
推理类模型如 DeepSeek 与聊天型 AI 如 ChatGPT3.5 存在以下差异: 1. 内部机制:对于大语言模型,输入的话会被表示为高维时间序列,模型根据输入求解并表示为回答。在大模型内部,是根据“最大化效用”或“最小化损失”计算,其回答具有逻辑性,像有自己的思考。 2. 多模态能力:ChatGPT3.5 是纯语言模型,新一代 GPT 将是多模态模型,能把感官数据与思维时间序列一起作为状态,并装载在人形机器人中,不仅能对话,还能根据看到、听到的事进行判断,甚至想象画面。 3. 超越人类的可能性:有人假设人按最大化“快乐函数”行动,只要“效用函数”足够复杂,AI 可完全定义人,甚至超越人类。如在“短期快乐”与“长期快乐”的取舍上,人类难以找到最优点,而 AI 可通过硬件算力和强化学习算法实现,像 AlphaGo 击败世界冠军,在复杂任务上超越人类。 4. 应用领域:文字类的总结、润色、创意是大语言模型 AI 的舒适区,如从 ChatGPT3.5 问世到 ChatGPT4 提升,再到 Claude 3.5 sonnet 在文学创作领域取得成绩,只要有足够信息输入和合理提示词引导,文案编写可水到渠成。
2025-03-18
flux和sd3.5出图的区别
Flux 和 SD3.5 出图存在以下区别: 1. 模型性质:Flux.1 有多种版本,如开源不可商用的 FLUX.1等。而 SD3.5 未提及相关性质。 2. 训练参数:Flux.1 的训练参数高达 120 亿,远超 SD3 Medium 的 20 亿。 3. 图像质量和提示词遵循能力:Flux.1 在图像质量、提示词跟随、尺寸适应、排版和输出多样性等方面超越了一些流行模型,如 Midjourney v6.0、DALL·E 3和 SD3Ultra 等。 4. 应用场景:Flux.1 可以在 Replicate 或 fal.ai 等平台上试用,支持在 Replicate、fal.ai 和 Comfy UI 等平台上使用,并且支持用户根据自己的数据集进行微调以生成特定风格或主题的图像。而 SD3.5 未提及相关应用场景。 5. 本地运行:文中尝试了在没有 N 卡,不使用复杂工作流搭建工具的 Mac Mini M1 上运行 FLUX.1,以及在边缘设备 Raspberry PI5B 上运行的情况,未提及 SD3.5 的相关内容。 6. 模型安装部署:对于 Flux.1,不同版本的模型下载后放置的位置不同,如 FLUX.1应放在 ComfyUI/models/unet/文件夹中。而 SD3.5 未提及相关安装部署内容。 7. 显存处理:对于 Flux.1,如果爆显存,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍微降低质量。而 SD3.5 未提及相关显存处理内容。 8. 提示词使用:在训练 Flux 时,应尽量使用长提示词或自然语言,避免使用短提示词,因为 T5 自带 50%的删标。而 SD3.5 未提及相关提示词使用内容。
2024-12-20
怎么安装Claude 3.5
以下是安装 Claude 3.5 的步骤: 1. 准备工作:需要一台电脑(如 Windows 系统,理论上能跑 Docker 都可以)和 Claude 的官方 Key(目前大多数中转不支持)。 2. Docker 安装:正常安装 Docker,完成后本地打开,登陆上去确保左下角服务启动成功。 3. 拉取镜像:Claude 官方提供了 Demo(Python),可以直接拉取到本地跑起来。如 anthropicquickstarts/computerusedemo at main · anthropics/anthropicquickstarts 。代码拉取到本地后,在当前 Python 环境下安装依赖(建议 3.11 以上),然后根据官方文档设置环境变量,启动 docker。对于不熟悉环境变量的朋友,可以使用修改过的启动命令(key 可以启动后再设置)。 4. 克神启动:等镜像拉取完成,如果没有意外,启动成功。按照提示访问网页:http://localhost:8080 ,侧边栏填入 key ,就可以正常使用了。 另外,通过 Cursor 安装 Claude 3.5 的步骤如下: 1. 下载 Cursor:进入 cursor.com ,点击 Download for Free 进行下载。 2. 安装 Cursor:点击下载后的安装文件,按照提示一步一步安装。 3. 注册账户:官方支持三种注册方式:GitHub、谷歌账号、普通邮箱地址,也支持国内邮箱地址。普通用户注册后,可以免费体验 14 天的 Pro 版本,拥有高级模型(如 claude3.5sonnet、gpt4o)的 500 次对话机会,还可以无限使用 gpt4omini 和 cursorsmall 模型。 4. 了解订阅模式:免费用户一共可以使用 2000 次普通模型的问答;Pro 模式 20 刀/月,500 次高级模型问答,不限次普通模型问答;Business 模式 40 刀/月,全部不限制次数。
2024-12-03
ChatGPT是什么?GPT是什么?GPT-3.5和GPT-4有什么差别
ChatGPT 是一种基于 GPT(生成式预训练变换器)架构的人工智能模型,由 OpenAI 开发。它是目前最先进的人工智能模型之一,是一种自然语言处理(NLP)工具,能够理解和生成接近人类水平的文本。 GPT 是生成式预训练变换器。 GPT3.5 是 GPT3 的升级版本,也是 ChatGPT 背后的模型。GPT4 是 GPT3.5 的后续版本,与 GPT3.5 相比,GPT4 具有以下一些差别: 1. 可靠性:GPT4 大大减少了产生“幻觉”(对事实的错误认知)和推理错误的情况。 2. 性能表现:在内部对抗性设计的事实性评估中,GPT4 的得分比 GPT3.5 高 19 个百分点。 3. 在公共基准 TruthfulQA 上,经过 RLHF 后训练的 GPT4 比 GPT3.5 有很大改进,但基础模型只略胜一筹。 目前 ChatGPT 官网有两个版本,分别是 GPT3.5 和 GPT4。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度不如 GPT4,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店、高级数据分析等插件。若想使用更多功能更智能的 GPT4,需要升级到 PLUS 套餐,收费标准是 20 美金一个月。此外,GPT4 还有团队版和企业版,功能更多,限制更少,但费用也更贵,一般推荐使用 PLUS 套餐。
2024-12-03
claude 3.5 haiku 怎么用
以下是关于Claude 3.5 Haiku使用的步骤: 1. 准备工作: 一台电脑(Window系统,理论上能跑Docker的都可以)。 Claude的官方Key(目前大多数中转不支持,需加紧对接)。 2. Docker安装:正常安装,完成后本地打开,登陆上去,确保左下角服务启动成功。 3. 拉取镜像:Claude官方提供了Demo(Python),可拉取到本地跑起来。代码拉取到本地后,在当前Python环境下安装依赖(建议3.11以上),然后根据官方文档设置环境变量,启动docker。对于不熟悉环境变量的朋友,可直接使用修改过的启动命令(key可以启动后再设置)。 4. 克神启动:等待镜像拉取,若无意外则启动成功。按照提示访问网页:http://localhost:8080,侧边栏有key,填上去即可正常使用。 此外,Anthropic发布了新功能computer use,同时发布了Claude 3.5 Haiku,并升级了Claude 3.5 Sonnet。Claude3家族上线,包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus三款模型,现已上线Opus和Sonnet模型,即将推出Haiku模型。
2024-11-11
Claude3.5免费的模型和付费的模型有什么区别
Claude 3.5 的免费模型和付费模型主要有以下区别: 1. 功能与性能:付费的 Opus 模型在某些方面可能具有更强大的功能和更出色的性能。 2. 访问权限:所有新用户有 14 天的 Pro 试用期,可访问所有 Pro 功能。14 天后未升级的用户将恢复为 Hobby 计划。 3. 快速请求:默认情况下,服务器会尝试给所有用户快速的高级模型请求,但高峰期时,用完快速高级积分的用户可能会被移到慢速池等待。若不想等待,可在设置页面添加更多请求。 4. 对话轮次:免费版本每小时的对话轮次有限制。 5. 费用:Pro 版本每月 20 美刀。 6. 注册要求:注册需要海外手机号。 7. 模型种类:免费用户可用 Claude 3 Sonnet 模型,订阅后可用 Opus 模型。
2024-10-26
OpenAI Operator, Anthropic Claude Coder
以下是关于 OpenAI Operator 和 Anthropic Claude Coder 的相关信息: 2025 年 Agent 领域的发展预测: 从对话助手到行动型智能体是 2025 年 Agent 技术的主流发展方向之一。计算机操作能力取得突破,传统大模型更多充当聊天助手,而 2025 年的突破在于让 Agent 直接“动手”操作电脑和网络环境。 Anthropic 在 2024 年底发布的 Claude 3.5 Sonnet 首次引入“Computer Use”能力,让 AI 像人一样通过视觉感知屏幕并操作鼠标键盘,实现了 AI 自主使用电脑的雏形。 OpenAI 在同期推出了代号“Operator”的 Agent 及其核心模型“计算机使用智能体”(CUA),使 GPT4 获得直接与图形界面交互的能力。CUA 通过强化学习将 GPT4 的视觉能力与高级推理相结合,训练 AI 可像人一样点击按钮、填表、滚动页面等。在 OpenAI 的测试中,CUA 在浏览器任务基准 WebArena 和 WebVoyager 上分别达到 38.1%和 87%的成功率,后者已接近人类水平。 其他相关信息: 宝玉日报 1 月 25 日: Deepseek 提示词框架包含四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。 Anthropic 的 Claude 可通过屏幕截图获取计算机视觉信息,计算光标移动的像素坐标,并执行点击、滚动等操作。 OpenAI Operator 利用虚拟主机和 Chrome 浏览器,通过 CUA 实现网页实时操作,支持复杂任务导航。 主要的大语言模型: OpenAI 系统包括 3.5 和 4 等,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-04-01
Claude Artifacts是什么
Claude Artifacts 是由 Claude 推出的一项工具。它具有将前端代码直接渲染成网页的功能,在前端代码生成能力方面表现出色。例如,可以借助 Claude 的 Artifact 功能制作海报、思维导图等,用户无需编写代码或使用专业设计软件,仅通过与 Claude 对话并输入提示词,就能生成符合需求的内容。目前关于 Claude Artifacts 的探索文章相对较少,但其具有代码跑通率高、设计美感好等特点,还能实现动态生成的效果。
2025-04-01
怎么写给 Claude 的 prompts
以下是关于如何写给 Claude 的 prompts 的相关内容: 1. 提示简介:提示是您给 Claude 的文本,用于引发相关输出,通常以问题或指示的形式出现。例如,“User|Why is the sky blue? 为什么天空是蓝色的?”,Claude 回答的文本被称为“响应”,有时也被称为“输出”或“完成”。 2. 构建 Prompt:可以用 Lisp 或 Markdown 格式来构建 prompt,让 Claude 根据用户输入的领域和产品(也可自定义产品特点)直接输出情绪营销语句。用 Lisp 这种编程语言更为凝练和简洁,Markdown 格式的效果也一样。对于 GPT 等模型,在卡片生成这步可能需要一些调整,不稳定,最好自定义 html/css 样式来进行强约束。直接打开 Claude 首页,把上述提示词发送即可初始化,然后进行使用。 3. 控制输出格式(JSON 模式):控制 Claude 输出的简单方法之一是说明想要的格式,Claude 可以理解并遵循与格式相关的指示,并格式化输出,如 JSON、XML、HTML、Markdown、CSV 等,甚至自定义格式。例如,如果想让 Claude 以 JSON 格式生成一首俳句,可以使用相应的提示。
2025-03-28
OpenAI o1、Claude Sonnet 3.7、Gemini 2.0 pro 哪个 AI 搜索能力更强?
OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。 OpenAI o1 推理能力强,适合作为架构师或算法顾问。 Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。 Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。 具体的搜索能力表现还会受到应用场景和具体任务的影响。
2025-03-21
trad 如何添加Claude Sonnet 3.7 模型
要在 Trae 中添加 Claude Sonnet 3.7 模型,您可以按照以下步骤操作: 1. 下载 Trae:链接为 https://sourl.co/2DCmmW 。 2. 安装 Trae 后,自动进入 Trae 的客户端。 3. 查看对话框右下角,可以看到三种大模型的选择,其中包括 Claude3.5Sonnet、Claude3.7Sonnet、GPT4o 。 Claude 3.7 Sonnet 是一个混合推理模型,与市面上其他推理模型有所不同。它分为普通模式和扩展(推理)模式,可通过下拉菜单切换。普通模式是升级版的 Claude 3.5 Sonnet,回答迅速流畅;扩展模式适用于数学、物理、编程、复杂分析等场景,会进行思维链展开和推理。但需要注意的是,在 Trae 中切换模式是通过新窗口实现的。
2025-03-17
Claude
以下是关于 Claude 的相关信息: 1. 一位 17 岁的高中生涂津豪写了个名为 Thinking Claude 的神级 Prompt,将 o1 级别的思维链复刻到了 Claude3.5 里,使其智能程度、成功率和像人的程度大幅提升。可以在作者的 Github 上查看完整 Prompt,地址是:https://github.com/richards199999/ThinkingClaude/tree/main 。 2. 预先填充 Claude 的回答:要预先填充 Claude 的回应,只需在进行 API 请求时在 Assistant 消息中包含所需的初始文本。例如:|Role|Good Prompt| |User|Please extract the name,size,price,and color from this product description and output it within a JSON object.<br>请从此产品描述中提取名称、尺寸、价格和颜色,并在 JSON 对象中输出。<br><br><description>The SmartHome Mini is a compact smart home assistant available in black or white for only$49.99.At just 5 inches wide,it lets you control lights,thermostats,and other connected devices via voice or app—no matter where you place it in your home.This affordable little hub brings convenient handsfree control to your smart devices.</description><br><description>SmartHome Mini 是一款紧凑的智能家居助手,有黑色或白色可选,售价仅为$49.99。仅 5 英寸宽,让您可以通过语音或应用程序控制灯光、恒温器和其他连接设备,无论您将其放在家中的哪个位置。这款价格实惠的小中心为您的智能设备带来了便利的免提控制。| |Assistant助手(预先填充)|{ 。 3. 要求 Claude 进行重写:有时候 Claude 的回答可能不完全准确或符合要求,在以下情况可以要求重写,如响应接近所需但缺乏具体细节或格式、输出未完全遵循初始提示的约束条件、不确定结果是否准确希望双重检查。重写在提示包含多个约束时特别有用,请求重写可强调 Claude 最初忽略的约束的重要性。
2025-03-06