Navigate to WaytoAGI Wiki →

知识库精选-2026年1月11日

·2026-01-10·#知识库精选
知识库精选-2026年1月11日
  • 英伟达GDPO论文解读:多奖励强化学习的正确打开方式》当AI追求多目标时,传统GRPO算法竟会“失灵”?NVIDIA论文揭示,GRPO把多奖励加总后归一化,让不同奖励组合“崩塌”为相同评分,导致AI迷失方向。全新GDPO算法闪亮登场,它分别归一化各奖励再加总,如“分科打分再汇总”,保留关键信息。通过多项任务验证,GDPO的效果显著提升,还巧妙借助条件奖励解决了权重难题,为实现更精细、可控的AI迈出关键一步。
  • AI模型那么多,你是靠什么做选择呢?总不能是网络热度吧》AI模型频出,为何有人能快速判断优劣,你却只能等别人测评?关键在于是否建立自己的判断标准,Anthropic发布的文章为你揭秘。首先明确判断对象,再依任务类型选判断方式,区分能力与回归评估目的,了解“毕业”机制与评估指标。按照8步路线图搭建评估体系,结合多层防护,就可以建立自己的标准。
  • “中国CES”1500+ AI硬件全整理!WaytoAGI带你逛阿里云通义智能硬件展》错过美国CES 2026别遗憾,“中国版CES”——阿里云通义智能硬件展不容错过!1月8-11日深圳开展,220 多家企业携 1500 多件展品亮相,众多新品首发。在这里,能看到会“看”世界的AI眼镜、多功能打印机等新奇产品,还有萌趣的AI陪伴玩具、实用的智能家居设备。展会夜场的思想交流与创作比拼也超有料。正如黄仁勋所言,AI下一个战场在物理世界,中国正积极参与这场变革,快来一同感受AI带来的奇妙变化吧! c65d799f-ee22-4682-ab45-05a8a0bb4dbd.png
  • 喝点VC|YC 内部内部复盘:AI 正在进入稳定期,并逐渐形成一套可复用的AI原生公司构建路径》想洞悉AI经济的发展脉络?来Y Combinator这档节目一探究竟!AI经济格局逐渐稳定,模型、应用与基础设施层清晰分化。令人意外的是,Anthropic 超越 OpenAI,成为YC创始人最爱用的API。虽现算力过剩与资本热投,但这更像基础设施泡沫,并非AI价值尽头。未来竞争将从模型能力转向产品应用,当下也是初创公司发展的机遇期,速来围观! 481700a8-83bd-4713-b77c-ca5523f65169.png
  • 五步框架:把 Workflow 变成可进化的 Skill》在AI任务执行方式的探讨中,workflow与Agent+Skills谁更胜一筹?作者宝玉认为多数workflow场景可被Agent+Skills取代。workflow虽有确定性,但在复杂逻辑处理、灵活性及移植性上表现欠佳。而Agent + Skills通过拆分、编排、存储、分摊、迭代五步框架,不仅能实现复杂任务,还具备持续进化优势,或许是一个可值得探索的自动化方案! 97052925-7689-4033-98bf-fa1c41570c55.png
知识库精选
相关推荐
知识库精选-2026年4月24日
知识库精选-2026年4月24日
《读完这篇,你就搞懂 DeepSeek v4 了》 《GPT Image2提示词:字体美学 x 单词视觉化 x 字体气质理解 x 要成精了!》 《2026 年每个 AI Agent 构建者都必须使用的 Memory Stack(译)》 《Claude 接进 Blender、Adobe、Ableton,Anthropic 一次放 9 个创作连接器》 《2026 年如何搭建一个多智能体编码栈(译)》 《如何把 AI Agent 用进你的生意、内容和生活丨Calum Johnson》
知识库精选
知识库精选-2026年4月27日
知识库精选-2026年4月27日
《AI音乐周刊 W.A 025》 《4.19-4.26|本周 AI 论文精选》 《用 Subagents 保持 Claude Code 上下文干净(译)》 《AI Engineer 学习路径(译)》 《喝点VC|a16z联合创始人:真正危险的不是投错项目,而是错过下一个Google》 《YC CEO:如何让 Claude 为你的 AI 工程团队编写代码?丨Y Combinator》
知识库精选
知识库精选-2026年4月26日
知识库精选-2026年4月26日
《你不知道的 AI Coding:非技术人的上手、场景与实战》 《为 Agent 设计产品【译】》 《记忆,是 Agent 基建|对话 Calvin@Vida》
知识库精选
知识库精选-2026年4月24日
知识库精选-2026年4月24日
《顶级孵化器YC的最新指南:如何构建AI Native的团队,为什么传统管理层正在消失?》 《子智能体 vs 智能体团队:颠覆全局的架构抉择》 《AI / ML 所需线性代数知识(完整路线图)》 《Z Tech|对话王子涵:离开DeepSeek,我人生的逆向思考》 《如何构建一个 Deep Researcher(译文)》 《DeekSeekV4发布》 《Cat Wu 面试了几百个 PM 候选人,几乎没人答对一个问题:AI 产品经理到底应该干什么?》
知识库精选
知识库精选-2026年4月23日
知识库精选-2026年4月23日
《🧠✨ChatGPT 5.5 有了判断力》 《Kora产品负责人:如果Agent负责中间 80% 的工作,人还剩什么价值?丨Every》 《斯坦福经济学家:职业阶梯正在失效,年轻人该怎么在 AI 时代往上走?丨EO》 《OpenAI 发布 Workspace Agents,接替 GPTs》
知识库精选
知识库精选-2026年4月22日
知识库精选-2026年4月22日
《可以优化生图提示词 的 提示词》 《乔木博客免费开源,打造你的学习、分享阵地!》 《大羽玩AI:《带你去玩球!》 技术白皮书》 《发现意图:AI 时代的用户体验设计》 《GPT Image 2 全量开放!100+案例,跟 Nano Banana 2 正面PK(附提示词)》
知识库精选
知识库精选-2026年4月21日
知识库精选-2026年4月21日
《我逆向了Claude Design!免费开源!》 《AI 编程三剑客:Spec-Kit、OpenSpec、Superpowers 深度对比与实战指南》 《(可能全网最全/长的)Hermes Agent+K2.6 保姆教程 + 实战案例》 《GPT-Image-2 全量上线,中文顶到爆,50+ Case 生图实测》 《前 Google PM:从 PRD 到原型,Claude Code 正在重写 PM 工作流丨Aakash Gupta》
知识库精选
知识库精选-2026年4月20日
知识库精选-2026年4月20日
《最值得安装的20个Skills》 《从0开始,在国内用上Claude Code的终极保姆教程来了。》 《听说让Figma、Adobe股价大跌的Claude Design提示词泄露了,我深挖了7个提示词技巧给你们抄作业》 《一文看全WaytoAGI@2050三日亮点,这些环节不容错过! 》 《AI音乐周刊 W.A 024》 《Meta产品高管:旧版产品经理已死,取而代之的是AI-first建造者 | Lenny's Podcast》
知识库精选