Navigate to WaytoAGI Wiki →

知识库精选-2026年1月11日

·2026-01-10·#知识库精选
知识库精选-2026年1月11日
  • 英伟达GDPO论文解读:多奖励强化学习的正确打开方式》当AI追求多目标时,传统GRPO算法竟会“失灵”?NVIDIA论文揭示,GRPO把多奖励加总后归一化,让不同奖励组合“崩塌”为相同评分,导致AI迷失方向。全新GDPO算法闪亮登场,它分别归一化各奖励再加总,如“分科打分再汇总”,保留关键信息。通过多项任务验证,GDPO的效果显著提升,还巧妙借助条件奖励解决了权重难题,为实现更精细、可控的AI迈出关键一步。
  • AI模型那么多,你是靠什么做选择呢?总不能是网络热度吧》AI模型频出,为何有人能快速判断优劣,你却只能等别人测评?关键在于是否建立自己的判断标准,Anthropic发布的文章为你揭秘。首先明确判断对象,再依任务类型选判断方式,区分能力与回归评估目的,了解“毕业”机制与评估指标。按照8步路线图搭建评估体系,结合多层防护,就可以建立自己的标准。
  • “中国CES”1500+ AI硬件全整理!WaytoAGI带你逛阿里云通义智能硬件展》错过美国CES 2026别遗憾,“中国版CES”——阿里云通义智能硬件展不容错过!1月8-11日深圳开展,220 多家企业携 1500 多件展品亮相,众多新品首发。在这里,能看到会“看”世界的AI眼镜、多功能打印机等新奇产品,还有萌趣的AI陪伴玩具、实用的智能家居设备。展会夜场的思想交流与创作比拼也超有料。正如黄仁勋所言,AI下一个战场在物理世界,中国正积极参与这场变革,快来一同感受AI带来的奇妙变化吧! c65d799f-ee22-4682-ab45-05a8a0bb4dbd.png
  • 喝点VC|YC 内部内部复盘:AI 正在进入稳定期,并逐渐形成一套可复用的AI原生公司构建路径》想洞悉AI经济的发展脉络?来Y Combinator这档节目一探究竟!AI经济格局逐渐稳定,模型、应用与基础设施层清晰分化。令人意外的是,Anthropic 超越 OpenAI,成为YC创始人最爱用的API。虽现算力过剩与资本热投,但这更像基础设施泡沫,并非AI价值尽头。未来竞争将从模型能力转向产品应用,当下也是初创公司发展的机遇期,速来围观! 481700a8-83bd-4713-b77c-ca5523f65169.png
  • 五步框架:把 Workflow 变成可进化的 Skill》在AI任务执行方式的探讨中,workflow与Agent+Skills谁更胜一筹?作者宝玉认为多数workflow场景可被Agent+Skills取代。workflow虽有确定性,但在复杂逻辑处理、灵活性及移植性上表现欠佳。而Agent + Skills通过拆分、编排、存储、分摊、迭代五步框架,不仅能实现复杂任务,还具备持续进化优势,或许是一个可值得探索的自动化方案! 97052925-7689-4033-98bf-fa1c41570c55.png
知识库精选
相关推荐
知识库精选-2026年3月18日
知识库精选-2026年3月18日
《MiniMax M2.7: 开启模型的自我进化》 《OpenClaw🦞养虾基建系列[1]:yt-dlp 可下载1700个网站视频的瑞士军刀》 《深度|OpenAI对话OpenClaw:AI 正在重新定义开发者,以一种玩乐的心态去面对AI》 《每个ADK开发者都应该了解的5种 Agent Skill 设计模式》 《构建 Claude Code 的经验:我们如何使用 Skills》
知识库精选
知识库精选-2026年3月17日
知识库精选-2026年3月17日
《一文讲透:OpenClaw多agent模式下Skills的分层调用机制》 《Harness Engineering 深度解读:AI Agent 时代的工程范式革命》 《花 2000 多块买了台 MacBook Neo 养龙虾,结果把它拆了个底朝天!(亲测!!)》 《黄仁勋2小时都发布了什么:英伟达 GTC 2026 “AI春晚” 全部重磅,一文看完》
知识库精选
知识库精选-2026年3月15日
知识库精选-2026年3月15日
《第3课:数据中枢——小龙虾协同多维表格》 《保姆级OpenClaw+Claude Code术语全攻略(万字长文)》 《从底层机制一文讲透:OpenClaw🦞如何运行多Agents》 《AI 记忆系统的核心公式:召回 = 存储 + 检索(一点小感悟)》 《OpenClaw 记忆系统演进系列(二)——构建主被动记忆的防线》 《为什么视频营销仍被低估?为什么公司没有“传统”PM?》 《大白话读懂AI的27 个大语言模型核心概念》
知识库精选
知识库精选-2026年3月14日
知识库精选-2026年3月14日
《OpenClaw 命令行手册》 《彬子:拯救金鱼记忆,OpenClaw 记忆系统演进系列(一)——搭建记忆结构的底座》 《AI 学习系统搭建指南:手把手教你打造属于你的AI私教》 《2026年了,你的拖延症,连AI都看不下去了》 《未来软件的用户将不是人...》 《深度|Anthropic CEO:AI行业的盈利本质上源于对市场需求的低估,而亏损则因为高估了需求,2030年AI行业营收将跃迁至万亿美元级》 《最全整理:有关 OpenClaw 的限制条令汇总》
知识库精选
知识库精选-2026年3月13日
知识库精选-2026年3月13日
《秒懂大模型API,教你免费体验OpenClaw》 《实测3款主流开源OCR模型:DeepSeek、PaddleOCR、GLM》 《智能体工程的 8 个等级》 《三分钟大白话:什么是SubAgent?它凭什么让OpenClaw、Claude Code、Codex中都有它的影子》 《你不知道的 Claude Code:架构、治理与工程实践》 《Uber 如何用 AI 做开发:内部实况揭秘》
知识库精选
知识库精选-2026年3月12日
知识库精选-2026年3月12日
《全链路追踪:扒开 OpenClaw 最核心的架构设计图纸》 《《OpenClaw 从入门到精通指南》正式发布,开源免费!》 《Mango:斯坦福CS146S:分布式追踪,你的系统出了问题,你为什么找不到?》 《a16z:Agent 表现不好,可能是缺乏正确的数据上下文》 《「文科生友好」手把手教你部署Claude Code,顺便聊聊OpenClaw》 《为什么当今企业都在招GTM工程师了?》 《李宏毅用 OpenClaw 讲透 AI Agent 运作原理》
知识库精选
知识库精选-2026年3月11日
知识库精选-2026年3月11日
《Gemini Embedding 2:原生多模态 embedding 模型》 《编程 Agent 如何重塑工程、产品和设计》 《【虾说】我如何带领人类同事在一个月内实现翻倍增长》 《为什么 100 万 token 窗口也救不了你的 Agent? 》 《第1课:认知破局——认识OpenClaw小龙虾》 《麻省理工研究生利用AI 将一个学期的学习压缩到 48 小时内学完》
知识库精选
知识库精选-2026年3月10日
知识库精选-2026年3月10日
《OpenClaw橙皮书-从入门到精通.pdf》 《🤖用最简单的比喻,让你秒懂OpenClaw工作原理》 《我用Claude code开发了一个微信小程序:实测78个skills,这5个组合最香》 《OpenClaw Skill下载榜 2026年3月10日》 《AI 新手扫盲 —— 一文带你了解 LLM、Chatbot、Agent》 《VPS 到手后的第一个小时:从裸机到安全可用的完整初始化指南(让你的OpenClaw更安全)》 《不写代码也能驯服 Claude Code》
知识库精选