Navigate to WaytoAGI Wiki →

知识库精选-2025年5月26日

·2025-05-25·#news
知识库精选-2025年5月26日
  • 今天,我们推出xbench》红杉中国推出AI基准测试工具xbench及相关论文,旨在构建科学的AI评测体系。随着AI发展,传统基准测试难反映其真实能力。xbench采用双轨评估与长青评估机制,首期发布两个核心评估集并对产品排名,构建垂类Agent评测框架。它打破惯性,兼顾能力上限与实际效用,欢迎各界完善,引领AI评测新范式。 526-1.png
  • 深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的》红杉资本分享对谈 Anthropic 首席产品官 Mike Krieger 的内容。Mike 称未来 AI 生成内容真假不再重要,来源可信才关键。好产品多 “自下而上” 生长,像 MCP 协议。Anthropic 内部积极拥抱 Claude ,未来聚焦 Agent 。但目前 AI 产品易用性待提升,行业还有诸多难题待解,精彩观点不容错过! 526-2.png
news
相关推荐