AGI 的发展具有以下几个方面的特点和趋势:
至此,已经带领大家领略了一次最新的智能变革,从模型到应用,从智能代理到具身智能,从新工业革命到挑战科研。现在,我们来聊一下大家最关心也最为模糊的话题- AGI是什么?在我的理解中它会如何到来?Deepmind的研究团队在去年十一月发表过一篇论文《Levels of AGI》,他们给AGI的定义提出了六个原则,其中最重要的一点“关注能力,而非过程”,我们应该关注AGI能完成什么,而不是它如何完成任务。这意味着AGI系统不需要像人类一样思考或理解,也不需要具备意识或感知能力。另外,应该类似于自动驾驶的分级标准,AGI的定义应包括多个级别,每个级别都有明确的度量标准和基准。这种方法有助于更清晰地描述AGI的发展、评估风险和制定相应的政策。配图4.08:Six Levels of AGI(Table)有一个最常见,也是我认为比较合理和可验证的定义:AGI是一种自主系统,在大多数具有经济价值的工作中超越了人类的能力。这也是Sam Altman经常挂在嘴边说的,用自动化来贡献GDP。Andrej Karpathy今年初在他的博客上发过一篇名为《Self-driving as a case study for AGI》的文章,但不知道为什么很快就删除了,全文表达的意思就是用自动化的交通服务来类比AGI和它的经济价值。
我去年5月份写了篇文章[《AGI|大模型与大国博弈》](http://mp.weixin.qq.com/s?__biz=MzkyMTY1MTM4Mw==&mid=2247483691&idx=2&sn=4968228195e05a00d2357742b202e3a0&chksm=c18110f3f6f699e50b584eef6240abeea6785b700e092219ed77137871b461e3e00c6684ab7b&scene=21#wechat_redirect),今天来看几个大判断基本是对的:最先进的AGI世界模型不会开源:不仅OpenAI的GPT4,Sora不开源;连原来支持开源的Google-Gemini,Anthropic-Claude,Mistral-Large都没开源;国内的当然也没有人开源。不过,这并不意味着开源生态会失效,大概率会是开源模型会落后闭源一个代际,但会服务更广泛的各种专业应用。美国对于中国的硬件-科技限制进一步升级。不赘述了,这个是割韭菜的自媒体最爱讲的。AGI将对于全行业科技发展起到推动作用。这点目前仅仅是苗头,但AGI在各领域的科研中越来越重要是既定的事实。以及,如果AGI的能力有比较大差距,对于科技进步-经济发展将产生质变性的影响。有更好AGI的国家会有更快的全面技术进步。对于AI的立法、监管、伦理讨论大范围落后于技术发展。全世界主要国家都急于拥有有自己的AI,当然不会有人搬起石头砸自己的脚。目前唯一有点对于AI治理讨论的只有欧洲,而且也都在纸面上。我国相关法规讨论的出发点完全在于“对于舆论的影响”,根本没有触及AGI本身的伦理问题。决策路径大概是政治>经济>>AI伦理。
在生成式AI的下一个阶段,我们预计推理研发的成果将快速且深入地渗透到应用层。过去,很多认知架构依赖于巧妙的“解锁”技术;而随着这些能力逐渐深度嵌入到模型中,自主应用程序的复杂性和稳健性将会迅速提升。在研究实验室中,推理和推理时计算将继续成为未来的重要议题。随着新的扩展法则的出现,新的竞赛已经开始。但在特定领域中,获取真实世界的数据并构建领域和应用特定的认知架构仍然是一个巨大的挑战。这意味着,在解决现实世界中多样化问题时,“最后一公里”的应用提供商可能更具优势。展望未来,多代理系统,如Factory的“机器人”,可能会成为建模推理和社会学习过程的主流方式。一旦AI能够执行工作,我们将能组建团队,让“工人”完成更多任务。我们所期待的,是生成式AI的“第37步”时刻——就像AlphaGo在与李世石对战的第二局中出人意料的那一步棋。当一个通用AI系统展现出超越人类的思考和决策时,那一刻便会到来。这并不意味着AI将“觉醒”(AlphaGo并没有),而是AI在感知、推理和行动的模拟过程中,能够以全新的方式进行探索。这或许就是通用人工智能(AGI),但如果是这样,它并不会是单一的奇迹,而是技术发展的下一个阶段。