与知识库对话 - 主流大厂目前的agi 进展

回答

目前主流大厂在 AGI 方面的进展情况如下：

2023 年之前，国内 AI 行业自认为与美国差距不大，但 ChatGPT 和 GPT4 的出现打破了这种认知，OpenAI 直接拉开了 2 年的技术差距。
2023 年上半年，国内大厂纷纷囤卡招人，研究类 GPT 架构，或成立创业公司，试图创造国产 AGI。但下半年发现不容易后，纷纷转向“垂直应用”“商业化”，不再提 AGI。
国内最领先的模型水平大概在准 ChatGPT3.5 的水平，和 GPT4 还有不小差距。
百度和阿里在大厂中比较高调，百度的“文心 4.0”是当前国内能力较好的模型之一，即将发布的阿里的“通义千问”也备受关注。
大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件，但实际效果尚无明确亮点，且受内部短期考核压力影响，多数力量用于卷新产品和向上汇报工作，同时还背负其他业务和政治考量。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

AGI万字长文（上）| 2023回顾与反思

从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问

红杉｜AI 50 未来公司

原文链接：https://www.sequoiacap.com/article/ai-50-2024/发表时间：2024-4-11作者：Konstantine Buhler编译：Z Potentials去年，生成式AI从不引人注意的地方走到了AI 50强榜单的前列。今年，随着我们看到企业用户和消费者的AI生产力开始大幅提高，它成为前沿和中心。尽管2023年美国的大部分AI风投都流向了基础设施领域——其中60%流向了最大的大语言模型（LLM）提供商，但应用公司仍在AI 50强榜单中占据主导地位。与此同时，我们开始看到AI如何为公司赋能。如今，许多公司正将AI融入其工作流程，以此来快速达成KPI。我们看到大公司正通过将AI融入其产品的方式而获益。工作流程自动化平台ServiceNow通过AI驱动的Now Assist，实现了近20%的事件避免率。Palo Alto Networks利用AI降低了处理费用的成本。Hubspot利用AI扩大了能够支持的用户规模。瑞典金融科技公司Klarna最近宣布，通过将AI融入用户支持，他们在运行率方面节省了4000多万美元。现在，成千上万的公司正在将AI整合到他们的工作流程中，以扩张规模和降低成本。AI 50强企业正在快速进化。不远的将来，我们有望看到UX和UI围绕AI的功能进行重新设计。在更好、更廉价地复制现有功能之后，我们将开发全新的用户界面，以提供有价值的新体验。

AGI 万字长文（下）| 2024，分叉与洪流

在AI上发力的还有手机和PC厂商:华为、荣耀、小米、OPPO、VIVO、三星、联想等都已宣布会在手机/PC端侧搭载大模型。这个可能性来自于：2023年下半年“模型小型化”的众多进展（详情见“上篇”）。不过，仔细看来，除了很弱的Nvidia Chat with RTX，目前并没有真正全离线版的大模型产品，端上智能暂时还是噱头。手机和电脑厂商们的打法基本都是大模型还是放在线上，手机和电脑来调用，然后搭配一个小AI做总结等服务。“端”确实“智能”了，但"大脑"还在线上，手机上顶多有个"脑干"。纯粹的端上智能有几个问题：1)离线小模型永远都会和在线大模型有一个代际的能力差距，于是为什么消费者要用一个更傻的模型而不是用线上的模型服务？2)即使是小模型，它目前的耗能和生热仍然难以达到手机要求。3)目前的AI还不是刚需，猎奇成分比较多。4)技术上还不能确认小型化的模型是“真AGI”还是“聊天机器”。所以说，短期内的端上智能仍然会停留在一些个别小市场里。