Chat with Wiki - 北大清华伯克利等知名高校最新AI研究成果

Answer

以下是北大清华伯克利等知名高校的最新 AI 研究成果：国内方面： - 清华大学的自然语言处理实验室资助了 OpenBMB 项目，催生了 MiniCPM 项目，这是可以在设备上运行的小型<2.5B 参数模型，其 2.8B 视觉模型在某些指标上仅略低于 GPT-4V。 - 阿里巴巴最近发布了 Qwen-2 系列，社区对其视觉能力印象深刻，能完成从具有挑战性的 OCR 任务到分析复杂的艺术作品等。国外方面： - Stability AI 发布的 Stable Video Diffusion 是第一个能够从文本提示生成高质量、真实视频的模型之一，并且在定制化方面取得了显著的进步。今年 3 月，他们推出了 Stable Video 3D，该模型经过第三个对象数据集的微调，可以预测三维轨道。 - OpenAI 的 Sora 能够生成长达一分钟的视频，同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁，类似于在变压器模型中使用的令牌，但用于视觉内容，以高效地从大量视频数据集中学习。此外，Sora 还使用了其原始大小和纵横比的视觉数据进行训练，从而消除了通常会降低质量的裁剪和缩放。 - Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入相结合，通过编码器和潜在扩散模型处理它们，以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。此外，Geoffrey Hinton 让“深度学习”从边缘课题变成 Google 等网络巨头仰赖的核心技术。Hinton 和他的团队让 CIFAR 获得丰厚回报，深度学习也成为目前的主流。Hinton 冷静、谦逊与公平的态度为 NCAP 建立了良好的开放合作氛围，推进了世界的 AI 研究工作。关于未来研究方向的参考资料包括： - 人工智能技术与安全研究：DeepMind、OpenAI、MIT、Stanford、Berkeley 等机构的论文，“AI Index”（斯坦福大学发布）、OpenAI 技术博客、Google AI Blog 等技术报告，专家著作如 Nick Bostrom《Superintelligence》、Stuart Russell《Human Compatible》等。 - 经济与社会变迁：IMF、世界银行、OECD、WEF（世界经济论坛）的未来就业与技术报告，未来学与社会预测如 Herman Kahn、Ray Kurzweil《The Singularity is Near》等，科技史与社会影响方面如 Joseph Schumpeter（创新与经济周期）、Carlota Perez（技术革命与金融资本），以及经济学者对产业革命的历史演化研究。 - 政治与国际关系：联合国关于 AI 和数字治理的政策文件、欧盟 AI Act 的立法草案与相关研究，前沿智库与研究中心如 Future of Humanity Institute(牛津大学)、Machine Intelligence Research Institute(MIRI)、Brookings、RAND Corporation 等，军事与国防方面如美国国防部和 NATO 对 AI 的战略规划，中国、欧盟、日本等国家的 AI 国家政策及军民融合案例。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？

**中国开源项目在今年赢得全球粉丝，并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出，成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱，其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列，社区对其视觉能力印象深刻，从具有挑战性的OCR任务到分析复杂的艺术作品，都完成的非常好。在较小的一端，清华大学的自然语言处理实验室资助了OpenBMB项目，该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年，这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion，是第一个能够从文本提示生成高质量、真实视频的模型之一，并且在定制化方面取得了显著的进步。并且在今年3月，他们推出了Stable Video 3D，该模型经过第三个对象数据集的微调，可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频，同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁，类似于在变压器模型中使用的令牌，但用于视觉内容，以高效地从大量视频数据集中学习。除此之外，Sora还使用了其原始大小和纵横比的视觉数据进行训练，从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合，通过编码器和潜在扩散模型处理它们，以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

Geoffrey Hinton 是这个人，一步步把“深度学习”从边缘课题变成Google等网络巨头仰赖的核心技术

只用了一年，Hinton和他的团队就让CIFAR看到他们的投资会有多么丰厚的回报。而Google已经尝到了甜头。在这个过程中，Hinton和NCAP已然让人刮目相看。相比传统的工程技术，大学生们更乐意去从事深度学习的研究，来自阿姆斯特丹大学的计算机科学教授Max Welling如是说，“就算是远在荷兰的大学生，他们也知道正在发生什么事，他们都想投奔到这个行业来呢。”换句话说，深度学习是目前的主流。“我们不再是极端分子了，”Hinton说，“我们现在可是炙手可热的核心技术呢。”Hinton和深度学习的未来秋季，NCAP在旧金山举行了年度研讨会。该研讨会探讨范围广泛，包括了神经系统科学，机器学习，计算机图形设计，面部识别和运动检测等方面。在演讲途中，Hinton静静的站在讲台附近，大多数情况下，他只是聆听，只是偶尔打断演讲者提出一两个问题，或鼓励他的智囊团提出问题并及时讨论。他的冷静、谦逊与公平，对NCAP的成员来说，建立了一个良好的开放合作的氛围，这给他们带来了鼓励，也直接推进了世界的AI研究工作。深度学习的革命是迟早会发生的，但有了NCAP，有了Hinton，微软、Google、雅虎等网络巨头在语音识别、人工视觉系统等方面的发展就提前了许多。“Geoff就像正能量，每个人都想向他看齐。”Bruno Olshausen，加州大学伯克利分校的Redwood神经系统科学研究中心的主任如是评价。即便不是NCAP的成员也对此表示同意。“在过去的20到30年里，他一直在推动着神经网络和深度学习在前进，”余凯，百度深度学习研究院副院长提到，“在此之前，机器学习或者AI技术从未如此对行业产生过如此迅猛的影响。”

[趋势研究] Deep Research - AGI 实现后未来 20 年人类社会的变革

注：以下并非具体文献，而是指引阅读与研究的方向，可进一步收集文献、报告、论文、数据集等。人工智能技术与安全研究Academic Papers:DeepMind、OpenAI、MIT、Stanford、Berkeley等机构的论文。技术报告:“AI Index”（斯坦福大学发布）、OpenAI技术博客、Google AI Blog等。专家著作:Nick Bostrom《Superintelligence》、Stuart Russell《Human Compatible》等。经济与社会变迁经济学与社会学研究:IMF、世界银行、OECD、WEF（世界经济论坛）的未来就业与技术报告。未来学与社会预测:Herman Kahn、Ray Kurzweil《The Singularity is Near》等。科技史与社会影响:Joseph Schumpeter（创新与经济周期）、Carlota Perez（技术革命与金融资本），以及经济学者对产业革命的历史演化研究。政治与国际关系国际组织材料:联合国关于AI和数字治理的政策文件、欧盟AI Act的立法草案与相关研究。前沿智库与研究中心:Future of Humanity Institute(牛津大学)、Machine Intelligence Research Institute(MIRI)、Brookings、RAND Corporation等。军事与国防:美国国防部和NATO对AI的战略规划，中国、欧盟、日本等国家的AI国家政策及军民融合案例。