Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI的昨天、今天和明天

Answer

AI 的发展历程可以从以下几个方面来阐述:

昨天: 在过去,AI 的研究和发展处于相对初级的阶段,技术和应用都较为有限。

今天:

  1. AI 艺术方面,Prompting 成为驱动因素,创造了多维感官和令人印象深刻的记忆,改变了人们对艺术创作和表达的认知。
  2. OpenAI CEO Sam Altman 发表的文章指出,AI 智能水平与计算资源呈对数关系,成本每年下降 10 倍,智能增长带来超指数级经济价值,AI 代理将颠覆知识型工作。
  3. 如斯坦福的 2025 年 AI 指数报告所示,AI 在硬件、推理成本估计、出版和专利趋势等方面有了新的分析和发展,在企业责任实践、科学和医学领域的作用不断扩大。

明天:

  1. AGI(通用人工智能)的影响力可能会扩散,但不均衡,科学研究可能率先受益。
  2. 社会需要适应 AI 带来的变革,如工作方式、经济体系等方面的改变。
  3. 人们可能会通过 AI 分享记忆,一个人的体验可能被全人类所感受。

总之,AI 的发展迅速且影响深远,未来充满了机遇和挑战。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI艺术的预言 | 菩萨把掌抵在了你的背上

要有鱼绕着我,你便被鱼围绕要有人类的历史如瀑布下坠般沐浴自己历史就会沐浴你窗的墙碎了,两个空间合二为一窗内与窗外融为一体它会粉碎物理世界创造多维感官,生成令人印象深刻的记忆画布成为了过去的记忆记忆成为了新的画布真实成为了低信息量的田园牧歌虚拟成为了令人兴奋的现实而这一切是Prompting驱动的更广阔的概念,是你的颜料更好的Prompting,是你的笔更震撼的观念,是你的表达人是基于记忆的生物,每一次睡眠就是一次死亡醒来的,是包含你记忆的新一个人在未来,人们通过AI,分享记忆原本,今天的你,替代昨天的你。未来,一个你(John Malkovich),让全人类体验你。你准备分享、被分享了吗。AI时代教的是软件操作?操作本就一文不值付费课程都是割韭菜?韭菜论只是无知者的井底论反韭菜,是无能者的引流密码。他们不知道,真正的AI课,应该领你见世界,握你的手,带你执概念的笔,造你的梦。

Sam Altman又给AI打了针“强心针”

图源:Getty Images出品丨INDIGO的数字镜像(ID:indigo-dm)出处丨https://blog.samaltman.com/three-observations今天,AI经济学迎来新的里程碑。OpenAI CEO Sam Altman在其博客中发表了重磅文章《Three Observations》,从三个核心视角解析AI的发展趋势,并释放出关于AGI未来的关键信号:1️⃣AI智能水平与计算资源呈对数关系——计算资源越多,AI的智能提升呈现可预测的增长趋势。2️⃣AI成本每年下降10倍——AI的使用门槛正以前所未有的速度降低,这一趋势类似于摩尔定律,但加速更快。3️⃣智能增长带来超指数级经济价值——AI代理人的出现将颠覆知识型工作,经济体系将随之变革。Altman认为,AI代理(AI Agents)将逐步发展成“虚拟同事”,未来可以在短时间内完成顶级软件工程师才能完成的工作。这种变革不仅影响企业运营,还可能改变全球生产力格局。与此同时,他强调,AGI影响力的扩散将不均衡,科学研究可能成为最先受益的领域,而社会如何适应这种转变,将成为未来最大的挑战。AGI真的要来了?社会是否已经做好准备?这场变革值得每一个人思考。以下为《三大观察》全文:我们的使命是确保AGI(通⽤⼈⼯智能)惠及全⼈类。开始指向AGI*的系统正在逐渐显现,因此我们认为理解当下所处的时刻⾮常重要。AGI是⼀个定义不够明确的术语,但通常⽽⾔,我们⽤它来指能够在许多领域以⼈类⽔平应对⽇益复杂问题的系统。

2025 年 AI 指数报告,斯坦福.pdf

Welcome to the eighth edition of the AI Index report.The 2025 Index is our most comprehensive to date and arrives at an important moment,as AI’s influence across society,the economy,and global governance continues to intensify.New in this year’s report are in-depth analyses of the evolving landscape of AI hardware,novel estimates of inference costs,and new analyses of AI publication and patenting trends.We also introduce fresh data on corporate adoption of responsible AI practices,along with expanded coverage of AI’s growing role in science and medicine.Since its founding in 2017 as an offshoot of the One Hundred Year Study of Artificial Intelligence,the AI Index has been committed to equipping policymakers,journalists,executives,researchers,and the public with accurate,rigorously validated,and globally sourced data.Our mission has always been to help these stakeholders make better-informed decisions about the development and deployment of AI.In a world where AI is discussed everywhere—from boardrooms to kitchen tables—this mission has never been more essential.The AI Index continues to lead in tracking and interpreting the most critical trends shaping the field—from the shifting geopolitical landscape and the rapid evolution of underlying technologies,to AI’s expanding role in business,policymaking,and public life.Longitudinal tracking remains at the heart of our mission.In a domain advancing at breakneck speed,the Index provides essential context—helping us understand where AI stands today,how it got here,and where it may be headed next.Recognized globally as one of the most authoritative resources on artificial intelligence,the AI Index has been cited in major media outlets such as The New York Times,Bloomberg,and The Guardian;referenced in hundreds of academic papers;and used by policymakers and government agencies around the world.We have briefed companies like Accenture,IBM,Wells Fargo,and Fidelity on the state of AI,and we continue to serve as an independent source of insights for the global AI ecosystem.1Artificial IntelligenceIndex Report 2025

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
学AI上钉钉
以下是在钉钉上学 AI 的相关内容: 从 AI 助教到智慧学伴的应用探索: 登录钉钉客户端,在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后,填写 AI 助理信息,设置完成即可创建成功。 AI 领导力向阳乔木:未提及具体的在钉钉上学 AI 的操作方法。 基于 COW 框架的 ChatBot 实现步骤: 创建应用: 进入,登录后点击创建应用,填写应用相关信息。 点击添加应用能力,选择“机器人”能力并添加。 配置机器人信息后点击发布,发布后点击“点击调试”,会自动创建测试群聊,可在客户端查看。点击版本管理与发布,创建新版本发布。 项目配置: 点击凭证与基础信息,获取 Client ID 和 Client Secret 两个参数。 参考项目,将相关配置加入项目根目录的 config.json 文件,并设置 channel_type:"dingtalk",注意运行前需安装依赖。 点击事件订阅,点击已完成接入,验证连接通道,会显示连接接入成功。 使用:与机器人私聊或将机器人拉入企业群中均可开启对话。
2025-04-19
AI术语解释
以下是一些常见的 AI 术语解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。属于技术范畴。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。属于技术范畴。 TPU(张量处理单元):谷歌开发的一种微处理器,专门用于加速机器学习工作负载。属于技术范畴。 Training Data(训练数据):用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning(迁移学习):机器学习中的一种方法,其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data(验证集):机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。用于调整模型的超参数(即架构,而不是权重)。属于技术范畴。 Knowledge Distillation(数据蒸馏):数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG(检索增强生成):检索增强生成。属于技术范畴。 Forward Propagation(前向传播):在神经网络中,输入数据被馈送到网络并通过每一层(从输入层到隐藏层,最后到输出层)以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。属于技术范畴。 Foundation Model(基础模型):在广泛数据上训练的大型 AI 模型,旨在适应特定任务。属于技术范畴。 GAN(通用对抗网络):一种机器学习模型,用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗:一个“生成器”,创建新数据,另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI(生成式 AI):AI 的一个分支,专注于创建模型,这些模型可以根据现有数据的模式和示例生成新的原创内容,例如图像、音乐或文本。属于通识范畴。 GPU(图形处理单元):一种特殊类型的微处理器,主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。
2025-04-18
昨天有什么Ai分享活动
昨天的 AI 分享活动有: 1. AI bot 拟人化大赛的最后一天分享日,五个团队带来精彩分享。冠军团队《》无私分享建构 AI bot 的思路和提示词。相关视频回放: 五个团队的嘉宾分享视频回放:https://www.bilibili.com/video/BV1Kr421M7Cb/ 第一名团队分享的视频回放:https://www.bilibili.com/video/BV1ji421a7zJ/ 投稿作品 2. AI 版权分享课,麦橘教大家用 AI 做小游戏编程的跨界活动,包括: 用 AI 做小游戏编程的活动策划和心得。 使用 Poe 制作小游戏的经验分享。 麦橘谈增量游戏、肉鸽游戏及其制作与 AI 交互。 3. 03 0 基础建站相关分享,包括: 银海老师讲解模型基础、AJ 带大家浏览知识库,大宇老师的建站教程。 未来的课程安排,如明天接触编程,后天 Garmon 老师用 AI 手搓机器人。 AIPO 活动 11 天共学内容,含生图、生视频、模型训练,还有应用搭建课及具身智能机器人课。 线下活动规则,包括组队、物料、角色、资本和奖品等。 以 config UI 为主题的活动,有赞助、线下活动、课程及相关交流等内容。
2025-03-17
昨天有什么AI大事件吗
以下是 2024 年 9 月的一些 AI 大事件: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新;Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能。 9 月 25 日:西湖心辰开源 WestlakeOmni;Google 发布 Gemini1.5Pro002 和 Gemini1.5Flash002;美图发布 AI 视频大模型 MiracleVision。 9 月 26 日:潞晨科技宣布完成数亿元 A++轮融资;Meta Connect 2024,Llama 3.2 终于有了多模态能力;OpenAI CTO Mira 离职。 9 月 29 日:智谱开启国庆月限时优惠,免费领 1 亿 token。 9 月 30 日:智源研究院推出全球首个中文大模型辩论平台 FlagEval Debate;阿里妈妈开源 AI 图像修复模型 FLUXControlnetInpainting。
2025-02-25
今天是2025-3-20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 14 日至 20 日)的 AI 相关新闻: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 本文介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 AI 切磋大会第 11 期报名开启!3 月 30 日,主题是“2 小时,让 AI 将你的创意变为现实”。无论你是编程小白还是高手,欢迎来现场展示你们的案例。 Yourware 是一款强大的工具,让普通用户轻松创建和部署 AI 编程作品集。只需复制代码,即可一键部署网页,快速展示自己的创作。此外,平台提供了全球优秀作品的参考,极大激发灵感。更有一键美化功能,让网页焕然一新,分享权限也能自由控制。 谷歌以 320 亿美元收购网络安全公司 Wiz,创下其历史上最大收购案。Wiz 在 18 个月内实现 1 亿美元年收入,成为史上最快的软件公司之一。创始团队拥有近 20 年的友谊和合作,先后成立 Adallom 并被微软收购,再打造 Wiz。
2025-03-20
今天是2025年3月20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 19 日至 3 月 20 日)的 AI 相关新闻: 3 月 20 日: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 3 月 19 日: “回答我!Look in my eyes!Tell me why?baby why?”——最近全网都被这句魔性古风骂人视频刷屏了!古人+现代梗的爆笑碰撞,不只是娱乐玩梗,更成了宣传、带货、文旅推广的新利器。本文手把手教你 0 基础复刻这类 AI 视频,搭配爆款文案+AI 人物+鬼畜视频合成,让你也能轻松玩转流量密码,打造自己的“AI 古人爆款工厂”! 在 GTC2025 大会上,黄教主分享了十五个“饼”,涵盖数据中心的未来、强大的 CUDA、边缘计算与 6G 结合、汽车智能驾驶安全方案等多个领域。他强调,未来推理需求将暴增,并推出新款 NVL72 服务器,性价比显著提升。管推出了多项创新,黄教主仍未解答算力通缩的疑问,未来的硬件发展将面临更多挑战。延伸阅读:《[“AI 工厂时代降临”:黄仁勋 GTC2025 主旨演讲图文全文 3 万字》
2025-03-20
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18
今天的AI新闻
以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总: 3 月 4 日: 【AI 3D】 Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。 3DMem:新型 3D 场景记忆框架。 【AI 绘图】 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。 海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】 Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu:API 开放平台全面开放。 【AI 模型】 Google Colab:推出 Data Science Agent。 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。 Opera:宣布推出网页浏览器的 AI 代理。 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。
2025-03-15
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05