Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最新具身智能新闻

Answer

以下是关于具身智能的最新新闻:

具身智能是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,而具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流。人形机器人是具身智能的代表产品。

具身智能的三要素包括本体(硬件载体)、智能(大模型、语音、图像、控制、导航等算法)、环境(本体所交互的物理世界),三者高度耦合是高级智能的基础。不同环境下会有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人。

具身智能体的行动分为“感知-决策-行动-反馈”四个步骤,感知模块负责收集和处理信息,通过多种传感器感知和理解环境。常见的传感器有可见光相机、红外相机、深度相机、激光雷达、超声波传感器、压力传感器、麦克风等。

最近,具身智能的概念很火。例如稚晖君开源人形机器人全套图纸+代码引发圈内热议,各类具身智能产品如李飞飞的 Voxposer、谷歌的 RT1 和 RT2、RTX、字节跳动的 Robot Flamingo、斯坦福的 ACT 和卡耐基梅隆的 3D_diffuser_act 等,在不同任务和场景中展示了强大能力,并有潜力带来革命性变革。本文拆分为上下两篇,明天会更新下篇,聚焦人机交互、发展讨论。本文部分参考中国信息通信研究院和北京人形机器人创新有限公司的《具身智能发展报告》。

Content generated by AI large model, please carefully verify (powered by aily)

References

一篇具身智能的最新全面综述!(上)

具身智能,即“具身+智能”,是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以ChatGPT为代表的“软件智能体”(或称“离身智能体”)使用大模型通过网页端、手机APP与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境、规划、记忆以及工具调用,执行复杂的任务。在这些基础之上,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗一点讲,就是要给人工智能这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。具身智能的三要素:本体、智能、环境具身智能的三要素:“本体”,即硬件载体;“智能”,即大模型、语音、图像、控制、导航等算法;“环境”,即本体所交互的物理世界。本体、智能、环境的高度耦合才是高级智能的基础。不同环境下的会有不同形态的硬件本体以适应环境。比如室内平地更适用轮式机器人,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器以感知环境,做出决策以操控本体执行动作任务,从而影响环境。在智能算法与环境的交互中还可以通过“交互学习”和拟人化思维去学习和适应环境,从而实现智能的增长。具身智能的四个模块:感知-决策-行动-反馈一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。感知模块

一篇具身智能的最新全面综述!(上)

感知模块负责收集和处理信息,通过多种传感器感知和理解环境。在机器人上,常见的传感器有:1.可见光相机:负责收集彩色图像。2.红外相机:负责收集热成像、温度测量、夜视和透视。红外相机能够检测物体发出的热辐射,即使在完全黑暗的环境中也能生成图像。这种能力使得红外相机适用于夜视和热成像。红外相机可以测量物体表面的温度,广泛应用于设备过热检测、能源审计和医学成像等领域。某些红外相机能够穿透烟雾、雾气和其他遮挡物,适用于应急救援和安全监控。3.深度相机:负责测量图像中每个点与相机之间的距离,获取场景的三维坐标信息。4.激光雷达(LiDAR):负责测量目标物体的距离和速度。通过发射激光脉冲并接收反射回来的光来计算与物体的距离,生成高精度的三维点云数据,广泛应用于自动驾驶和机器人导航。5.超声波传感器:负责避障。通过发射超声波脉冲并接收这些脉冲的反射来确定机器人与障碍物之间的距离,判断障碍物是否存在。6.压力传感器:负责测量机器人手或脚部的压力,用于行走和抓取力的控制以及避障。7.麦克风:负责收音。

一篇具身智能的最新全面综述!(上)

最近,具身智能的概念很火。不论是这几天[稚晖君开源人形机器人全套图纸+代码](http://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247686482&idx=1&sn=e38d9d5eedcb1355fb65f617812016ed&chksm=e87dc81fdf0a410991d12d60cf0354c1a35fe2e35593bd09c93649551627444d6b78e32a0bd9&scene=21#wechat_redirect),引发圈内热议。还是各类具身智能产品,如李飞飞的Voxposer、谷歌的RT1和RT2、谷歌的RTX、字节跳动的Robot Flamingo、斯坦福的ACT和卡耐基梅隆的3D_diffuser_act,均在不同任务和场景中展示了强大的能力,并有潜力带来革命性的变革。那什么是具身智能呢?它又有什么用?一文带你了解。本文拆分为上下两篇,明天会更新下篇,聚焦人机交互、发展讨论。本文部分参考中国信息通信研究院和北京人形机器人创新有限公司的《具身智能发展报告》具身智能基本概念

Others are asking
具身智能是什么技术?用小学生能理解的话术回答
小朋友,具身智能呀,是人工智能里的一种很有趣的技术。 它说的是像机器人、虚拟代理这样的智能体,要通过和真实世界或者虚拟环境直接打交道来变得更聪明。 比如说,智能体要有能感觉周围环境的能力,能自己到处走,能拿东西、操作东西,还能学习新本领,适应新环境。 具身智能很在意智能体的“身体”,这个“身体”可以是机器人的样子,也可以是游戏里的虚拟角色。这些“身体”能帮智能体和环境互动,还会影响智能体学习。 像机器人可以通过它的手学会抓东西、摆弄东西,虚拟代理在游戏里能学会解决问题。 研究具身智能要用到好多知识,像机器人学、认知科学、神经科学还有计算机视觉。 在机器人领域,具身智能能让机器人更好地理解和适应我们人类的生活环境,跟我们交流更自然。在虚拟现实、增强现实和游戏里,也能让我们玩得更开心。 不过呢,具身智能还有一些难题要解决,比如怎么设计智能体的身体让它更聪明,怎么让它在复杂的环境里好好学习,还有怎么处理它和人类社会相关的一些问题。 简单说,具身智能就是给聪明的人工智能装上“身体”,让它能和周围环境更好地交流互动。
2025-04-05
具身智能最核心的技术热点是什么
具身智能最核心的技术热点包括以下方面: 1. 人机混合增强智能标准:规范多通道、多模式和多维度的交互途径、模式、方法和技术要求,如脑机接口、在线知识演化、动态自适应、动态识别、人机协同感知、人机协同决策与控制等。 2. 智能体标准:规范以通用大模型为核心的智能体实例及智能体基本功能、应用架构等技术要求,包括智能体强化学习、多任务分解、推理、提示词工程,智能体数据接口和参数范围,人机协作、智能体自主操作、多智能体分布式一致性等。 3. 群体智能标准:规范群体智能算法的控制、编队、感知、规划、决策、通信等技术要求和评测方法,包括自主控制、协同控制、任务规划、路径规划、协同决策、组网通信等。 4. 跨媒体智能标准:规范文本、图像、视频、音频等多模态数据处理基础、转换分析、融合应用等方面的技术要求,包括数据获取与处理、模态转换、模态对齐、融合与协同、应用扩展等。 5. 具身智能标准:规范多模态主动与交互、自主行为学习、仿真模拟、知识推理、具身导航、群体具身智能等。 具身智能需要具备感知、决策和执行三种核心能力。执行能力是技术难点,涉及硬件设计,具身智能体主要分为移动和操作两大能力。移动方面,各种类型机器人在不同地形下实现鲁棒的移动仍是前沿学术问题。操作方面,现阶段能落地的只有简单抓取,可泛化的通用执行能力是三大核心能力中最短的板。大语言模型(LLM)为具身智能热潮来临提供了机会,其强泛化能力和 zeroshot 能力使不再需要为每个任务手工调校机器人。
2025-03-12
具身智能
具身智能是人工智能领域的一个子领域,以下是关于具身智能的详细介绍: 定义:强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 核心:在于智能体的“身体”或“形态”,其可以是物理形态(如机器人的机械结构)或虚拟形态(如模拟环境中的虚拟角色)。这些身体不仅是互动手段,也影响智能体的学习和发展。 涉及学科:包括机器人学、认知科学、神经科学和计算机视觉等。 机器人学:关注设计能自主行动和适应环境的机器人。 认知科学和神经科学:探索大脑处理与身体相关信息的机制及应用于人造智能系统。 计算机视觉:致力于开发算法,使智能体能够理解和解释视觉信息,进行有效空间导航和物体识别。 应用: 机器人领域:在服务机器人、工业自动化和辅助技术等方面,使机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。 虚拟现实、增强现实和游戏设计等领域:创造更具沉浸感和交互性的体验。 特点: 三要素:“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。 四个模块:感知决策行动反馈,形成闭环。 面临挑战:如设计智能体身体以最大化智能表现、让智能体在复杂多变环境中有效学习、处理智能体与人类社会的伦理和安全问题等。 尽管具身智能在理论和技术上取得显著进展,但仍有诸多挑战待解决,未来研究将继续探索推动其发展和应用。
2025-03-12
具身智能
具身智能是人工智能领域的一个子领域,以下是关于具身智能的详细介绍: 定义:强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 核心:在于智能体的“身体”或“形态”,其可以是物理形态(如机器人的机械结构)或虚拟形态(如模拟环境中的虚拟角色)。这些身体不仅是互动手段,也影响智能体的学习和发展。 涉及学科:包括机器人学、认知科学、神经科学和计算机视觉等。 机器人学:关注设计能自主行动和适应环境的机器人。 认知科学和神经科学:探索大脑处理与身体相关信息的机制及应用于人造智能系统。 计算机视觉:致力于开发使智能体能够理解和解释视觉信息,进行有效空间导航和物体识别的算法。 应用: 机器人领域:在服务机器人、工业自动化和辅助技术等方面,使机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。 虚拟现实、增强现实和游戏设计等领域:创造更具沉浸感和交互性的体验。 重要要素和模块: 三要素:“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。 四个模块:感知决策行动反馈,形成一个闭环。 尽管具身智能在理论和技术上取得显著进展,但仍面临诸多挑战,如智能体身体设计、复杂环境中的有效学习、与人类社会的伦理和安全问题等。未来研究将继续探索这些问题以推动其发展和应用。
2025-03-10
具身智能是什么?
具身智能是人工智能领域的一个子领域,指的是智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 其核心在于智能体的“身体”或“形态”,这些身体可以是物理形态,如机器人的机械结构,也可以是虚拟形态,如在模拟环境中的虚拟角色。身体不仅为智能体提供了与环境互动的手段,也影响其学习和发展。 具身智能的研究涉及多个学科,包括机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注如何设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发算法让智能体理解和解释视觉信息,进行有效空间导航和物体识别。 具身智能的应用广泛,在机器人领域,特别是服务机器人、工业自动化和辅助技术等方面,能让机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。在虚拟现实、增强现实和游戏设计等领域,能创造更具沉浸感和交互性的体验。 具身智能有三要素:本体(硬件载体)、智能(大模型、语音、图像、控制、导航等算法)、环境(本体所交互的物理世界),三者高度耦合是高级智能的基础。其行动分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。 尽管具身智能取得显著进展,但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂多变环境中有效学习、处理智能体与人类社会的伦理和安全问题等。
2025-03-10
具身智能软硬件解决方案。
具身智能的软硬件解决方案包括以下方面: 算法层: 技术层级: 任务层级:可细分为任务级、技能级、动作级、基元级、伺服级,通常关注前四个级别。 解决方案层级:通常可拆分为大脑+小脑两个层级。大脑负责人机交互与规划决策,小脑负责运动控制及将语义信息理解转化为动作。 大脑侧:负责人机交互,能通过视觉在语义层面理解场景、任务等并进行决策。大模型的发展对大脑有促进作用,大脑的长期发展高度依赖多模态大模型。如 2024 年 3 月,有鹿机器人发布了基于 LPLM10B 的软硬件结合产品 Master 2000。 整机硬件方案:基于下游场景需求设计运动、感知、计算和通信硬件方案。具身智能厂商倾向于软硬件全流程自主控制,自己制作机体,原因包括机体和数据模式未统一,训练数据与机体构造紧密联系,以及考虑二级供应商是否成熟和整机利润。部分强大厂商如 Tesla 具备制作更底层电机、传感器的能力,软硬件一体化制造能带来更高利润。 智能类型:包括认知智能和物理智能。认知智能涉及思考、规划和决策能力,完全由大脑驱动;物理智能指机器人的感知和与环境的运动互动能力,感知环节由大脑侧算法实现,行动环节由小脑侧算法和硬件配合完成。 发展趋势: 人形化:外形向人类细部特征靠拢,功能具备真实人类运动、灵活和环境判断能力。 成本下降显著:核心零部件成本降低,人形机器人成本及售价呈下降趋势。 构成元素:包括大脑(意图理解、环境感知、规划决策)、小脑(运动控制、语义信息理解转化为动作)、整机硬件方案。
2025-03-07
coze搭建智能体,用上传的文件和知识库的文件做对比,分析差异点。
以下是关于在 Coze 中搭建智能体的相关信息: 1. 证件照相关操作: 展示原图上传结果,基本脸型已换,生成效果与上传照片特征有关。 改背景可利用改图功能,一键改图效果更好,输出数据类型为图片。 豆包节点生成的是 URL 地址,与前者不同,在工作流使用有差异,可参考简单提示词。 介绍证件照工作流相关操作,包括通过提示词改背景颜色,设置输出方式为返回变量;讲解消耗 token 及保存结果相关问题;对按钮、表单添加事件并设置参数,限制上传文件数量;还涉及给表单和图片绑定数据,以及每次操作后刷新界面确保设置生效。 围绕操作讲解与优化展开,介绍 for meet 的设置,如表单事件操作、图片上传数量修改等,提及编程基础知识。还讲述成果图连接、绑定数据方法及注意事项。展示基本功能实现情况,分析换性别等问题成因,指出需在工作流优化提示词,也可尝试用视频模型解决,最后进入问答环节。 2. 多维表格的高速数据分析: 创建智能体,使用单 Agent 对话流模式。 编排对话流,创建新的对话流并关联智能体。 使用代码节点对两个插件获取的结果进行数据处理,注意代码节点输出的配置格式。 测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 发布,选择多维表格,配置输出类型为文本,输入类型选择字段选择器,完善上架信息,可选择仅自己可用以加快审核。 3. 智能体与微信和微信群的连接: 创建知识库,可选择手动清洗数据提高准确性,包括在线知识库和本地文档。 在线知识库创建时,飞书在线文档中每个问题和答案以分割,可编辑修改和删除。 本地文档中注意拆分内容提高训练数据准确度,如将课程章节按固定方式人工标注和处理。 发布应用,确保在 Bot 商店中能够搜到。
2025-04-18
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
什么是通用人工智能
通用人工智能(AGI)是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前 AGI 还只是一个理论概念,没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 常见名词解释: AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。
2025-04-15
最新的AI排行榜
以下是最新的 AI 排行榜相关信息: 3 月 9 日榜单: 文生图:Ideogram 2a(官方评价这是 Ideogram 迄今为止最快、最实惠的文生图模型) 文生视频:SkyReels、海螺01director、Pixverse4.0 图生视频:SkyReels、Pixverse4.0、Adobe Firefly 测评涵盖了 Midjourney,Flux,即梦,Recraft,ideogram,SD3.5,Sora,可灵,通义,即梦,海螺,pixverse,pika,vidu,luma 等 50+国内外热门模型,还有 Veo 2.0 等最新模型上线。本周最出乎意料的是最新上的模型 SkyReels,在文生视频和图生视频榜单都排名靠前。 生成式 AI 季度数据报告 2024 月 1 3 月: 赛道方面:天花板潜力为数亿美金;对标公司有 Xmind 等;总体趋势平稳增长,15.93%;月平均增速 34 万 PV/月;原生产品占比中等。 竞争方面:Top1 占比 32%;Top3 占比 82%;马太效应弱;网络效应中;大厂是否入局是,但大厂占比较低;技术门槛中。 23 年 12 月至 24 年 3 月月访问量排行榜及变化情况: 非大厂的 Top1 公司及产品:Whimsical Al,估值融资 3000 万$(2021),最新月 PV 为 237 万。2023 年 4 月,月访问量 382 万,Whimsical AI、gitmind AI 分别位列第一、第二的位置,月访问量合计占比 84%。2024 年 3 月,月访问量 812 万,Whimsical AI 整年看处于增长态势,仍位列第一,月访问量达到 237 万;ProcessOn 凭借其原有客户积累,月访问量快速增长,位列第二名,占比 25%。 记忆辅助榜单中,2023 年 4 月,月访问量为 83 万,Rewind AI 以 43 万的访问量位居第一,占赛道月总访问量的 52%。Personal.ai 和 Heyday 分别以 25 万和 8 万的访问量位列二、三,分别占赛道月总访问量的 30%和 10%。2024 年 3 月,月访问量增长至 245 万,rabbit inc.以 128 万的访问量跃居第一,占赛道月总访问量的 52%。Humane 和 Rewind AI 分别以 46 万和 22 万的访问量位列二、三,分别占赛道月总访问量的 19%和 9%。 相关网址: https://www.xiaohongshu.com/user/profile/65890e73000000003d035101?xsec_token=AB67OV1KW_ANCcrYRU_oRTJKJ9xLtexbMgyoJq68rxQA%3D&xsec_source=pc_search aiwatch.ai
2025-04-15
有哪些最新的ai技术可用在课堂教学上
以下是一些可应用在课堂教学上的最新 AI 技术: 1. 智慧技术助理:为教师提供辅助,帮助教师在课前、课中、课后呈现新的教学样态,驱动学生高效和差异化学习。 2. 生成式人工智能:可用于为教师减负,例如辅助设计教学内容、生成提示词等。 3. 个性化学习支持:通过 AI 技术实现对学生的个性化学习支持,如智能评估学生的学习情况,为每个学生提供定制化的学习方案。 4. 教育过程和结果的结构化表征:利用 AI 进行分析,帮助教师更好地了解学生的学习过程和结果。 5. 多维度数据采集与评价:AI 可以整合行为、情感、认知等多维度数据,为学生绘制发展全景图,实现更全面的教育评价。 需要注意的是,AI 在教育中是“助手”而非“替代”,教师应充分利用这些成熟的技术促进教育变革。
2025-04-13
ai在教学中的最新应用
以下是 AI 在教学中的一些最新应用: 1. MIT 为孩子开设免费的 AI 课程,涵盖了 AI 在跨学科领域的应用,如 AI 与气候、AI 与大学录取、AI 对美国大选的影响等。孩子们需要思考如何用气候数据写好故事、预测气候变换走向,从数据分析角度了解大学录取中的相关问题,以及识别 AI 深度伪造的新媒体材料等。 2. 张翼然提出用 AI 为教师减负,为有初步 AI 使用经验、渴望了解最新技术进展并交流的老师提供了相关技巧和分享。例如,在智慧技术助理加持下探索教学新样态,分享全球 AI 技术在教育界的新发展和应用案例。 3. 从 AI 助教到智慧学伴的应用探索中,提出调整教学理念,将 AI 作为教学辅助工具和合作伙伴。学习利用 AI 工具的优势应用于教学,如自动生成练习、个性化反馈等,同时确认输出质量。根据 AI 能力设计开放性作业,调整考核方式,继续发挥教师在提供情感支持、培养团队合作等方面的优势。
2025-04-11
最新的生命科学有关的 AI动向
以下是生命科学领域有关 AI 的最新动向: 在医疗健康生物制药方面,AI 技术极大地加速了研究,在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;通过神经网络分析患者体液中的生物标志物,早期诊断帕金森。 Nature Methods 主题特刊聚焦于 AI 在生物学中的应用,探讨了计算生物学多领域,强调高精度蛋白质结构预测成就,提及了 AI 在蛋白质组学数据分析中的应用、机器学习可解释性挑战,以及科研人员对 AI 工具培训的需求,同时探讨了 AI 与生物医学数据结合的新时代。 Flagship Pioneering 创始人 Noubar Afeyan 提出 AI for Science 的下一步是 MultiAgent,旨在实现类似自动驾驶的科研自动化,推动生命科学领域的革命性进展。
2025-04-10
请问有什么AI最新在零售行业的应用,最好有趣,实用有建设性
以下是 AI 在零售行业的一些有趣、实用且有建设性的最新应用: 1. 舆情、投诉、突发事件监测及分析:通过 AI 技术实时监测和分析消费者的反馈和市场动态,帮助企业及时做出应对策略。 2. 品牌营销内容撰写及投放:利用 AI 生成吸引人的营销文案,并精准投放到目标受众。 3. 自动化库存管理:基于历史销售数据和其他相关因素,预测未来的库存需求,优化库存配置,降低成本。 4. 自动生成或完成 SKU 类别选择、数量和价格分配:提高商品管理的效率和准确性。 5. 客户购物趋势分析及洞察:深入了解消费者的购物偏好和趋势,为企业的产品开发和营销策略提供依据。 此外,在医疗药品零售领域,AI 也有广泛的应用: 1. 药品推荐系统:根据用户购买记录和症状描述等数据,推荐合适的非处方药品和保健品,提高销售转化率。 2. 药品库存管理:分析历史销售数据、天气、疫情等因素,预测药品需求量,优化库存策略。 3. 药品识别与查询:借助计算机视觉技术,用户通过手机拍摄药品图像即可获取相关信息。 4. 客户服务智能助手:基于自然语言处理技术,回答顾客关于购药、用药、保健等常见问题。 5. 药店运营分析:分析销售、顾客流量、库存等大数据,发现潜在问题和优化空间。 6. 药品质量监控:利用机器视觉、图像识别等技术检测药品的包装、标签、颜色等是否合格。 7. 药品防伪追溯:利用区块链等技术实现全流程的药品溯源,保障药品供应链的安全和可信度。 总之,AI 技术在零售行业的应用能够提升购物体验、优化运营管理、降低成本,并为企业创造更多的价值。
2025-04-10
我想了解最新的ai的即时信息(最新资讯与ai工具)
以下是为您提供的最新 AI 即时信息和工具: 4 月 1 日 AI 资讯: 【AI 模型及应用】 OpenAI:将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户。 Gemini 2.5 Pro:免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】 Higgsfield:发布 50 多个电影级摄影机动作预设,提升动态镜头表现力。 luma:为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑。 Remakes:支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程。 Meta:宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】 HSMR:推出从单张图像重建人体 3D 骨骼和网格模型的系统。 krea:引入 AI 3D 生成能力,扩展其创意工具的功能范围。 PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】 MiniMax Audio:发布全新 Speech02 语音模型,提升语音合成质量。 3 月 19 日 AI 资讯: 【AI 模型】 英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。 谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】 STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。 Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】 Roblox:推出 AI 3D 技术 Cube 3D。 Claude MCP Unity 版本推出。 【AI 音乐】 AI 音乐工具 Udio:推出 v1.5 Allegro。 LVAS Agent:基于多智能体协作的长视频音频合成。 获取 AI 资讯的渠道: 公众号:超时空视角、AI 替代人类。 小红书/抖音:EverAI。 B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)。 关于“通往 AGI 之路”知识库和社区平台: WaytoAGI(通往 AGI 之路)是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 社区定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。 目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。
2025-04-10
运用ai,生成每日自动推送到飞书消息的 公司文化日报,包含日历 天气 新闻 内部规划 事项
要运用 AI 生成每日自动推送到飞书消息的公司文化日报,包含日历、天气、新闻、内部规划和事项,您可以考虑以下步骤: 首先,需要确定获取日历、天气、新闻、内部规划和事项等信息的数据源。对于日历,可以使用在线日历服务的 API 来获取相关数据;天气信息可以从专业的气象数据提供商获取;新闻可以通过新闻聚合 API 或者与特定的新闻机构合作获取;内部规划和事项则需要从公司内部的管理系统或数据库中提取。 然后,选择适合的 AI 技术和工具。例如,可以使用自然语言处理技术来对获取到的数据进行处理和整合,生成易于阅读和理解的文本内容。 在生成日报的过程中,要注意格式的规范和统一,使其具有良好的可读性。同时,可以根据公司的文化特点和需求,对内容进行个性化的定制和优化。 另外,为了确保推送的准确性和及时性,需要建立有效的监控和反馈机制,及时发现并解决可能出现的问题。 希望以上建议对您有所帮助。
2025-04-14
2025年3月27日AI新闻
以下是 2025 年 3 月 27 日的部分 AI 新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司不断涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,2 月 27 日的相关新闻有:小红书 AI 赛道从 0 到 1 做 IP 的相关活动预告、工具分享及日更群计划。3 月 5 日的新闻包括:2025 开年 3 个月 AI 已经狂飙,更新密集发布;Grok 语音模式全面开放,支持 11 种模式(包括 2 种 18 禁),自带语音字幕,目前仅支持英文。
2025-03-27
3月27日,AI圈有哪些新闻
以下是 3 月 27 日 AI 圈的部分新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口,简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化,分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司涌现,未来 AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,还有以下商业和技术方面的新闻: AI 商业爆发年:可灵 AI 营收破亿元,AIGC 营销素材日均消耗超 3000 万元。快手将 AI 作为生态重塑核心,引领视频生成模型全球竞速。可灵 AI 技术领先 Sora,获马斯克、MIT 科技评论等国际认可。 小白福音 Trickle:一键部署、无需 API,能直接克隆 Claude 聊天体验。面向非开发者,帮助快速从创意→上线,打通完整产品流程。模板丰富,涵盖问卷、小游戏、互动课程等多种场景。 拓竹 H2D 多才多艺:精度提升一个数量级,打印成品可直接使用。集成 3D 打印、激光雕刻、刀切、彩绘,支持双头多色打印。搭载视觉摄像头和神经算法,实现微米级精度。
2025-03-27
3月26日至今AI圈有哪些新闻
以下是 3 月 26 日至今 AI 圈的部分新闻: 3 月 26 日: 【AI 模型及应用】OpenAI 推出 GPT4o 图像生成能力;谷歌发布 Gemini 2.5 Pro Experimental 模型;Trea 已内置 DeepSeekV30324。 【AI 音乐】昆仑万维发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】混元 Portrait 实现音频视频驱动图片肖像形成动画;PPVCtrl 推出新可控制视频生成模型。 【AI 3D】Vibe Draw 可通过草图进行 3D 建模;PhysTwin 通过视频创建交互式物理数字孪生;GroomLight 用于重打光的人体头发外观建模的混合逆向渲染。 3 月 27 日: 《》:MCP(Model Context Protocol)是由 Anthropic 推出的开放协议,迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,让 AI 应用无缝连接各种工具和服务。MCP 不仅促进了生态的形成,甚至可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调“输出能迫使知识内化”。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。“真正的深度与灵感,源于人类富有情境的问题。” 《》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司如雨后春笋般涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。正如报告所言:“AI 的进步既是开创新产品的源动力,也是消费巨头崛起的分销载体。” 3 月 26 日: AI 商业爆发年:可灵 AI 营收破亿元,AIGC 营销素材日均消耗超 3000 万元。快手将 AI 作为生态重塑核心,引领视频生成模型全球竞速。可灵 AI 技术领先 Sora,获马斯克、MIT 科技评论等国际认可。 小白福音 Trickle:一键部署、无需 API,能直接克隆 Claude 聊天体验。面向非开发者,帮助快速从创意→上线,打通完整产品流程。模板丰富,涵盖问卷、小游戏、互动课程等多种场景。 拓竹 H2D 多才多艺:精度提升一个数量级,打印成品可直接使用。集成 3D 打印、激光雕刻、刀切、彩绘,支持双头多色打印。搭载视觉摄像头和神经算法,实现微米级精度。 Figure 人形机器人新突破。
2025-03-27
最近的AI新闻
以下是近期的 AI 新闻汇总: 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 Blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。 3 月 26 日: 【AI 模型及应用】 OpenAI:推出 GPT4o 图像生成能力。 谷歌:发布 Gemini 2.5 Pro Experimental 模型。 Trea:已内置 DeepSeekV30324。 【AI 音乐】 昆仑万维:发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】 混元 Portrait:音频视频驱动图片肖像形成动画。 PPVCtrl:新可控制视频生成模型。 【AI 3D】 Vibe Draw: 草图进行 3D 建模。 PhysTwin:通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-03-26
如何订阅最新的ai新闻
以下是一些订阅最新 AI 新闻的途径: 公众号: “超时空视角”:提供 AI 资讯。 猫叔个人公众号“AI 替代人类”。 “歸藏的 AI 工具箱”:有 AI 课程撰写与信息收集整理,适合 AI 从业人员或想加入该领域工作的人,免费订阅可获得日常内容更新,付费会员可获得更多服务,如记录上周值得关注的 AI 领域主要发布、核心从业者需要关注的 AI 动态、涉及各个 AI 领域的优质内容、过去一周最重要的研究论文和简短解读介绍,还能加入核心粉丝群获得最及时的 AI 资讯通知和优先工作撮合机会。 小红书/抖音:“EverAI”。 B 站:“Ever AI 酱”,这里会有教程及 AI 工具界面操作。
2025-03-24