Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

数字孪生的关键技术

Answer

数字孪生的关键技术包括以下方面:

  • 利用定制软件实现工厂的数字孪生,如 Wistron 利用 Omniverse SDK 定制软件将 NVIDIA DGX 和 HGX 工厂实现数字孪生,大幅缩短调试周期。
  • 运用生成式 AI 进行天气预测,如 CoreDev 可通过超高分辨率 AI 预测严重风暴。
  • 构建端到端的机器人系统,让 AI 理解物理世界,需要 AI 计算机、监测分析计算机和执行任务的机器人三位一体。
  • 提供模拟环境,如 Omniverse 提供模拟环境,教会机器人如何成为机器人。
  • 实现软件定义的仓储、工厂,让机器人自主协同工作。
  • 解决数字人构建中的工程关键点,如构建像人一样思考的 AI Agent、实现灵魂驱动躯壳、保证实时性、实现多元跨模态、处理拟人化场景等。
Content generated by AI large model, please carefully verify (powered by aily)

References

黄仁勋在AI界超级碗GTC2024的主旨演讲: 精华及全文(附视频)

数字孪生技术已在各行各业大放异彩。Wistron利用Omniverse SDK定制软件,将NVIDIA DGX和HGX工厂实现数字孪生,大幅缩短调试周期。NVIDIA还运用生成式AI预测天气。CoreDev可通过超高分辨率AI预测严重风暴,如台风灿都。这项服务作为NVIDIA Earth 2的一部分,将惠及全球气象机构。NVIDIA在医疗领域也硕果累累,涵盖医学成像、基因测序和计算化学等。NVIDIA推出BioNeMo NIMS、NVIDIA推理微服务(NIMS)等新品,可在几分钟内生成候选分子。微服务包含三大支柱:AI模型、运行AI的工具;AI技术;基础设施用于AI微调和部署,可在DGX云等平台上实现。这类似于台积电代工芯片的模式,因此被称为AI代工厂。用户可利用这些服务处理各类结构化和非结构化数据,编码存储于向量数据库中,成为企业专属智慧。通过与智能数据库交互,可轻松获取所需信息。NVIDIA AI Foundry正携手SAP、ServiceNow等巨头,帮助他们开发自有数据和工具,在聊天机器人中打造企业级Copilot。要让AI理解物理世界,需要AI计算机、监测分析计算机和执行任务的机器人三位一体。这就像语言模型,只不过我们要构建的是端到端的机器人系统。通过强化学习,机器人可适应物理定律。Omniverse提供模拟环境,教会机器人如何成为机器人。OVX托管于Azure。未来的仓储、工厂都将由软件定义,机器人自主协同工作。数字孪生是机器人系统CICD的关键。西门子正构建工业元宇宙,日产已将Omniverse整合到工作流。所有移动设备都将是机器人,包括自动驾驶汽车。从计算机视觉到AI控制,还有很多工作要做。

AI 数字人-定义数字世界中的你

有了数字人躯壳,我们就需要构建数字人的灵魂,让数字人具备各种智能,比如记得你的个人信息,充当你的个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。这些能力实现有以下几个需要注意的工程关键点:1.AI Agent:我们要想数字人像人一样思考就需要写一个像人一样的Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战;2.驱动躯壳的实现:灵魂部分怎样去驱动躯壳部分,我们可以将灵魂部分的所有接口定义出来,然后躯壳部分通过API调用,调用方式可以是HTTP、webSocket等等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考Nvidia的Audio2Face(https://www.nvidia.cn/omniverse/apps/audio2face/)或则Live Link Face(Iphone APP)+Face AR Sample(UE);3.实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。4.多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉我们可以通过添加摄像头数据来获取数据,再通过系列CV算法做图像解析等;5.拟人化场景:我们正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景如何通过工程丝滑处理。

黄仁勋在AI界超级碗GTC2024的主旨演讲: 精华及全文(附视频)

我们将讨论这个新行业的很多事情,包括接下来如何进行计算,您因这个新行业而构建的软件类型,新软件,您会如何看待这个新软件,以及这个新兴行业的应用情况。然后,我们也许会探讨接下来会发生什么,我们今天如何开始为接下来的事情做准备。在我开始之前,我想向您展示NVIDIA的灵魂。我们公司的灵魂位于计算机图形学、物理和人工智能的交叉点。所有这些都在计算机内部交叉,在Omniverse虚拟世界模拟中。我们今天要向您展示的所有内容,都是模拟,而非动画。它之所以美丽,是因为它是物理学。世界是美丽的。这太神奇了,因为它是用机器人制作的动画,是用人工智能制作的动画。您一整天都会看到的东西,都是在Omniverse中完全模拟生成的。您将要享受的是世界上第一场音乐会,一切都是自制的。您将要观看一些家庭视频,所以请坐下来尽情享受。我爱英伟达。加速计算已达到临界点。通用计算已经失去动力。我们需要另一种计算方式,这样我们就可以继续扩展,这样我们就可以继续降低计算成本,这样我们就可以继续消耗越来越多的计算。我们正在追求的是可持续性。加速计算已经在与通用计算的比较中展现出显著的优势。在我所参与的每一个行业中,我都有大量的案例可以向您展示。其影响力巨大,而且在任何行业中,它的重要性都超过了我们自己的行业。这些行业都在使用模拟工具来创建产品。这并不是为了降低计算成本,而是为了扩大计算规模。我们希望能够进行模拟,我们所做的整个产品都是完全高保真、完全数字化的,这就是我们所说的数字孪生。我们希望设计它、构建它、模拟它、操作它,完全数字化。为了实现这一目标,我们需要加速整个行业的发展。今天,我想宣布,我们有一些合作伙伴正在加入我们的旅程,他们将加速他们的整个生态系统,以便我们可以将世界带入加速计算的时代。

Others are asking
数据孪生 怎么在企业中搭建
在企业中搭建数字孪生可以参考以下要点: 1. 利用定制软件:如 Wistron 利用 Omniverse SDK 定制软件,将 NVIDIA DGX 和 HGX 工厂实现数字孪生,大幅缩短调试周期。 2. 集成多类数据:将 Multicad 和过程模拟数据虚拟集成到统一视图中,进行测试和优化布局。 3. 提高效率和缩短上线时间:如 Wistron 工厂使用数字孪生,工人效率提高 51%,上线时间缩短一半。 4. 验证物理构建与数字化计划的匹配:尽早发现差异,避免成本高昂的变更订单。 5. 快速测试新布局和改进操作:使用生产线上每台机器的实时物联网数据监控实时操作。 6. 与合作伙伴共同构建:如西门子正在构建工业元宇宙,并将其皇冠宝石加速器连接到 NVIDIA Omniverse。 未来,设施仓库、工厂建筑将由软件定义,在数字孪生中运行自主机器人堆栈,集成软件的方式是使用数字孪生。同时,NVIDIA 已将 Omniverse 变得更易访问,创建云 API,将其与语言聊天能力集成,可在 3D 环境中进行设计、模拟或生成。
2025-01-02
数字孪生
数字孪生是一个涉及多个领域的概念。在表演方面,曾测试过号称能做数字孪生的软件,结果发现存在一定局限性,如只是换脸的小变体且表现中庸。表演的本质是放大情感,通过强烈的情感表达来吸引观众。 在人际关系中,每个人都可能有一个由 AI 驱动的“数字双胞胎”,它接受了我们所有的写作和言语的训练,已经有人开始这样的探索。 在前期筹备方面,包括为患病老人构建能语音输出的数字人,如一位大哥为患病母亲自学 AI 构建数字人;还有 AI 相声,如为侯宝林、马三立、马季三位相声大师做数字化形象和声音建模;以及网站图片的生成和红包封面的探讨等相关工作。
2024-12-20
智能体是什么?设计框架及关键技术是什么?如何从通用大模型搭建一款智能体
智能体是建立在大模型之上的具有特定功能的系统。 其特点包括: 1. 强大的学习能力:能通过大量数据学习,理解和处理语言、图像等多种信息。 2. 灵活性:适应不同任务和环境。 3. 泛化能力:将学到的知识泛化到新情境,解决未见过的类似问题。 智能体的应用领域广泛,如: 1. 自动驾驶:感知周围环境并做出驾驶决策。 2. 家居自动化:根据环境和用户行为自动调节设备。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理提供自动化客户支持。 6. 机器人:各类机器人中的智能控制系统。 设计和实现一个智能体通常涉及以下步骤: 1. 定义目标:明确需要实现的目标或任务。 2. 感知系统:设计传感器系统采集环境数据。 3. 决策机制:定义决策算法,根据感知数据和目标做出决策。 4. 行动系统:设计执行器或输出设备执行决策。 5. 学习与优化:若为学习型智能体,设计学习算法以改进。 从通用大模型搭建一款智能体,可参考以下流程: 本智能体的实现包含 3 个工作流和 6 个图像流,整体包含 171 个节点。采用单 Agent 管理多工作流策略,流程包括: 1. 信息聚合与数据挖掘:通过高度集成的数据采集机制,全面收集产品关键信息。 2. 卖点提炼与优化:运用先进的大模型分析信息,提炼具有市场竞争力和独特性的卖点。 3. 买点转化与策略应用:将卖点转化为消费者视角的买点,增强产品吸引力。 4. 视觉化信息呈现:设计直观且具有冲击力的卡片展示,确保信息传达的有效性和视觉吸引力。 5. 文案与脚本调整:根据目标受众偏好和媒体渠道,动态调整文案或脚本,实现内容的最佳适配。 6. 流程结果存储与分析:将处理结果系统化地存储到飞书,以供未来策略优化和决策支持。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-04
AI的关键技术有哪些,比如langchain
AI 的关键技术包括以下方面: 1. 编排(Orchestration):涉及到的公司如 DUST、FIAVIE、LangChain 等提供的工具帮助开发人员管理和协调各个部分和任务,以确保系统的流畅运行。 2. 部署、可扩展性和预训练(Deployment, Scalability & PreTraining):这个类别的公司如 UWA mosaicm、NMAREL、anyscale 等提供工具,帮助开发人员部署模型,保证模型的可扩展性,以及在模型使用前进行预训练。 3. 上下文和嵌入(Context & Embeddings):这个类别的公司如 TRUDO,Llamalndex,BerriAI 等提供工具,帮助模型处理和理解语言上下文,以及将词语和句子转化为计算机可以理解的形式。 4. 质量保证和可观察性(QA & Observability):这个类别的公司如 Pinecone,drant,Vald 等提供工具,以确保模型的表现,并能够监控模型的性能和状态。 LangChain 作为一个框架,具有以下特点和作用: 1. 与 RAG 的关系:作为一个框架,为 RAG 提供了实现所必需的工具和组件。允许开发者通过其模块化组件来构建 RAG 应用程序,简化了 RAG 应用程序的开发过程,提高性能,支持构建复杂的 RAG 应用,如智能问答系统、内容推荐引擎等。 2. 在 ProductHunt 2023 年度最佳产品榜单中的表现:入围了 AI Infra 类别,帮助 AI 创作者为他们的产品选择合适的 AI API 并在它们之间切换,快速创建和部署 LLM 插件或 LLM 应用程序,以及追踪和调试复杂的 LLM 应用程序。例如,Langfuse 为大模型应用提供开源可观测性和分析功能;Langdock 可在几分钟内创建、部署、测试和监控 ChatGPT 插件。
2024-09-19
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
,当前AI数字人发展的新态势,以及新技术和成果
当前 AI 数字人的发展呈现出以下新态势,并取得了一系列新技术和成果: 数字人简介: 数字人是运用数字技术创造的,虽现阶段未达科幻作品中的高度智能,但已在生活多场景中出现且应用爆发。业界对其尚无准确定义,一般可按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视和直播带货,其表现质量与建模精细度及动捕设备精密程度相关,不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉关键点信息实现不错效果。 B 端变现与创业方向: B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。自媒体创业需具备内容创新和差异化,内容成本低且更新迭代快。游戏创业可做轻量化游戏,结合 AI 技术满足放松和社交需求,专注垂类赛道避免与大厂竞争。影视创业在 25 年将是拐点,更多内容会采用 AI 技术。广告营销创业重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: AI 虚拟人从早期以首位为核心的宅文化虚拟偶像,发展到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人。虚拟人产业链包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。未来 3 10 年,AI 虚拟人是 Web 3.0 的风口,提前布局有潜力的赛道可迎接机遇,但创业对创业者综合能力要求极高。 未来展望: 数字人未来有很多应用场景,如家庭中的数字人管家、学校中的数字人老师、商场里的数字人导购等。未来还会有很多技术突破,如将五感数据和躯壳控制参数作为输入,次世代算法可自我迭代升级和自行演化躯壳控制方式。通过 Dify 搭建数字人的开源项目可展现低门槛高度定制数字人的基本思路,数字人的核心在于 Agent 即灵魂,如何在 Dify 上编排专属数字人灵魂值得体验。期望随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,AI 既能提供高质量信息,也能关注用户情绪。
2025-04-14
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-04-12
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
数字人讲解产品
以下是关于数字人讲解产品的相关内容: 电商方面: 1. 添加产品/介绍背景:若有自己的视频/图片素材可用,若无,可根据搜索添加。 2. 扣像结合背景:在剪映中把数字人扣下,导入视频,点击画面选择抠像,点击智能抠像,调整大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索或手动添加喜欢的音乐。最终形成所需视频,可用于带货或讲解产品,也能应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。 XiaoHu.AI 日报 1 月 14 日相关: 1. 无需真人模特,上传产品图片,数字人即可手持产品进行口播展示。 2. 支持语音和口型同步,动作、姿势可定制,提供 1000+多国家数字人模特。 3. 覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。测试视频效果接近成熟,嘴型部分仍需微调。在线体验:
2025-04-11