Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

MJ和runaway用什么软件代替比较好

Answer

以下是一些可以替代 MJ(Midjourney)和 Runway 的软件:

  • Luma 发布的 DIT 视频生成模型 Dream Machine 图生视频表现惊艳,具有电影级效果。
  • 出图工具方面,还有 SD(Stable Diffusion)和悠船。MJ 稳定性好、协作性强且有成熟经验参考,但并非所有人都拥有;SD 有独特能力但需本地部署且上手门槛高;悠船对中文支持好、交互友好简单易上手,但管控严格,有很多敏感词不能使用。

如果您想了解更多关于这些软件的详细信息或有其他特定需求,请进一步向我提问。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI离谱社黄师傅:AI 我中华工作流程分享

以下拆解来自「来来」:每个片段可以自己点小箭头展开括号中的软件,前者是做视频的,后者是做图片的,黑色是Runway+MJ;红色是Deforum+MJ;蓝色是Runway+SD光影文字光影字在文档最下面,如需学习可以到[目录:Stable Diffusion](https://waytoagi.feishu.cn/wiki/FUQAwxfH9iXqC9k02nYcDobonkf)板块有不少案例,比如24节气[heading2]画面1~6:风景:长城等(Runway+MJ)[content][heading2]画面7~9:北京风景:永定河+门头沟+天坛(Deforum+MJ)[content][heading2]画面10:北京文字(Runway+SD光影文字)[content][heading2]画面11~12:安徽风景:徽派建筑+黄山(Runway+MJ)[content][heading2]画面13:安徽文字(Runway+SD光影文字)[content][heading2]画面14:四川人文:熊猫打麻将(Runway+MJ)[content][heading2]画面15:四川文字(Runway+SD光影文字)[content][heading2]画面16:上海人文:小笼包(Runway+MJ)[content][heading2]画面17~19:上海人文(Deforum+MJ+SD光影文字)[content][heading2]画面20:重庆美食:火锅(Runway+MJ)[content][heading2]画面21:重庆文字(Runway+SD光影文字)[content][heading2]画面22:江西人文:山水+瓷器(Runway+MJ)[content][heading2]画面23:江西文字(Runway+SD光影文字)[content]

SOP+AI:作为小白,我是如何参与制作AI动画短片的?

MJ和RunWay是两个非常强大的AI工具,分别用于角色图片生成和动画制作。刚开始接触时,我觉得有些复杂,但通过反复实践和摸索,逐渐掌握了它们的使用方法。MJ可以快速生成高质量的角色形象,而RunWay则可以帮助我们轻松实现动画效果,AI工具发展速度特别快,最近Luma发布DIT视频生成模型Dream Machine图生视频的表现相当惊艳,绝对是电影级表现。分享一些实用技巧如下:1)MidJourney角色一致性(cref)和风格一致性(sref)MidJourney提供了cref和sref两个非常有用的功能,分别用于角色一致性和风格一致性。以下是一些使用技巧,我这次创作使用到的指令示例如下:角色一致性(cref):使用--cref后接角色图片的URL,可以在创作中保持角色形象的一致性。可以使用--cw来调整参考的强度,范围从100到0。默认设置是100,会使用面部、头发和衣服;强度为0时,只专注于面部,适合更换服装或发型等。风格一致性(sref):使用--sref后接风格参考图像的URL,MidJourney会生成与这些参考图风格一致的图像。可以添加多个风格参考链接,并通过::后跟权重数字来设置不同风格的相对重要性,例如:urlA::2 urlB::3。通过--sw设置样式的总权重,100为默认值,0为关闭值,1000为最大值。可以结合使用垫图和sref,垫图主要影响画面的构图和元素,而sref主要影响画风。2)RunWay的笔刷控制

爆肝 60 小时,一群小白用 AI 做了一个 MV——万字保姆级复盘攻略

我们用的出图工具以MJ、SD和悠船为主,就个人体验简单对比一下:|工具|优点|缺点||-|-|-||MJ|稳定性最好,协作性最强,有很多成熟的经验可供参考|不是所有老师都拥有此工具||SD|有一些其他产品无法替代的能力,比如艺术字、线稿控制能力、可以训练自己的各种lora等|需要本地部署<br>上手门槛更高||悠船|对中文的支持最好,Prompt可以用中文直出,效果通常都非常不错<br>交互上也比依托Discord的MJ更为友好、简单、易上手|管控上也最为严格,很多敏感词不能使用|[heading3]难点一:怎样保持名胜古迹的原貌[content]找到一张法华塔的旧照片,但用悠船出图,塔就变得面目全非法华塔老照片法华塔现代照片悠船出图尝试了多种垫图的办法未果,最后用SD的线稿控制才将塔的样式大体保留了下来(现在应可以用即梦的图生图功能来达成)[heading3]难点二:绕过敏感词[content]做历史的部分需要出一些战争场面,其中战士、士兵、五星红旗、外交官等等全都是敏感词?,有的是干脆拦截掉不让出图,有的是出来的图里检测到敏感内容不可显示,常常需要绞尽脑汁地想办法绕过敏感词,比如:不说「五星红旗」,只说「红旗」不说「外交官」,只找一个顾维钧演讲的老照片来垫图,Prompt中只说是「男人在自信地演讲」

Others are asking
如何使用MJ
以下是关于如何使用 MJ(Midjourney)的详细说明: 1. 图像网格: 使用 /imagine 命令可根据提示生成低分辨率图像选项网格。 每个图像网格下方的按钮可用于创建图像的变体、升级图像或重新运行最后一个 Midjourney Bot 操作。 U1U2U3U4 按钮将图像与图像网格分开,方便下载或使用其他工具,如“缩小”“平移”。使用旧版 Midjourney 模型版本时,U 按钮会放大图像。 重做(重新滚动)按钮可重新运行作业,重新运行原始提示生成新的图像网格。 变化按钮(V1V2V3V4)可创建所选网格图像的增量变化,生成与所选图像整体风格和构图相似的新图像网格。 2. 放大图像: 制作变体:创建放大图像的变体并生成包含四个选项的新网格。 网页:在 Midjourney.com 上打开图库中的图像。 最喜欢:标记您最好的图像,以便在 Midjourney 网站上轻松找到它们。 3. 模型个性化: MJ 发布了模型个性化 Personalization 或 'p' 的早期测试版本。 每次写提示时,很多信息是“隐含的”,MJ 算法通常用社区综合偏好填补空白,而模型个性化会学习您的喜好来填补。 模型个性化的要求:目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效,可在排名页面查看评分数量或在 Discord 上输入 /info。 使用方法:只需在提示后输入 'p',或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”,可分享让其他人使用应用于该图像的个性化效果,还可以使用 's 100' 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。 注意:个性化目前不是稳定功能,会随更多成对排名而变化,可能会推出算法更新,视为“不断变化的有趣功能”。 4. Midjourney V6 更新风格参考命令 2.0"sref": 2 月 1 日初次发布了首个“一致风格”测试算法,称为“风格参考”,工作方式类似于图像提示,可提供一个或多个描述想要的一致风格的图像的 URL。 使用方法:在提示后面输入 'sref' 以及一个指向图像的 URL,例如 'sref url A'。 高级设置:使用多个图像 URL 并设置风格的相对权重,例如 'sref urlA::2 urlB::3 urlC::5',通过 'sw 100' 设置风格化的总体强度(100 是默认值,0 表示关闭,1000 表示最大值),常规图像提示必须在 'sref' 之前。 注意:MJ 可能会在接下来的几周内更新此功能,若提示倾向于照片逼真而想要冲突的插图风格,可能仍需在提示中添加文本说明,风格参考对图像提示没有直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”的功能,与 'cref' 参数使用方式相同。
2025-03-13
MJ中如何精准控制颜色
以下是关于在 Midjourney 中精准控制颜色的一些方法和相关信息: 1. 在使用 MJ 生成兔子贴纸的过程中,关键词中限制了颜色,生成的图片会一种情绪对应一种颜色。若不想让模型把情绪和颜色做挂钩,同一种情绪可多生成几张不同色系的;若需要挂钩,也可反其道而行之。 2. 进行 SD 上色时,正关键词主要前面添加了增加照片质感常用的+mj 生成线稿的关键词调整(去掉 mj 里线稿的关键词,一开始嘴巴效果不好,添加了张开嘴巴等关键词,颜色都是可以单独调整控制)+风格参数。负关键词看自己的效果添加,添加一切不想要的东西。 3. 在 MJ 的公式方面: 角色人物公式:人物姓名(命名)+描述词(重要描述词和人物特征描述词)+风格+官方命令词。 3D 公式:主体+描述词(重要描述词和物体特征描述词)+风格+灯光+官方命令词。 插画公式:主题描述词语+风格(风格名称或画家)+描述+颜色灯光+官方命令。 特定公式: 连续场景变化公式: 角色/场景公式:上传图片(喂图)+人物描写(融入其他场景需要关键词 white background,结合场景后换成 walking in a futuristic cyberpunk city)+场景风格描写+官方命令。 木偶公式:人物图片+场景+人物+动作+风格+官方命令。 等距粘土公式: 等距+物体+max emoji(表情符号),soft(柔和)lighting soft(柔和光线)pastel colors/pastel background(背景)+3Dicon+clay(粘土)+blender 3d+背景颜色=等距粘土物体。 安子布莱斯娃娃/也可以换成其他知道的娃娃名称+灯光/颜色/背景/材质+clay(粘土)+良奈吉友画风/或者其他名人风格=人。 3D 图标公式(未测试,可用):喂图(1~3 张相似的风格)+描述的 icon(和喂图一致的关键词)+颜色(和喂图颜色一致的)+渲染词+官方命令。 通用公式:角色/物体描述+背景描述+灯光风格+官方命令。
2025-01-17
请问如何学习MJ
以下是关于学习 Midjourney 的相关内容: 1. Midjourney 今天发布了模型个性化 Personalization 或'p'的早期测试版本。其工作原理是:每次写提示时,很多信息是“隐含的”,MJ 的算法通常会用社区的综合偏好填补空白,而模型个性化会学习您的喜好来填补空白。使用模型个性化的要求包括:目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效,可在排名页面查看评分数量或在 Discord 上输入/info。使用方法为:在提示后输入p,或使用提示栏中的设置按钮为所有提示启用个性化功能,启用时会在提示后添加一个“代码”,可分享此代码让他人使用应用于该图像的个性化效果,还可以使用s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。但需注意个性化目前不是稳定功能,会随更多成对排名而变化,且可能会推出算法更新。 2. 训练 Midjourney 的 prompt 流程:可以复制每一步,按照步骤跟 GPT 聊下去。原理是把 MJ 的官网说明书喂给 GPT,让它根据说明了解机制和结构,给出适合的提示词。 3. MJ 很长一段时间内依赖 discord 进行操作,可简单理解为一个微信群/钉钉群,群里有机器人,@它并给一段文字,它就会出图片。也可自己创建群组(服务器),把机器人拉进来对话创作。开始创作时@机器人,MJ 会返回 4 宫格图片。想要放大一张图,点击上面的 U 1——4,MJ 会发大图回来。或者看看其他风格,点击上面的 v 14,MJ 会返回新的 4 宫格。简单来说,步骤包括告诉 MJ 要什么,MJ 给 4 个不同风格小图,放大或再看其他风格,在这些图片基础继续处理。初学可能会有一些想法,比如第一次出图感觉不错,但再改可能难,此时设计师技能上线。以前除了氪金多练习没好办法,现在可以去离谱村进修。
2025-01-09
你和GPT4o、MJ、suno有什么区别呢
GPT4o 能快速返回答案,但可能存在错误且无法自动纠错。 o1 推理模型在给出最终结果前会反复推演和验证,耗时更长但结果更准确,o1 Pro 计算时间更长,推理能力更强,适合复杂问题。 MJ (Midjourney)是一款专注于生成图像的工具。 Suno 相关的特点未在提供的内容中有明确提及。 由于不清楚您提到的“Suno”的具体情况,无法给出更详细的对比。但总体来说,不同的工具在功能、性能、适用场景等方面存在差异。
2024-12-26
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
如何用runaway做一个1min左右的AI短片
以下是使用 Runway 制作 1 分钟左右 AI 短片的步骤: 1. 访问 Runway 网页(https://runwayml.com/),在右上角点击“Sign Up”进行注册。输入邮箱与基础信息,完成邮箱验证。 2. 新注册用户会有 125 个积分进行免费创作(约为 100 秒的基础 AI),选择“Try For Free”模式。 3. 制作视频: 选择左侧工具栏“Generate videos”(生成视频)。 选择“Text/Image to Video”(文字/图片生成视频)。 将图片拖入框内。 选择一个动画系数。 点击生成 4 秒视频。 下载视频。 需要注意的是,在实际制作过程中可能会遇到一些问题,比如动画效果一般、局部物体运动控制等。可以结合其他工具如 Pika、Dalle3 等来解决,同时在剪辑和高清化方面,也有不同的选择和注意事项。比如剪辑可以使用剪映,但对于更长篇幅或追求更好效果可能需要使用 PR/FCP/达芬奇等传统剪辑软件。高清化可以使用 Topaz Video AI,但可能对电脑配置有要求。在声音处理方面,可以通过标点符号改变 11labs 的语音效果,也可以使用国内的魔音工坊等工具。
2025-04-10
runaway的prompt编写
以下是关于 Runway 官方镜头提示词的相关内容: Prompt Structures 提示结构: 使用这种结构,提示一个女人站在热带雨林可能是这样的。 在提示的不同部分重复或强调关键思想可提高输出一致性。例如在超高速拍摄中,相机会快速飞过场景。应将提示集中在场景中应出现的内容上,比如输入晴朗的天空,而非没有云的天空。 协助镜头画面描述的提示词: 样品说明: 1. Seamless Transitions 无缝转换 1. Camera Movement 相机移动 1. Text Title Cards 文本标题卡 1. Prompt Keywords 提示关键词 关键字有助于在输出中实现特定样式。确保关键字与整个提示符保持一致,会使其在输出中更明显。例如,包括关于皮肤纹理的关键字对于相机未紧密聚焦在面部的广角拍摄没有好处,广角镜头可能受益于环境的其他细节。在保持这种凝聚力的同时,可尝试不同的关键字。
2024-09-18
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
AI办公相关的课程、软件教学
以下是为您提供的 AI 办公相关的课程和软件教学资源: 1. 90 分钟从 0 开始打造您的第一个 Coze 应用: 课程包含从零开始的应用界面教学,涉及过年相关应用。 介绍了当前承接的业务,包括辅导、培训、定制及企业 AI 落地等。 提到 11 月底应用推出背后的情况,包括社区对 AI 应用的呼声和功能需求挖掘。 2. AI 视频的软件教程: 涵盖了众多工具,如剪映、Dreamina、Pika、StableVideo、Pixverse、morphstudio、Runway Gen3、Adobe Firefly 以及清影等。 3. 张翼然:用 AI 为教师减负(3H).pdf: 包括教师的 AI 减负指南,生成式人工智能在教学中的应用。 介绍了教师使用 AI 的小技巧,如提示词设计公式之——RTFC。 涉及使用 AI 生成图片的方法与注意事项,AI 自动生成 PPT 功能。 展示了通过小程序实现文字与声音、视频的转化,自定义数字人形象进行教学。 展示了便捷的课堂教学工具与 Ai 课件制作,探讨了 A 生成视频与手工制作视频的教学效果差异。 强调了教育资源与版权问题,教师能力重塑,极简思维的教育应用,生成式 AI 教学策略。 包括 AI 技术助力教育管理和辅助教学实践,如班级与学校管理中的行政职日流程简化、听课记录自动化等。
2025-04-12
grok API能用在什么软件上
Grok API 可以用在以下软件上: 1. 扣子工作流:可以用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,还能参考相关教程将扣子接入微信机器人,但有微信封号风险。 2. 沉浸式翻译:由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品可以用来填 APIKEY 调用的场景,比如沉浸式翻译这个网页翻译工具。 3. 手机类 APP:比如通过快捷方式接入 Siri。 此外,xAI 发布的 Grok 3 API 提供了多个模型版本,如 grok3beta、mini、fast 等,满足不同场景需求,上下文窗口达 131K,支持图像输入输出,但当前不支持联网或实时访问外部网页与数据。
2025-04-12
人脸识别软件
以下是为您整合的关于人脸识别软件的相关信息: 在“【已结束】AI 创客松 参与同学自我介绍和分类”中,Dylan 擅长人脸识别算法和动作捕捉产品。 在“SmartBotX 模块化桌面机器人——说明文档”中,桌面客户端提供面部识别或跟踪功能的展示,可能用于安全监控、用户识别或交互式体验。 在“14、LayerStyle 副本”中,使用 YoloV8 模型可以检测人脸、手部 box 区域或者人物分割,支持输出所选择数量的通道。同时,Mediapipe 模型可以检测人脸五官,分割左右眉、眼睛、嘴唇和牙齿。
2025-04-12
文章配图的智能体或者软件
以下是为您整理的关于文章配图的智能体或软件的相关内容: 在《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》中提到,智能时代,智能应用会从有形界面消失,变成无所不在的助理或智能体,辅助甚至直接完成任务。文中还配有图 2.10:智能代理将改变企业组织架构。 在《XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路》中,个人实操案例部分提到为本篇文章配图的相关情况,但生成结果显示问题描述不够清楚。之后换提示词“那你给我生成搞笑图片吧,让人一看就有继续看下去的动力那种,需要一张公众号封面和一张配图”,得到了相应结果。同样的提示词,元器某应用也有生成。此外,文中还提到在搭建 bot 过程中存在工作流未成功触发导致访谈记录未成功存储入库的问题。
2025-04-11
和manus差不多的软件
以下是与 Manus 模式类似的软件: 1. Same.dev:像素级 UI 还原,自动生成对应代码,云端运行,支持自定义编码,但免费额度使用快,需输入 API,目前网站被标记危险。相关链接: 2. Genspark Super Agent:作为世界上首个 MixtureofAgents 系统,集多种功能于一体,能自动完成复杂任务。在 GAIA 基准测试的三个级别中得分均高于 Manus,具有近乎即时的结果、执行过程中错误和幻觉显著减少、让用户掌控一切并能指导和优化输出等优势。它是世界上第一个 MixtureofAgents 系统,利用最佳模型、工具和数据集来执行不同的任务,比如基础智能体的对话、图片、视频生成以及翻译。
2025-04-11
去除外网需要翻墙的AI,国内有什么可以代替的AI
以下是一些国内可替代外网需要翻墙的 AI 产品: 1. Kimi 智能助手: 是 ChatGPT 的国产平替,实际上手体验好,适合新手入门学习和体验 AI。 不用科学上网、不用付费、支持实时联网。 是国内最早支持 20 万字无损上下文的 AI,对长文理解做得较好。 能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。 PC 端: 移动端(Android/ios): 2. 302.ai:如果不想折腾,尤其推荐国内用户使用。 3. XiaoHu.AI: 适合编程小白,对新手友好。 深度理解中国开发场景和技术生态。 完全免费,无需翻墙,流畅稳定。 具备完整 IDE 功能(代码编写、项目管理、插件管理、源代码管理等)。 网址:
2025-03-24
请预测,随着国内AI水平的发展,2030年,可能会代替多少打工人的工作?
根据现有资料,关于 2030 年国内 AI 发展可能替代打工人工作的数量,不同的研究和观点有所不同。 咨询公司麦肯锡发布最新预测:截止到 2030 年时,50%工作将被 AI 取代。吴恩达认为 2023 年 AI 将会替代 4 亿 8 亿工作岗位,同时 AI 会增加 5.55 8.90 亿新岗位。总体而言,越具体、重复性高的工作越容易被取代,而灵活、非常规、创造性的岗位更难被取代。 需要注意的是,对于 AI 对就业的影响,还需要综合更多因素进行辩证看待。
2025-03-21
有没有能代替人工的ai
以下是关于能否有替代人工的 AI 的相关信息: 目前 AI 仍处于“任务渗透”阶段,而非“职业颠覆”。AI 最常用于编程(37%)和写作(10%),对体力劳动和专业职业影响较小。中等收入、高学历职业 AI 采用率最高,低收入和极高收入较低。AI 增强人类工作比例(57%)大于完全自动化(43%),短期内 AI 主要是辅助工具,而非取代人工。未来可能从“人机共创”模式向“任务外包”模式演进。 Inflection AI 的联合创始人 Mustafa Suleyman 提出了现代版的图灵测试,要求 AI 具备采取行动和取得成就的能力,以及对世界产生有意义的影响,如仅用十万美元投资,在几个月内通过零售网络平台赚取一百万美元,这需要 AI 完成一系列复杂任务,包括制定策略、撰写文案、研究设计产品、与制造商和物流合作、谈判合同、创立及管理市场营销活动等,同时面临分层规划和可靠记忆等技术挑战。 3 月 4 日的 AI 资讯中,在多个领域有新进展,如在 3D 方面,Meshcapade 可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝,InsTaG 能通过几秒钟视频学习快速形成逼真的 3D 说话头像效果,还有新型 3D 场景记忆框架 3DMem;在 AI 绘图方面,智谱开源了可在图像中生成中文字符的 AI 绘图 CogView4,海螺推出了 Image01 多功能文本转图像模型;在 AI 视频方面,Runway 内测能力可根据参考图像进行 Video to Video 视频风格化,Vidu 的 API 开放平台全面开放;在 AI 模型方面,Google Colab 推出 Data Science Agent,微软为医疗行业提供首个统一语音 AI 助手 Dragon Copilot,Opera 宣布推出网页浏览器的 AI 代理。
2025-03-06
怎样代替客服
以下是关于代替客服的相关内容: 目前已成熟的方式是采用 RAG+知识问答+语音条,主要场景是替代掉传统客服或者对内做培训的知识库。可以开发点击鼠标等动作的 RPA,搭配 RAG 的系统,方便现场 demo 演示。 实现难点包括 GPT4 等很多测试并不具备 planning 的能力,只能 plan 模型学过的知识库里的东西。面对更深层次的用户需求,需要一个产品经理将问题一层层拆开,未来很长时间是人与 GPT 同时存在的状态。 AIGC 在客户关系管理(CRM)领域有着广阔的应用前景,在客户服务方面,基于 AIGC 的对话模型,可以开发智能客服系统,通过自然语言交互的方式解答客户的咨询、投诉等,缓解人工客服的压力。 对于中小企业,利用人工智能(AI)技术,尤其是 AI 聊天机器人来自动化处理客户服务中的常见咨询,不仅可以提升客户服务的效率和质量,还可以减轻人工客服人员的工作负担。具体做法包括部署 AI 聊天机器人处理常见的客户咨询,根据企业需求和预算选择合适的解决方案并定制回答库,将其集成到多种客户服务渠道;通过机器人提供 24/7 客户支持,提升响应速度和服务质量,定期监控其性能并根据反馈优化,随着 AI 技术发展定期更新算法和知识库。
2025-02-19
AI可以代替人工数控编程吗?
AI 目前不能完全代替人工数控编程。虽然 AI 编程技术在不断发展,辅助编程效率也有所提高,但在复杂和商业化的应用中仍存在困难。 初级程序员可能会受到一定冲击,但中高级岗位仍有需求。软件开发需要人工主导复杂流程,AI 更像是“助手”而非“接管者”。代码编写只是开发中的一环,程序员的工作还包括需求评估沟通、架构设计、调试部署等多个模块。而且,大语言模型面对复杂项目可能面临改好一个 bug,产生一个新 bug 的情况。 例如,Cursor 是一款不错的编程工具,集代码编写、报错调试、运行于一体,能让小白无压力入门代码,但它比较适合简单、原型类的项目,在复杂和商业化应用时会面临挑战。 总之,在目前,AI 不能完全替代人工数控编程,未来可能会是一种人工和智能混合的工作模式。
2025-02-14
我想要能代替我直播的数字人工具
以下是一些能代替您直播的数字人工具相关信息: 数字人类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作等。 2. 真人形象数字人:用于直播卖货、营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等。 数字人的价值: 1. 代替人说话,提升表达效率和营销效率,例如真人做不到 24 小时直播,但数字人可以。 2. 创造真实世界无法完成的对话或交流。 数字人面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。比如抖音出台一些标准,而微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间,依赖大模型技术提升。 3. 需求限制:直播带货算个落地场景,但不刚。“懂得都懂”的刚需场景,国内搞不了。目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等等。 数字人直播盈利方式: 1. 直接卖数字人工具软件。分实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人接管。市面价格在一年 4 6 万往上(标准零售价)。非实时一个月 600 元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料。如果服装就搞不了,过品快,衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样(朋友公司数据)。 AI 直播的壁垒和未来市场格局: 1. 时间拉长,技术上没壁垒。但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高。比如更真实的对口型,更低的响应延迟等。 2. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。 虚拟主播的驱动方式: 目前,虚拟数字人从技术驱动方式上可以分为两类,一种是“中之人”驱动,另一种是由 AI 驱动。 “中之人”通过动作捕捉和面部捕捉技术,实现虚拟人与现实的交互。动作捕捉技术可以提供一套全身动捕硬件设备,售价约为 29000 元,另需缴纳 800 元的软件年度服务费。如果只需要捕捉面部表情,价格则约为 6000 元左右。总的来说,“中之人”是虚拟人物的“皮囊”,而“中之人”才是其真正的灵魂。 AI 驱动是通过 AI 技术实现虚拟人的创建、驱动和内容生成的综合技术,使其具备感知、表达等交互能力。AI 驱动的虚拟人能够智能地读取并解析外部输入信息,并根据解析结果做出决策,然后驱动人物模型生成相应的语音和动作,从而与用户进行互动。这种“一站式”技术让虚拟数字人具备更加自然、智能、人性化的交互能力。
2025-01-31