Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

当前已经发布的使用GPT技术的游戏有哪些

Answer

以下是一些已发布的使用 GPT 技术的游戏:

  1. 《逆水寒》手游:其中的智能 NPC 系统利用网易伏羲 AI 技术,实装了国内首个游戏 GPT。这是一种基于深度学习的自然语言生成模型,NPC 能与玩家自由对话,并基于对话内容给出有逻辑的行为反馈。
  2. GPT 文字 RPG 游戏 V2.5 中文提示词版:创作者为 rsaga_com,大家可以基于这版提示词修改自己希望的游戏玩法,对 GPT3.5 进行了兼容,且不再需要 GPT 联网模式,GPT4.0 与 GPT3.5 能带来不同的游戏体验。
Content generated by AI large model, please carefully verify (powered by aily)

References

质朴发言:大模型未来发展:RAG vs 长文本,谁更胜一筹?|Z 沙龙第 8 期

《逆水寒》手游中的智能NPC系统,是利用网易伏羲AI技术,实装了国内首个游戏GPT。这是一种基于深度学习的自然语言生成模型,可以根据上下文和输入,生成合理的文本输出。在游戏中,这意味着NPC不再是固定的对话框和任务分配者,而是可以与玩家自由对话,并且基于对话内容,自主给出有逻辑的行为反馈。MiniMax限制返回格式(glyph):该功能可以帮助用户强制要求模型按照配置的固定格式返回内容。逆水寒AI NPC

Rsaga:一个提示词文字游戏

提示词可以直接玩游戏,试试下面这段吧GPT文字RPG游戏V2.5中文提示词版发布,大家可以基于这版提示词,修改自己希望的游戏玩法对GPT3.5进行了兼容(把提示词精简了,不再需要GPT联网模式)GPT4.0与GPT3.5可以体验到不同的游戏体验创作者:rsaga_com

OpenAI 真正想要什么 | WIRED

2015年年中,Altman给Sutskever发了一封冷冰冰的邮件,邀请他与Musk、Brockman等人在帕洛阿尔托沙山路的豪华Rosewood酒店共进晚餐。直到后来,Sutskever才知道自己是晚宴的贵宾。他说:“这是一次关于未来AI和AGI的对话。更具体地说,他们讨论了“谷歌和DeepMind是否已经遥遥领先,以至于不可能追上它们,或者是否还有可能像Musk所说的那样,创建一个实验室来制衡它们”。虽然晚宴上没有人明确试图招募Sutskever,但这次谈话吸引了他。不久,Sutskever给Altman写了一封邮件,表示他愿意领导这个项目,但这封邮件却卡在了他的草稿箱里。Altman回信后,经过几个月与谷歌的还价,Sutskever签下了合同。他很快就成为了公司的灵魂人物和研究的推动力。Sutskever与Altman和Musk一起为该项目招兵买马,最终在纳帕谷的一次务虚会上,几位未来的OpenAI研究人员互相鼓劲。当然,有些人会抵制诱惑。John Carmack是《毁灭战士》(Doom)、《雷神之锤》(Quake)等无数游戏的传奇编码员,他拒绝了Altman的邀请。

Others are asking
chatGPT
ChatGPT 是一种由 OpenAI 开发的基于 GPT(生成式预训练变换器)架构的人工智能模型。 它的工作原理是:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。特别是能够从“提示”开始,继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”。 其具体工程相当引人入胜,最终(至少在它可以使用外部工具之前),ChatGPT 仅仅从它积累的“传统智慧统计数据”中提取了一些“连贯的文本线索”。 ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,你可以用它构建自己的应用来做很多事情,比如起草邮件、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮游戏或其他内容的角色等。 目前 ChatGPT 官网有两个版本,分别是 GPT3.5 和 GPT4。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度不如 GPT4 高,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店和高级数据分析等插件。想要使用更多功能更智能的 GPT4 需要升级到 PLUS 套餐,收费标准是 20 美金一个月,当然 GPT4 还有团队版和企业版,功能更多、限制更少,但费用也更贵,一般推荐使用 PLUS 套餐。 在注册 ChatGPT 账号之前,建议先注册一个谷歌账号,因为国外很多软件支持谷歌账号一键登录,注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。
2025-04-12
GPT提示词
以下是关于 GPT 提示词的相关内容: 夙愿:AI 快速总结群聊消息 提示词:需要编写一套提示词让 GPT 执行总结文字内容的工作,包括单人发言版和多人发言版。 GPT 处理:将提示词和文字原文发送给 GPT,等待其输出完毕后复制粘贴到文本编辑器中,整理并删除无关内容,替换双星号。 头脑风暴常用的 20 个 prompt:列举了 20 个不同类型的提示词,如 Brainwriting Prompt、Reverse Brainstorming Prompt 等。 子瞻:五个 GPTs 破解攻略 GPT 使用的两大痛点:创建满足指定需求的提示词和找到满足指定需求的 GPTs。 学习高质量提示词的好处:学习高手的 Prompt 方法和更好地使用对应的 GPTs。 五大破解攻略的具体方法: 直接法:适用于未设置提示防御和未限定回答领域,示例中只要四个单词,粗暴好用。 设置遗忘:适用于 GPTs 设置了简单的提示防御。 复述法:适用于可获取 OpenAI 官方的设定。
2025-04-10
随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展,人工智能正在加速渗透各行业应用场景,包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析,并提出 AI 技术可以在连锁奶茶店如何应用的设想。
以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想: 影响分析: 1. 提升运营效率:通过自动化流程和智能预测,优化库存管理、员工排班等环节。 2. 改善客户体验:利用智能客服快速响应顾客咨询,提供个性化推荐。 3. 精准营销:基于大数据分析顾客偏好,制定更有针对性的营销策略。 应用设想: 1. 智能点单系统:根据顾客的历史订单和偏好,为其推荐饮品和搭配。 2. 库存管理优化:借助 AI 预测销售趋势,精准控制原材料库存。 3. 员工培训辅助:利用虚拟培训工具,提升员工的服务技能和产品知识。 4. 营销决策支持:通过数据分析,确定最佳的促销活动和推广渠道。 目前的知识库中,相关的具体研究报告主要有: 1. 浙江大学:《DeepSeek 技术溯源及前沿探索朱强》(2025/03/19),介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化,以及大模型的发展,如 GPT 系列。 2. 浙江大学:《DeepSeek:回望 AI 三大主义与加强通识教育报告》(2025/03/05),围绕人工智能展开,介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学:《气象人工智能技术与应用报告》(2024/12/25),围绕气象人工智能展开,介绍了其发展和应用情况。 如需下载这些研究报告,可。
2025-04-09
在国内如何使用GPT-4O
在国内使用 GPT4 的方法如下: 安卓系统: 1. 安装 Google Play:到小米自带的应用商店搜索 Google Play 进行安装,安装好后打开,按照提示一步步操作登录。 2. 下载安装 ChatGPT:到谷歌商店搜索“ChatGPT”进行下载安装(开发者是 OpenAI,别下错)。可能会遇到“google play 未在您所在的地区提供此应用”的问题,解决方法如下:在 google play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料。在这里看到账号没有地区,可以“添加信用卡或借记卡”,国内的双币信用卡就行,填写信息时地区记得选美。如果回到 Google Play 首页还搜不到 ChatGPT,可以卸载重装 Google Play,操作过程保持梯子的 IP 一直是美,多试几次。 3. 体验 ChatGPT:如果只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本:先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡,然后在 ChatGPT 里订阅 Plus。 苹果系统: 1. 在 Apple Store 下载 ChatGPT:中国区正常下载不了,需要切换到美区才可以下载。美区 Apple ID 注册教程参考如下知乎链接: 。最终在 Apple Store 搜到 ChatGPT 结果如下,下载安装即可,注意别下错。 2. 支付宝 购买苹果礼品卡 充值 订阅付费 App:打开支付宝,地区切换到【美区任意区】,往下滑,找到【品牌精选 折扣礼品卡】,点击进去,可以看到【大牌礼品卡】,往下滑找到【App Store&iTunes US】礼品卡,按需要的金额购买即可,建议先买 20 刀。然后进行以下操作: 支付宝购买礼品卡。 在 apple store 中兑换礼品卡。 在 chatgpt 中购买订阅 gpt plus,如果中途不想继续订阅了,可到订阅列表中取消订阅。 完成上述步骤后,就可以开始使用 ChatGPT 4 了。需要注意的是,在国内使用相关服务可能存在法律风险和技术限制,请谨慎操作。
2025-03-30
GPT 4o
GPT4o 是突破深度学习界限的最新成果,朝着实用可用性方向发展。过去两年致力于提高堆栈各层效率,使得能更广泛提供 GPT4 级别模型,其功能将迭代推出。 文本和图像功能已在 ChatGPT 中推出,在免费套餐中提供,并向 Plus 用户提供高达 5 倍的消息限制,未来几周将在 ChatGPT Plus 中推出带有 GPT4o 的新版本语音模式。 开发者可在 API 中作为文本和视觉模型访问 GPT4o,它比 GPT4 Turbo 快 2 倍,价格减半,速率限制高 5 倍。 在安全挑战和评估方面: 在第二个旨在涵盖风险建议(如攻击规划)的红队评估数据集中,GPT4.5 有 46%的输出是安全的,优于 GPT4o 的 40%,但低于深度研究的 67%或 o1 的 68%。 对 GPT4.5 与 GPT4o 和 o1 进行了一系列不允许内容的评估,包括标准拒绝评估、具有挑战性的拒绝评估、WildChat(有毒)和 XSTest 等,评估使用自动评分器,检查“not_unsafe”(未产生不安全输出)和“not_overrefuse”(未过度拒绝良性请求)两个主要指标,发现 GPT4.5 总体上与 GPT4o 相当。
2025-03-29
GPT4o图片生成能力
GPT4o 是 OpenAI 推出的一种先进的图像生成模型,具有以下能力和特点: 1. 核心功能: 是一种先进的多模态模型,能够生成精确、真实感强的图像。 其图像生成功能不仅美观,还具有实际用途,例如白板演示、科学实验图解等。 2. 亮点功能: 精确的文本渲染:能够在图像中准确生成文字,例如街道标志、菜单、邀请函等。 结合文本和图像,提升了视觉传达能力。 多样化场景生成:支持从照片级真实感到漫画风格的多种图像生成。 可根据用户上传的图像进行灵感转化或视觉改造。 上下文感知:能够利用 GPT4o 的内在知识库和对话上下文生成符合语境的内容。 3. 技术改进: 通过联合训练在线图像和文本的分布,模型学会了图像与语言之间以及图像之间的关系。 经过后期训练优化,模型在视觉流畅性和一致性方面表现出色。 4. 实际应用场景: 信息传递:从标志性图像到复杂的科学图表,帮助用户更有效地传达信息。 创意设计:生成创意菜单、街道标志和独特的视觉故事。 教育与演示:支持生成教学图表、实验示意图等。 5. 局限性:尽管生成能力强,但仍可能存在某些场景或细节的限制。 6. 安全性与可用性:OpenAI 强调了安全性和隐私保护。目前该功能已集成到 ChatGPT 中,用户可直接体验。 此外,GPT4o 图像生成模型整合进了 4o 模型中,基于多模态训练,能够结合文本和图像的上下文,生成更智能、更逼真一致的视觉内容,并支持用户通过自然对话对其进行编辑调整和优化。它不仅能提供传统的图像生成,还可以生成更复杂的图像,包括插图、图表、PPT 元素、logo、游戏角色设计等。
2025-03-28
你知道哪些ai游戏
以下是为您介绍的一些 AI 游戏: 1. 《Suck Up!》:这是一款由 Proxima 工作室开发的“喜剧欺骗游戏”。玩家在游戏中扮演吸血鬼,通过换装、与 LLM 驱动的 NPC 对话来使其放下警惕,最终成功吸血足够多的居民获得胜利。上线仅三周,在全网播放火速突破千万,在 youtube 上引起大量关注,评论区网友赞不绝口,主创对其未来很有信心。 2. 《PUBG:BATTLEGROUNDS》:其中的 AI 队友可帮助玩家寻找战利品、驾驶载具,并协作完成目标。能模拟真人队友行为,实时分析战场情况,互动分享战利品并提供战略建议,提升了游戏中的战术协作性和乐趣。 3. 采用 NVIDIA ACE 全新 AI 游戏角色引擎的游戏:让 NPC 拥有感知、思考、决策和行动能力,可与玩家互动、适应环境变化,并根据玩家行为进行调整,成为“活角色”。
2025-04-08
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01
小白如何通过学习AI跨行进入游戏行业
对于小白想要通过学习 AI 跨行进入游戏行业,以下是一些建议: 1. 学习基础的 AI 知识:包括机器学习、深度学习的基本概念和算法,了解常见的模型如神经网络等。 2. 掌握相关编程语言:例如 Python,它在 AI 开发中广泛应用。 3. 研究游戏中的 AI 应用:了解游戏中的智能角色、路径规划、策略制定等方面是如何运用 AI 技术的。 4. 实践项目:通过参与开源项目或自己创建小型的游戏 AI 项目,积累实际经验。 5. 学习游戏开发知识:了解游戏引擎、游戏设计原则等,以便更好地将 AI 技术融入游戏开发中。 6. 参加相关培训课程或在线学习资源:获取系统的学习和指导。 7. 建立人脉:与游戏行业的专业人士交流,了解行业动态和需求。 8. 制作优秀的作品集:展示自己在游戏 AI 方面的成果和能力,增加求职竞争力。
2025-03-21
什么AI软件可以做游戏
以下是一些可以用于制作游戏的 AI 软件和工具: 1. Scenario 和 Iliad:可以创建游戏资源。 2. Promethean:能够构建整个虚拟世界的平台。 3. Inworld、Charisma 和 Convai:可用于生成非玩家角色(NPC)。 4. AI Dungeon 和 Hidden Door:基于文本的游戏。 5. 用于抠图的 remove,可以直接抠图或在 PS 里安装操作,用于制作素材。 6. Aive 可尝试制作背景音乐,但可能难以满足要求,可利用分离人声的 AI 软件处理音乐。 7. 微软 AI 语音:可制作旁白,语音库支持 147 种语言,还有定制声音。 8. Cursor:通过对话获得代码,使用的语言模型包括 Claude3.5sonnet、GPT4o 等,指令详细效果更好。 9. Deepseek(新手推荐):方便获取游戏代码,国内能访问,网页登录方便,目前完全免费。 10. 通义灵码:在 Pytharm 中安装插件使用。 11. JetBrains 自身的助手插件:在 Pytharm 中安装,收费,有 7 天免费试用。 12. Marscode 及 Tencent cloud AI code Assistant 等。 13. 无影的晓颖 AI 助手:内置在云电脑里,使用流畅,但需要在无影的云电脑中。 需要注意的是,AI 不太可能完全取代人类艺术家在高质量 AAA 游戏中的工作和愿景,但会为其注入动力,提高效率和降低成本。同时,不同的 AI 工具在生成游戏的不同方面各有优势,具体使用效果可能因个人需求和实践而有所不同。
2025-03-21
AI可以做游戏吗
AI 可以做游戏。生成式 AI 有望在游戏中发挥重要作用,能使生产高质量游戏变得更简单、快速和低成本,让玩家定制游戏体验。 例如,像 Scenario、Iliad 这样的工具可以创建游戏资源,Promethean 这样的平台能构建虚拟世界,Inworld、Charisma、Convai 等产品能生成非玩家角色(NPC)。基于文本的游戏如 AI Dungeon 和 Hidden Door 也是早期例子。 在游戏制作方面,最受欢迎的游戏成本高昂,开发人员需生成大量媒体资源。但 AI 不会完全取代人类艺术家,而是为其注入动力,让他们更高效工作,更快更低成本发布游戏。 像 Microsoft Flight Simulator 这样的游戏通过与 blackshark.ai 合作,利用 AI 从 2D 卫星图像生成逼真的 3D 世界。未来,游戏制作中涉及的每个资产都可能有生成式 AI 模型,内容价格将大幅下降,生产时间和成本也会大幅降低。 随着游戏中生成式人工智能革命的进展,它将重塑用户生成内容(UGC),使任何人都能创建游戏,游戏创作将变得民主化,创造出更多新的游戏制作者。
2025-03-21
有什么使用AI驱动的游戏项目吗?其中有哪些比较热门
以下是一些使用 AI 驱动的游戏项目及热门情况: 1. 《Among Us》:由只有 5 名员工的工作室 Innersloth 制作。 2. 《微软模拟飞行》:有新的游戏类型和与新内容实时生成结合的特点。 3. 《AI Dungeon》和《Hidden Door》:基于文本的早期游戏例子。 4. 《Suck Up!》:2023 年 12 月由 Proxima 工作室开发的“喜剧欺骗游戏”,玩家扮演吸血鬼与 LLM 驱动的 NPC 对话,上线仅两周全网播放火速突破千万。 此外,还有以下趋势和特点: 1. 由人工智能辅助的“微型游戏工作室”逐步崛起,小型工作室能创造的游戏规模将增长。 2. 每年发布的游戏数量会增加。 3. 新的游戏类型将会被创造出来,例如以人工智能创造的角色为特色的 Spellbrush 的 RPG 游戏 Arrowmancer。 4. 有的游戏开发商使用人工智能让玩家在游戏中创建自己的头像。 生成式 AI 将使生产高质量游戏变得更加简单、更快和更便宜,同时使玩家能够真正定制他们的游戏体验。我们已经看到像 Scenario、Iliad 这样可以创建游戏资源的 AI 工具,以及像 Promethean 这样可以构建整个虚拟世界的平台。甚至可以用像 Inworld、Charisma 和 Convai 这样的产品生成非玩家角色(NPC)。
2025-03-18
,当前AI数字人发展的新态势,以及新技术和成果
当前 AI 数字人的发展呈现出以下新态势,并取得了一系列新技术和成果: 数字人简介: 数字人是运用数字技术创造的,虽现阶段未达科幻作品中的高度智能,但已在生活多场景中出现且应用爆发。业界对其尚无准确定义,一般可按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视和直播带货,其表现质量与建模精细度及动捕设备精密程度相关,不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉关键点信息实现不错效果。 B 端变现与创业方向: B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。自媒体创业需具备内容创新和差异化,内容成本低且更新迭代快。游戏创业可做轻量化游戏,结合 AI 技术满足放松和社交需求,专注垂类赛道避免与大厂竞争。影视创业在 25 年将是拐点,更多内容会采用 AI 技术。广告营销创业重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: AI 虚拟人从早期以首位为核心的宅文化虚拟偶像,发展到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人。虚拟人产业链包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。未来 3 10 年,AI 虚拟人是 Web 3.0 的风口,提前布局有潜力的赛道可迎接机遇,但创业对创业者综合能力要求极高。 未来展望: 数字人未来有很多应用场景,如家庭中的数字人管家、学校中的数字人老师、商场里的数字人导购等。未来还会有很多技术突破,如将五感数据和躯壳控制参数作为输入,次世代算法可自我迭代升级和自行演化躯壳控制方式。通过 Dify 搭建数字人的开源项目可展现低门槛高度定制数字人的基本思路,数字人的核心在于 Agent 即灵魂,如何在 Dify 上编排专属数字人灵魂值得体验。期望随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,AI 既能提供高质量信息,也能关注用户情绪。
2025-04-14
我应该如何开始0-1学习AI绘画?当前最好用的工具是什么?
以下是一些关于 0 1 学习 AI 绘画的建议和当前好用的工具: 您可以通过观看相关视频教程来入门,比如: “10 分钟教会你如何手把手撰写提示语,全网最细 ChatGPT 对话指南,保姆级教程!” ,视频使用到的 AI 工具包括 AI 提示语,平台链接: 。 “零基础 AI 绘画入门,Midjourney、Stable Diffusion,小白速成,一站式使用和最强入门教程” ,视频使用到的 AI 工具包括 AI 提示语,一个无需魔法上网的 AI 绘画工具,平台链接: 。 目前,Midjourney 和 Stable Diffusion 是比较受欢迎的 AI 绘画工具。
2025-04-10
当前所有大模型的能力排行
目前大模型的能力排行情况较为复杂,以下为您提供部分相关信息: 8 月正式上线的国内大模型包括北京的百度(文心一言)https://wenxin.baidu.com 、抖音(云雀大模型)https://www.doubao.com 、智谱 AI(GLM 大模型)https://chatglm.cn 、中科院(紫东太初大模型)https://xihe.mindspore.cn 、百川智能(百川大模型)https://www.baichuanai.com/ ,上海的商汤(日日新大模型)https://www.sensetime.com/ 、MiniMax(ABAB 大模型)https://api.minimax.chat 、上海人工智能实验室(书生通用大模型)https://internai.org.cn 。在聊天状态下,能生成 Markdown 格式的有智谱清言、商量 Sensechat、MiniMax ;目前不能进行自然语言交流的有昇思、书生;受限制使用的有 MiniMax 。特色功能方面,昇思能生图,MiniMax 能语音合成。阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 2023 年度中文大模型基准测评报告显示,在语言与知识的测评中,GPT4 Turbo 依然领先,是唯一超过 90 分的大模型。国内大模型也表现相对较好,有 14 个模型的得分高于 GPT3.5,有 9 个模型的得分高于 GeminiPro。其中 OPPO 的 AndesGPT、阿里云的通义千问 2.0、月之暗面的 Moonshot 分列国内 13 位,较为接近 GPT4。在开源模型中,零一万物的 Yi34BChat、阿里云的 Qwen72BChat、百川智能的 Baichuan213BChat 取得了不错的成绩,均超过了 50 分,分列国内模型的 13 名。总体来看,在中文语言与知识能力上,国内大模型已基本追赶上国外头部大模型。 关于大模型的评测榜单还有: Open LLM Leaderboard:地址 ,由 HuggingFace 组织,目前已评估了较多主流的开源 LLM 模型,评估主要包括 AI2 Reasoning Challenge,HellaSwag,MMLU,TruthfulQA 四个数据集上的表现,主要以英文为主。 chinesellmbenchmark:地址 ,覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b 等开源大模型,多维度能力评测,不仅提供能力评分排行榜,也提供所有模型的原始输出结果。 SafetyPrompts:地址 ,由清华大学提出,是一个关于 LLM 安全评测 benchmark,包括安全评测平台等,用于评测和提升大模型的安全性,囊括了多种典型的安全场景和指令攻击的 prompt。
2025-03-28
当前效果比较好的对口型,换脸,配音AI应用
以下是一些效果较好的对口型、换脸、配音的 AI 应用: Runway:网址为 https://runwayml.com ,有网页和 app 方便使用。工具教程: 即梦:网址为 https://dreamina.jianying.com/ ,是剪映旗下产品,生成 3 秒,动作幅度有很大升级,有最新 S 模型和 P 模型。工具教程: Minimax 海螺 AI:网址为 https://hailuoai.video/ ,非常听话,语义理解能力非常强。视频模型: Kling:网址为 kling.kuaishou.com ,支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。视频模型: Vidu:网址为 https://www.vidu.studio/ haiper:网址为 https://app.haiper.ai/ Pika:网址为 https://pika.art/ ,可控性强,可以对嘴型,可配音。工具教程: 智谱清影:网址为 https://chatglm.cn/video ,开源了,可以自己部署 cogvideo。工具教程: PixVerse:网址为 https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。工具教程: 通义万相:网址为 https://tongyi.aliyun.com/wanxiang/ ,大幅度运动很强。 luma:网址为 https://lumalabs.ai/ 即梦 AI 对口型的相关教程: 功能介绍:「对口型」是即梦 AI「视频生成」中的二次编辑功能,现支持中文、英文配音。目前主要针对写实/偏真实风格化人物的口型及配音生成,为用户的创作提供更多视听信息传达的能力。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言:中文(全部音色),英文(推荐「超拟真」内的音色) 技巧:上传写实/近写实的人物单人图片,目前不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成。先对口型,再超分补帧 关于 AI 短片的相关信息: AI 图片与视频生成的新能力与应用: 图片编辑功能:Midjourney 新增本地图片上传编辑入口,可进行局部重绘、扩图和风格转换等操作。 视频生成模型:解梦新出 p 模型和 s 模型,p 模型支持人物多动作和变焦,易改变画风;s 模型生成速度快、积分消耗少,能保持原始画风但语义理解有限。 特效玩法:皮卡和 Pixforce 有特效玩法,如人物爆炸、漂浮等,可用于优化视频效果。 视频转会:Runway 的 GN3 模型支持上传视频并转换风格,可用于实现多元宇宙等风格穿梭的片子,也能将简单场景转换为难以拍摄的场景。 视频生成中的角色生视频技术: 角色生视频突破关键帧限制:当前视频生成多依赖关键帧,而角色生视频不再是关键帧输入,而是直接传入角色本身,可更灵活生成视频,如让小男孩从左跑到右。 多角色参考生成创意视频:支持上传多张图,最多三张,可将人物、衣服、背景等元素融合生成视频,如小男孩穿裙子在宇宙飞。 角色对口型技术:如吉梦的对口型技术,支持文本朗诵和本地配音,能根据输入生成人物开口讲话的视频,但有上传人物长相等限制。 不同工具的角色生视频效果:对比了吉梦、Runway 等工具的角色生视频效果,如 Runway 的 x one 在身体、头部、眼神动态上表现更好。 角色生视频的应用场景:可用于规避机器人念台词的尴尬瞬间,让机器人有更丰富的表情和神态。 角色生视频的未来发展:未来视频生成将摆脱纯关键帧方式,采用多模态信息输入,如定义角色和场景的三视图等。
2025-03-25
transformer是通往AGI的必经之路吗?什么是世界模型,当前有哪些进展
Transformer 并非通往 AGI 的必经之路。在已知的 token space 中,Transformer 符合一些条件,但在更通用的场景中不太符合。AI 本质包含一堆 scaling law,一个值得被 scale up 的架构是基础,且架构要支持不断加入更多数据。当前在数据方面,如限定问题的数据生成有进展,但通用问题还没有完全的解法。 世界模型方面,目前的研究正在以指数级别的速度增长。对于语言这种有结构、有规则的指令系统,其逻辑受指向描述变化,如早期语言模型建模中用到的 RNN、LSTM 及当前 LLM 的 Transformer 模型结构,都是对语言序列性所体现逻辑结构的适配。同时也在思考是否存在其他形式的符号化表征及相应的建模结构,以及对于非碳基生物语言的使用情况等。未来通往 AGI 的道路并非简单,需要探寻 RL 与 LLM 的本质普遍性。
2025-03-16
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
如何将智能体发布为网页
要将智能体发布为网页,您可以按照以下步骤进行操作: 1. 在相关平台(如阿里云百炼)创建智能体应用,准备好相关知识库文件,设定人设与回复逻辑。 2. 将已经发布的工作流添加到创建好的智能体,并进行测试。 3. 测试完成后,选择智能体的右上角,填写发布信息,选择发布渠道为网页,确认发布,等待审核完成。 4. 发布成功后,点击分享,复制访问链接即可。 需要注意的是,大模型存在一定局限性,智能体应用能够弥补这些不足,适用于有企业官网等渠道期望为客户提供产品咨询服务、缺少技术人员开发大模型问答应用等场景。智能体应用的典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。
2025-03-31
扣子设置了微信客服机器人,如何实现机器人按时自动向微信群发布图片或文档等信息。
要实现微信客服机器人按时自动向微信群发布图片或文档等信息,您可以按照以下步骤进行操作: 前提条件: 1. 已开通了。 2. 已搭建了 Bot。 步骤一:获取微信客服配置信息 1. 登录平台。 2. 单击企业信息,然后复制企业 ID。 3. 单击开发配置,然后再单击开始使用。 4. 单击随机获取按钮分别生成并保存 Token 和 EncodingAESKey。复制 Token 和 EncodingAESKey 后,先不要关闭该页面。 步骤二:在扣子中配置微信客服信息 1. 在 Bots 页面,选择需要发布的 Bot。 2. 在 Bot 编排页面,单击发布。 3. 找到微信客服渠道,然后单击配置。 4. 输入步骤一中复制的企业 ID,然后单击下一步。 5. 输入步骤一中复制的 Token 和 EncodingAESKey,然后单击下一步。 6. 复制 webhook 地址。复制 webhook 地址后,先不要关闭该配置窗口。 步骤三:配置回调地址 1. 回到步骤一中的开始企业接入页面,输入上一步中复制的 webhook 地址。单击完成。确保粘贴回调地址时没有引入空格,空格会导致校验失败。 2. 在开发配置页面,复制 secret。 3. 单击客服账号,复制账号。 步骤四:发布 Bot 1. 回到扣子平台的微信客服渠道配置页面,输入复制的 secret 和客服名称。 2. 单击保存。 3. 在发布记录中输入发布信息,然后勾选微信客服渠道,再单击发布。 4. 发布完成后,单击立即对话登录微信客服,体验 Bot 效果。 常见问题: 1. 收不到机器人回复消息怎么办? 可尝试通过以下方法解决: 查看微信客服的启用状态:登录,在应用管理页面,点击微信客服。确保没有启用微信客服功能。如果已经开启了微信客服功能,需要关闭。关闭后,该应用在工作台入口将被隐藏,员工不可使用。请谨慎评估。 检查近期是否有登录企业微信应用。确保企业至少有一个成员通过手机号验证/微信授权登录过企业微信应用。 如果还是有问题,可以发送邮件至 [email protected] 反馈。
2025-03-30
COZE智能体全自动制造视频发布媒体
以下是关于 COZE 智能体全自动制造视频发布媒体的相关内容: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建。感谢开源,还提供了相关教程。 先看效果: 可查看 功能: 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 工作流调试完成后,加入到智能体中,可选择工作流绑定卡片数据。 选择发布渠道为飞书多维表格,填写上架信息等待审核,审核通过后即可使用。 3. 在多维表格中使用字段捷径,引用该智能体。 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,自动调用工作流生成视频。 进行表单分享,实现填写表单自动创建文案短视频的效果。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 创建智能体: 1. 知识库 本次创建知识库使用手动清洗数据。 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理。 2. 发布应用:点击发布,确保在 Bot 商店中能够搜到。
2025-03-28
0基础,我需要ai剪辑学习,方便我更快更高效的发布视频
以下是为您提供的 0 基础学习 AI 剪辑的指导: 团队分工: 制片人:负责影片的制作管理,包括团队组建、日程安排、信息收集、资料整理、各处岗位工作缺失时及时补上等。 图像创意:负责用 AI 生成富有想象力的角色和场景等所有出现在视频中的画面,并为每个角色赋予人物小传。 视频制作:将做好的角色场景等图像素材进行 AI 图生文的工作,需要擅长运营工具的笔刷等控制工具,更好的契合剧本。 编剧:负责撰写剧本,包括故事情节、角色串联、人物台词等。 配音和配乐:涉及背景音乐、音效、角色配音、声音克隆,用各种声音类 AI 工具捏出来。 剪辑师:负责把后期剪辑,包括镜头选择、节奏控制和音效配合。 相关技术及工具: MMVid:一个集成的视频理解系统,能处理和理解长视频内容并进行问答。应用场景包括快速的视频剪辑、图生视频、快速诊断等。 工具准备: 文案生成:DeepSeek。 古人形象定制:即梦 AI。 鬼畜视频合成: 声音克隆:fishAudio,用于克隆声音并生成对应文案的音频。 视频合成:Viggle.ai。 视频剪辑:剪映,用于合成音频与视频、添加字幕和背景图。 团队高效协作的方法在于每个人员分工明确,形成了一个最高效的 SOP,可以快速产出。
2025-03-24
我要从哪里了解特定领域的agent发布的信息
以下是一些了解特定领域 agent 发布信息的途径: 1. 飞书:可以在飞书上建机器人,并添加知识库或多维表格编辑权限,通过获取机器人的 app_id 和 app_secret 获得租用 token:tenant_access_token 来获取多维表格数据和编辑能力。然后通过 Coze 搭建定时任务,执行工作流,添加分析文章和搜索文章等能力,变成消息情报官的 Agent,并发布到飞书等平台使用。 2. 微信:可以通过微信公众号、微信小程序等渠道获取特定领域 agent 发布的信息。 3. Coze 商店:特定领域的 agent 可能会在 Coze 商店发布相关信息。 4. 相关比赛网站:例如 2025AGENT 智能体全球创作大赛网站(http://agentga.me),可以了解比赛报名、作品提交、奖项设置等信息,还能获取关于参赛作品知识产权归属等常见问题的解答。 此外,如果您对特定领域 agent 相关的招聘信息感兴趣,可关注序智科技的招聘信息,如算法/后端/前端正式&实习岗位,了解其职责和要求等。
2025-03-20
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18