Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

海螺AI的功能

Answer

海螺 AI 具有以下功能:

  1. 能看懂图能听懂指令:MiniMax 视频模型不仅可以准确识别用户上传的图片,并确保所生成视频在形象保持上与原输入图像高度一致,且光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间;在指令响应方面,还能理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现“所写即所见”。
  2. 不依靠特效模板的惊艳特效:只依靠模型综合能力,就能实现最顶级的影视特效。每一位用户都能够在图像基础上充分发挥想象力,创作出丰富多变的电影级视频——CG 合成、场景变化、碎片化、拟人化等特效与玩法等你来体验。
  3. 细腻表情呈现提升感染力:人物 5 秒钟内实现从开怀大笑到掩面哭泣,表情控制力不输专业演员,让您的视频表达更能深入人心。
  4. 2000 字提示词更精准调控:近期,海螺 AI 视频同步上线了提示词优化功能。即使在大家对特定的构图、氛围、动作或运镜没有特殊指定要求时,我们建议开启此功能,聪明的海螺 AI 会结合原始 Prompt 扩展视频的美学呈现。同时,对于更专业的创作者,开放 2000 字的提示词空间,让创作更加精准。
  5. 在分屏联动、关键帧精确控制上效果非常好。
  6. 支持多种镜头表现的内容,如动画结合镜头、情境透视镜头、心理镜头、回忆镜头、前瞻镜头、反射对称镜头、光线追踪镜头、时空扭曲镜头、时间重置镜头、色彩转变镜头等。
Content generated by AI large model, please carefully verify (powered by aily)

References

海螺AI-Prompt教学

[title]海螺AI-Prompt教学[heading1]入门-认识海螺AIhttps://hailuoai.com/video【能看懂图能听懂指令】MiniMax视频模型不仅可以确识别8用户上传的图片,并确保所生成视频在形象保持上与原输入图像高度一致,且光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间;在指令响应方面,还能理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现“所写即所见”。【不依靠特效模板的惊艳特效】:只依靠模型综合能力,就能实现最顶级的影视特效。每一位用户都能够在图像基础上充分发挥想象力,创作出丰富多变的电影级视频——CG合成、场景变化、碎片化、拟人化等特效与玩法等你来体验。【细腻表情呈现提升感染力】人物5秒钟内实现从开怀大笑到掩面哭泣,表情控制力不输专业演员,让你的视频表达更能深入人心。【2000字提示词更精准调控】近期,海螺AI视频同步上线了提示词优化功能即使在大家对特定的构图、氛围、动作或运镜没有特殊指定要求时,我们建议开启此功能,聪明的海螺AI会结合原始Prompt扩展视频的美学呈现。同时,对于更专业的c创作者,我们开放2000字的提示词空间,让你的创作更加精准作者:山雨Prompt是一把由你的灵感与创意构筑的钥匙,能够打开通往AI奇幻世界的大门。无论你是初次接触AI的新人,还是已经能够熟练使用AI赋能生产力的老手,通过清晰的结构和灵活的表达方式,都可以轻松掌握Prompt的编写技巧,实现“一个人+一个AI=一个专业剧组”的科幻愿景。只要掌握一些小小的规则,人人都可以成为AI魔法师!为了达到更好的表现效果,我们为大家设计了两类Prompt的参考公式:

AI视频爆发式更新- 近半年闭源产品趋势

9月24日,字节发布了PixelDance、Seaweed两款视频AI模型,从官方Demo看,两款模型对长提示词,人物连续动作转变、多镜头组合、人物一致性的支持非常好。将有望成为国产AI头部核心竞争者。目前产品还在开放内测申请中。网页版访问:https://jimeng.jianying.com/ai-tool/home/内测申请:https://bit.ly/jimengai[heading2]海螺AI[content]MiniMax出品,出场视频演示非常惊艳,简单测试下来发现画面清晰度、画面表现力等均好过可灵1.0。在近期的Vbench排行榜中,海螺也获得了16个维度综合评分第一名。目前仅支持txt2vid方案。网页版访问:https://hailuoai.com/video[YouTube video.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/WMLIbJyG2oXY71xCAIrcyEWKnDf?allow_redirect=1)博主[@seiiiiiiiiiiru](https://x.com/seiiiiiiiiiiru)测试时发现海螺AI在分屏联动、关键帧精确控制上效果非常好,[heading2]通义万相[content]阿里云旗下产品,上半年有多个现象级案例刷屏,例如奶牛猫跳洗澡舞、全民跳科目三(这些功能在通义千问APP中可以找到)。9月刚开放了视频生成产品的预约,一次视频生成需要10min,测试了下生成效果一般般。网页版访问:https://tongyi.aliyun.com/移动端下载:通义APP

海螺AI-Prompt教学

[title]海螺AI-Prompt教学[heading1]镜头表现的内容(指画面内容而非狭义的镜头)动画结合镜头(Animation Live-Action Shot):在实景拍摄中融入动画元素,创造混合现实效果,常用于奇幻或科幻场景。情境透视镜头(Contextual Perspective Shot):从角色所处的独特位置或视角拍摄,增加观众对角色处境的理解。心理镜头(Psychological Shot):通过扭曲、变形或色彩变化,直接表现角色的心理状态或内心冲突。回忆镜头(Flashback Shot):通过插入过去事件的片段,帮助观众理解角色背景或情节发展。前瞻镜头(Flashforward Shot):展示未来可能发生的事件,通常用于悬念片或复杂叙事。反射对称镜头(Symmetrical Reflection Shot):利用对称反射的构图,创造视觉平衡和秩序感,增强画面的形式美。光线追踪镜头(Light Tracking Shot):跟随光源或阴影的移动,创造动态的光线效果,常用于惊悚或神秘场景。时空扭曲镜头(Spacetime Warp Shot):通过视觉效果表现时间和空间的扭曲或重叠,增加影片的科幻或奇幻色彩。时间重置镜头(Time Reset Shot):通过重复或回放某一事件,以不同视角或细节展现,增强叙事的深度。色彩转变镜头(Color Transition Shot):通过改变镜头中的色彩基调,表现情感变化或时间流逝。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
AI视频,用海螺走T台的案例
以下是关于 AI 视频中用海螺走 T 台的相关内容: 全新 AI 整活计划第三期:巨大萌物 奖励方式:使用海螺 AI 进行视频制作,海螺 AI 会评选出预计 10 位创意奖,给大家颁发海螺会员+现金奖励。 制作教程: 第一步:点开 whisk 网站(https://labs.google/fx/zh/tools/whisk),找到两张图(如:皮卡丘和埃菲尔铁塔),然后传上去,样式风格空着,写一句 Prompt(如:巨大的皮卡丘抱着埃尔菲铁塔)合成出来一张图片。 第二步:点开海螺网站(https://hailuoai.com),例如 Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛;巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。并提供了相关视频案例的链接。 视频模型:MiniMax 海螺 AI 中级实现精准的画面控制和高画面表现,精准美学控制,给出了现代都市街道上摩托车与警车追逐的 Prompt 示例及相关视频。 实际运用案例(电影、广告片、宣传片、短视频),包括场戏分镜头拆解梳理,如男人无奈起身开门、开门、开门走出、门外小女孩要糖、男人拒绝等情节的视频生成方式及相关视频链接。
2025-02-13
海螺AI相关的咨询
以下是关于海螺 AI 的相关信息: 海螺 AI 的视频模型具有多种强大功能: 能看懂图能听懂指令:MiniMax 视频模型可以准确识别用户上传的图片,生成的视频在形象保持上与原输入图像高度一致,光影、色调能完美嵌入新场景设定,还能理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现“所写即所见”。 不依靠特效模板的惊艳特效:只依靠模型综合能力就能实现顶级影视特效,用户可充分发挥想象力创作丰富多变的电影级视频,如 CG 合成、场景变化、碎片化、拟人化等特效与玩法。 细腻表情呈现提升感染力:人物能在 5 秒钟内实现从开怀大笑到掩面哭泣等丰富表情,表情控制力不输专业演员。 2000 字提示词更精准调控:近期上线了提示词优化功能,对于专业创作者开放 2000 字的提示词空间,让创作更加精准。 在热门产品中的表现: 出场视频演示非常惊艳,简单测试下来发现画面清晰度、画面表现力等均好过可灵 1.0。 在近期的 Vbench 排行榜中,获得了 16 个维度综合评分第一名。 目前仅支持 txt2vid 方案。 网页版访问:https://hailuoai.com/video
2024-10-21
除了通义、海螺之外,还有哪些可以制作短视频的AI工具
以下是一些可以制作短视频的 AI 工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架,能快速实现从文字到画面的转化。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助用户从图像制作视频并规划内容。 5. Runway:能将文本转化为风格化的视频内容,适用于多种场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,可根据文本脚本生成视频。 此外,剪映虽然方便,有很多人性化设计和简单音效库、小特效,但无法协同工作和导出工程文件,应用于商业化效果有限。剪辑流程通常包括视频粗剪、定剪、音效/音乐、特效、包装(如字幕)等步骤。在音效和音乐方面,剪映的简单音效库可用于制作简单短片,复杂音效需另外制作,音乐商用要注意版权。特效方面,如剪映可添加一些光的效果。包装方面,剪映智能匹配字幕再修改较为方便。
2024-10-14
runway的能力类型,核心功能
Runway 的能力类型和核心功能包括以下方面: 在 Gen2 模型上推出了较多细节控制能力,并且支持精细数值调节,是当下 AI 视频生成产品中可控性最强的产品。 多笔刷控制局部运动:支持最多 5 个笔刷控制,包括物体运动方向、运动曲线调节。调高 Ambient,笔刷绘制区域物体的运动将和周边环境产生更多关联,并加大运动幅度。 相机控制:支持水平/垂直平移,水平/垂直翻转,镜头缩放/旋转。 Lip Sync Video:支持文本转 TTS 音频、音频文件换音,还有上半年大火的 Lip sync video 对口型能力。 不论是工具栏中不断丰富的音频、视频处理能力,还是 Runway Watch 栏目中的优秀合作案例,都能看出 Runway 一直坚定得在影视制作方向发展。未来若能打通 AI 生成和视频剪辑能力,Runway 未来将对影视制作起到至关重要的作用,成为视频领域必不可少的重要工具。
2025-04-15
请帮我生成一个大三毕业论文的题目,专业是关于计算机应用的,技术栈:Python(Pandas/Matplotlib),MYSQL,生成可视化图表,可生成HTML网站,包含数据分析,需要有最基本的功能,最好与生活中的某些东西联系起来
以下是为您生成的几个与生活相关的计算机应用专业大三毕业论文题目,供您参考: 1. 《基于 Python 和 MySQL 的居民日常消费数据分析及可视化网站构建》 2. 《利用 Python 和 MySQL 分析城市交通流量数据并实现可视化与网站展示》 3. 《基于 Python 和 MySQL 的家庭能源消耗数据分析与可视化网站设计》 4. 《运用 Python 和 MySQL 对校园图书馆借阅数据的分析及可视化网站开发》 5. 《通过 Python 和 MySQL 研究城市空气质量数据的可视化分析与网站实现》
2025-04-11
RAG对话 摘要总结 功能实现
LangChain 和 RAG 的结合具有以下优势: 1. 灵活性:可根据需求和数据源选择不同组件和参数定制 RAG 应用,也能使用自定义组件(需遵循接口规范)。 2. 可扩展性:能利用 LangChain 的云服务部署和运行,无需担忧资源和性能限制,还可借助分布式计算功能加速应用,发挥多个节点并行处理能力。 3. 可视化:通过 LangSmith 可视化工作流程,查看各步骤输入输出及组件性能状态,用于调试和优化,发现并解决潜在问题和瓶颈。 其应用场景多样,包括: 1. 专业问答:构建医疗、法律、金融等专业领域的问答应用,从专业数据源检索信息辅助大模型回答问题,如从医学文献中检索疾病诊治方案回答医疗问题。 2. 文本摘要:构建新闻或论文摘要应用,从多个数据源检索相关文本帮助大模型生成综合摘要,如从多个新闻网站检索同一事件报道生成全面摘要。 3. 文本生成:构建诗歌、故事生成等应用,从不同数据源检索灵感协助大模型生成更有趣和创意的文本,如从诗歌、歌词或小说中检索相关文本生成作品。 此外,还介绍了本地部署资讯问答机器人的实现方式,即基于用户问题从向量数据库检索相关段落并按阈值过滤,让模型参考上下文信息回答,还创建了网页 UI 并进行评测,对不同模型的测试表现进行了对比,得出 GPT4 表现最佳等结论,并总结了使用 Langchain 和 Ollama 技术栈在本地部署资讯问答机器人及相关要点,即上下文数据质量和大模型性能决定 RAG 系统性能上限。
2025-04-11
如果我要分析代码功能
如果您要分析代码功能,可以参考以下步骤: 1. 准备工作: 分析要拷贝页面的技术栈,可通过打开 https://www.wappalyzer.com/ 输入要分析的网站地址获取。 截图要克隆的网页。 分析页面功能,如顶部导航栏、页面主体区域(包括分类在左边、文章列表在右边、标题位置、文章卡片展示位置、文章列表和分类区域)、底部导航栏。 2. 开始克隆出效果,并逐渐完善: 根据分析拆分后续要实现的内容,如先实现文章列表部分和底部导航栏。 对于文章列表部分,可使用提示词根据图片实现,注意不要直接点击全部接受,先看效果,不符合需求可拒绝或让 AI 解释新增代码的作用。 对于左侧菜单栏,可通过提示词实现,如要求内容是文章的分类,在页面滚动时菜单会吸顶。若出现异常,可选中所有异常添加到对话,让 AI 解决。 可让 AI 添加注释解释每段代码对应的功能,以便精准提出修改建议。 明确提示词,说清楚要实现的功能的位置、大小、效果。 3. 对于 AI Review(测试版): 这是一项可查看代码库中最近更改以捕获潜在错误的功能。 您可以单击各个审阅项以查看编辑器中的完整上下文,并与 AI 聊天获取详细信息。 为让其更有利,您可为 AI 提供自定义说明以专注于特定方面,如性能相关问题。 目前有几个选项可供选择进行审核,如查看工作状态、查看与主分支的差异、查看上次提交。
2025-04-09
如何用rpa来实现读取本地excel表格里的内容进行筛选,提取某些数据值后,再自动化填写到飞书的多维表格去。怎么来实现这个功能
要使用 RPA 实现读取本地 Excel 表格内容进行筛选,并将提取的数据值自动化填写到飞书的多维表格,可参考以下步骤: 1. 关于扣子:“”(Coze)是字节跳动在 2024 年上线的新一代一站式 AI Bot 开发平台,也被称为“字节版 GPTs”。它是一个低门槛的 AI 应用开发平台,其核心目标是让没有编程基础的用户也能够轻松参与到 AI 生态的建设中。 2. 登录后,在左侧功能列表的工作空间中,点击右上角“+字段”创建工作流,自行输入名称和描述。 3. 已做好工作流后,逐步拆解每个节点的配置: 开始节点:此节点不需要做任何配置,没有输入以及输出。 读取飞书表格内容节点:点击开始节点后面的“+”,搜索“飞书多维表格”,选择“search_record”功能。添加后,点击该节点的配置,在界面右侧的参数框中,需要填写 app_token、field_names。filter 是对数据的筛选条件,没有筛选需求可直接忽略。其中,app_token 是多维表格的唯一标识符,即表格 URL 中的一段;field_names 则是要读取的具体字段,比如“标题”、“内容”,以作为后续操作的输入。该节点运行后,就能将多维表格中的内容提取出来。
2025-04-09
CRM那些功能适合和ai结合
AIGC 在 CRM 中的应用主要包括以下几个方面: 1. 个性化营销内容创作:根据客户个人信息、购买历史、偏好等数据生成个性化且富有创意的营销文案、视觉内容等,提高营销效率和转化率。 2. 客户服务对话系统:基于 AIGC 的对话模型开发智能客服系统,通过自然语言交互解答客户咨询、投诉等,缓解人工客服压力。 3. 产品推荐引擎:借助 AIGC 生成丰富的产品描述、视觉展示等内容,结合推荐算法为客户推荐更贴合需求的产品,提升销售业绩。 4. CRM 数据分析报告生成:AIGC 可以自动生成数据分析报告,包括文字、图表、视频演示等形式,加快报告生产流程。 5. 智能翻译和本地化:提供高质量的多语种翻译及本地化服务,帮助企业打造全球化营销内容。 6. 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容,降低视频制作成本。 7. 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 以下是一些与 AI 结合的 CRM 相关产品推荐: 1. Clay:一款 AI 驱动的联系人应用软件,自动整理联系人信息,帮助管理个人和职业人脉。 2. Promptden:提示词交流和交易社区,可探索、发现和分享从 ChatGPT 和 Bard 文本提示到 MidJourney、Stable Diffusion 等 AI 生成的图像。 3. Parthean AI:财务教练,将 AI 工具与个人财务信息集成,提供定制答案,帮助用户制定预算并规划财务目标。 4. TinyStudio:免费的 Mac 应用程序,利用 M1/M2 芯片为视频和音频文件生成字幕。 5. Pagegpt:提供个性化网页设计,生成文案和图片,帮助吸引和转化顾客。 此外,工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加新的层。一些流行的原语如网页浏览(Browserbase、Tiny Fish)、代码解释(E2B)和授权+认证(Anon)已经出现,它们使 LLMs 能够导航网络、与外部软件(如 CRM、ERP)交互并运行自定义代码。例如,Omni 的计算 AI 功能利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。
2025-04-09