Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

中国大陆的ai大模型有哪些,所对应的软件名称是什么

Answer

以下是中国大陆的一些 AI 大模型及对应的软件名称:

  • 北京企业机构:
    • 百度:文心一言,网址:https://wenxin.baidu.com
    • 抖音:云雀大模型,网址:https://www.doubao.com
    • 智谱 AI:GLM 大模型,网址:https://chatglm.cn
    • 中科院:紫东太初大模型,网址:https://xihe.mindspore.cn
    • 百川智能:百川大模型,网址:https://www.baichuan-ai.com/
  • 上海企业机构:
    • 商汤:日日新大模型,网址:https://www.sensetime.com/
    • MiniMax:ABAB 大模型,网址:https://api.minimax.chat
    • 上海人工智能实验室:书生通用大模型,网址:https://intern-ai.org.cn

国内免费的大模型 APP 有:

  • Kimi 智能助手:由 Moonshot AI 出品,能一口气读完二十万字的小说,还会上网冲浪。
  • 文心一言:百度出品的 AI 对话产品,能写文案、想点子,陪聊天、答疑解惑。
  • 通义千问:由阿里云开发,能与人交互、回答问题及协作创作。

此外,还有以下大模型有免费接口:

  • 阿里:通义千问大模型,网址:https://dashscope.console.aliyun.com/
  • 智谱 AI:ChatGLM,网址:https://open.bigmodel.cn/
  • 科大讯飞:SparkDesk,网址:https://xinghuo.xfyun.cn/sparkapi

需要注意的是,目前国内的大模型大多限制一定免费额度的 Token。谷歌的 Gemini 大模型(gemini 1.5)和海外版 Coze 的 GPT4 模型免费且能图片识别,但需要给服务器挂梯子。具体操作可参考张梦飞同学写的教程:【保姆级教程】这可能是你在地球上能白嫖到的,能力最强的超级微信机器人!一步一图,小白友好,网址:https://waytoagi.feishu.cn/wiki/YeBiwZx2TiyNLMk8pdjcmdQfnjd 。但使用海外服务需遵守相关法律法规。

Content generated by AI large model, please carefully verify (powered by aily)

References

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成

问:国内免费的大模型app有哪些?

Kimi智能助手、文心一言、通义千问这几个都是国内免费的APP。Kimi智能助手:Kimi是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,Moonshot AI出品的智能助手。文心一言:百度出品的AI对话产品,它的定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。通义千问:通义千问是由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。还有更多大模型产品,可以访问网站查看:内容由AI大模型生成,请仔细甄别。

DIN:全程白嫖 - 拥有一个AI大模型的微信助手

阿里的[通义千问大模型](https://dashscope.console.aliyun.com/)接口,然后打开链接,创建个APIkey。[智谱AI(ChatGLM)](https://open.bigmodel.cn/)、[科大讯飞(SparkDesk)](https://xinghuo.xfyun.cn/sparkapi),也有免费接口。目前国内的大模型大都是,限制一定免费额度的Token。[谷歌的Gemini大模型](https://ai.google.dev/)(gemini 1.5),[海外版Coze](https://www.coze.com/)的GPT4模型。是免费而且还能图片识别,但需要给服务器挂梯子。想使用,这里我推荐张梦飞同学写的这篇教程[【保姆级教程】这可能是你在地球上能白嫖到的,能力最强的超级微信机器人!一步一图,小白友好](https://waytoagi.feishu.cn/wiki/YeBiwZx2TiyNLMk8pdjcmdQfnjd)。里面手把手教你怎么给服务器搭梯子,怎么使用海外版coze。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
如果面试AI产品经理岗位,我的简历应该如何介绍对应的AI项目?目前我在做的是一个AI深度解读的功能,用户通过报告页面进行深度解读,进入后触发AI与用户的沟通,根据沟通信息,将用户的一些情况写在病历信息中,最终发给医生
以下是为您提供的一些参考,帮助您在面试 AI 产品经理岗位时介绍对应的 AI 项目: 在您所做的 AI 深度解读功能项目中,可以从以下几个方面进行介绍: 项目背景:阐述开展该项目的原因和目标,例如为了提升医疗服务的效率和准确性,满足用户对深度医疗解读的需求等。 项目职责:详细说明您在项目中的具体职责,如需求分析、产品规划、与开发团队协作、与用户沟通获取反馈等。 技术实现:描述项目中所运用的关键技术,如触发 AI 与用户沟通的机制、如何将用户信息写入病历等。 用户体验优化:提及为提升用户体验所采取的措施,比如优化报告页面的设计、提高 AI 沟通的自然度和准确性等。 成果与效益:展示项目取得的成果,如提高了医生的诊断效率、提升了用户满意度等。 此外,您还可以参考以下其他相关人员的项目经验: 秦超作为 AI 2C 项目负责人,在产品落地服务方面具有丰富的经验,包括产品、技术架构以及项目管理等。 Cici?在 AI 算法开发领域,将宠物与 AI 结合,具备 AI 产品研发和创业经验。 11 鸭鸭呀作为产品经理,在智能写作产品方面有 Prompt 撰写和 AI 应用的经验。 枫 share 作为产品经理,熟悉 ChatGPT,写过 prompt,使用过多种 AI 创作工具,并正在寻找 AI 方向的产品岗位。 行远作为产品经理,熟悉 prompt,部署过多种绘图项目,使用过多款 AI 创作工具,期待学习和实战案例应用。 希望以上内容对您有所帮助,祝您面试成功!
2025-04-01
我需要的是,根据我给出的文本生成分镜,且可制作对应视频的ai
以下是为您提供的根据给出的文本生成的相关信息: 分镜创作流程和方法: 1. 在歌曲创作完成后,根据音乐进行画面生成。画面分为三类:有歌词部分使用 Midjourney 生成,无歌词部分如前奏使用 SD 制作字体设计,转场部分使用 Deforum 制作。 2. 让 GPT 按照每段歌词生成一系列的 MJ 提示词,作为画面参考,再进行调整和编写。 3. 如开篇部分,需自行构思,如通过弹古筝女子引入,为增加神秘感,从女子背景开始,镜头慢慢拉近。若 MJ 出图不理想,可先使用 DALL·E3 绘制构图,再用垫图方式给到 MJ。 不同案例中的分镜特点: 1. 《心 Heart 创作分享》中,分镜完全根据感觉,强调梦境,主色调为蓝色,提示词末尾加上胶片拍摄、蓝色等关键词。因个人制作,未设置复杂元素和构图,挑图大感觉对即可。 2. 视频化部分:分两个部分,Ai 图生视频部分使用 Runway 和 Dreamina,Runway 完成动态感要求不高但质感趋向实拍的画面,Dreamina 实现高动态幅度画面,如电视机里气球漂浮、心形候鸟飞走等,还通过首尾帧叠加剪辑实现时间流逝和穿越感。 AI 视频生成的应用场景: 1. 专业创作者(艺术家、影视人等):AI 生成能为作品赋予独特风格和想象力,提供灵感,配合高超剪辑技巧和叙事能力可制作出超乎想象的效果。低成本动捕能大幅降低后期制作门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等能辅助视频编辑,为后期制作增加更多空间。目前主要集中在音乐 MV、短篇电影、动漫等方向,一些 AI 视频平台也积极寻求创意合作,为创作者提供免费支持。 2. 自媒体、非专业创作者:这部分人群通常有具体且明确的视频剪辑痛点,如科技、财经、资讯类重脚本内容的视频制作时需花费大量时间找素材和注意版权问题,一些产品已在发力脚本生成分镜、视频,帮助降低制作门槛。不同平台适合不同内容形式,OpusClip 提供的长视频转短视频致力于解决同一素材在不同平台分发导致制作成本升高的痛点。 3. 企业客户:对于资金不足的小企业、非盈利机构,AI 视频生成可大幅缩减成本。
2025-03-06
我想要一个根据我的文本生成对应视频的ai,最好是免费的。
以下为您推荐一些可以根据文本生成对应视频且有免费选项的 AI 工具: 1. Pika Labs:被网友评价为目前全球最好用的文本生成视频 AI。目前内测免费。其生成服务托管在 discord 中,操作步骤如下: 加入 Pika Labs 的 Discord 频道:在浏览器中打开链接 https://discord.gg/dmtmQVKEgt ,点击加入邀请。 在 generate 区生成:左边栏出现一只狐狸的头像就意味着操作成功了,如果没成功点开头像把机器人邀请至服务器。接着在 Discord 频道的左侧,找到“generate”子区,随便选择一个进入。 生成视频:输入/create,在弹出的 prompt 文本框内输入描述,比如/create prompt:future war,4Kar 16:9,按 Enter 发送出去就能生成视频了。也可以输入/create 后上传本地图片生成对应指令动态效果。喜欢的效果直接右上角点击下载保存到本地。如果对生成的视频不满意,可点击再次生成按钮优化效果。 2. Hidreamai(国内,有免费额度):支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。网址:https://hidreamai.com//AiVideo 3. ETNA(国内):由七火山科技开发的文生视频 AI 模型,可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,时空理解。网址:https://etna.7volcanoes.com/ 此外,还有以下工具供您参考: 1. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 2. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 3. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 4. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 (内容由 AI 大模型生成,请仔细甄别)
2025-03-06
你可以帮我总结一下文本工具吗 并附上对应工具的链接
以下是为您总结的一些文本工具及对应链接: Eleven Labs:https://elevenlabs.io/ 是一款功能强大且多功能的 AI 语音软件,能生成逼真、高品质的音频,可根据上下文调整表达方式。 Speechify:https://speechify.com/ 人工智能驱动的文本转语音工具,可在多种平台使用,能将文本转换为音频文件。 Azure AI Speech Studio:https://speech.microsoft.com/portal 提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义语音模型。 Voicemaker:https://voicemaker.in/ 可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 此外,还有以下相关工具: 2txt:Image to text 转换工具,利用 AI SDK 将图片内容转换为文字,不仅限于 OCR。体验地址和开源代码链接:https://x.com/imxiaohu/status/1780101723719393780 Rewind 公司推出的 Limitless 可穿戴 AI 设备,可记录全天对话,具有记忆功能并可互动。链接:https://x.com/imxiaohu/status/1780082354226438620 Jinaai/Reader:网页内容转换工具,将任何网页 URL 转换成对大语言模型友好的输入格式,支持文本流或 JSON 输出。链接:https://x.com/imxiaohu/status/1779838323512742220 OpenAI 在日本设立办事处,发布日语 GPT4 优化模型,新模型运行速度比 GPT4 Turbo 快 3 倍。链接:https://x.com/imxiaohu/status/1779762216264466617 清华大学开发的 Taichi 光子芯片,针对通用人工智能的亿级神经元光计算芯片,适用于自动驾驶、智能制造等高级任务。链接:https://x.com/imxiaohu/status/1779685276748845189 请注意,上述内容由 AI 大模型生成,请仔细甄别。
2025-03-05
我想时刻关注Deepseek目前在电商行业应用落地的场景的信息及对应的应用APP、小程序等,可以通过什么渠道第一时间获取
目前关于 Deepseek 在电商行业应用落地的场景信息以及对应的应用 APP、小程序等,您可以通过以下渠道第一时间获取: 1. 关注 Deepseek 官方网站的动态发布和通知。 2. 订阅 Deepseek 官方的社交媒体账号,如微信公众号、微博等,获取最新消息。 3. 加入相关的电商行业论坛或社区,与其他从业者交流,获取相关信息。 4. 关注电商行业的权威媒体和资讯平台,可能会有相关报道。
2025-02-26