Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

国内哪个ai网站开源

Answer

国内像阿里、小川的百川等都在进行 AI 网站的开源。开源对于 AI 的发展具有重要意义，它能够集中力量办大事，促进不同公司、学校等在开源社区中共享知识和成果。例如，人工智能发展迅速就与开源密切相关。OpenAI 自身也是开源的受惠者，其用到的很多技术都源自 Google 的开源。我们国内应借鉴国外开源成果，积极加入大开源社区，在超级通用大模型问题上坚持开源，避免闭门造车、重复发明轮子。

Content generated by AI large model, please carefully verify (powered by aily)

References

周鸿祎免费课AI系列第一讲

最典型的是Google是不愿意开源的。我们国内像阿里，包括小川的百川都在开源。我之前说了一句话，在外网被人骂成狗了，我们跟国外的差距有的时候是一个方向上的差距，当然一旦把方向指定，一旦开源了，我们进步就很快。我这话没说错吧？开源不是抄袭，开源是集中力量办大事，不同公司，不同的学校，产学研用，大家一起在开源社区的团结下，大家充分的共享知识，共享成果。为什么人工智能发展这么快？跟开源脱不开关系。如果就是OpenAI一家闭源，很多知识出不来，它就实现了垄断，它的发展速度发展不了这么快。而且OpenAI自己就是开源的受惠者，它用到的很多技术都是Google开源的，每个人都踩着别人的成果不需要发明轮子，而且思想充分的交流，技术充分的交换，使得这两年，整个像寒武纪，生物大爆炸一样，整个的大模型为核心的开源成果层出不穷。所以，我认为我们国内第一步借鉴国外开源的成果。第二，要积极加入大开源社区。第三，我们不要再关起门来闭门造车，重新发明轮子了，在超级通用大模型问题上，要坚持开源。

Others are asking

如何让企业微信可以接上 AI？让我的企业微信号变成一个 AI 客服

要让企业微信接上 AI 并变成一个 AI 客服，可以参考以下内容： 1. 基于 COW 框架的 ChatBot 实现方案：这是一个基于大模型搭建的 Chat 机器人框架，可以将多模型塞进微信（包括企业微信）里。张梦飞同学写了更适合小白的使用教程，链接为：。可以实现打造属于自己的 ChatBot，包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能，以及常用开源插件的安装应用。正式开始前需要知道：本实现思路需要接入大模型 API 的方式实现（API 单独付费）。风险与注意事项：微信端因为是非常规使用，会有封号危险，不建议主力微信号接入；只探讨操作步骤，请依法合规使用，大模型生成的内容注意甄别，确保所有操作均符合相关法律法规的要求，禁止将此操作用于任何非法目的，处理敏感或个人隐私数据时注意脱敏，以防任何可能的滥用或泄露。支持多平台接入，如微信、企业微信、公众号、飞书、钉钉等；多模型选择，如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等；多消息类型支持，能处理文本、语音和图片，以及基于自有知识库进行定制的企业智能客服功能；多部署方法，如本地运行、服务器运行、Docker 的方式。 2. DIN 配置：先配置 FastGpt、OneAPI，装上 AI 的大脑后，可体验知识库功能并与 AI 对话。新建应用，在知识库菜单新建知识库，上传文件或写入信息，最后将拥有知识库能力的 AI 助手接入微信。

围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中，AI 面临着巨大挑战，如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法，利用价值网络评估棋面优劣，策略网络选择最佳落子，且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练，达到蒙特卡洛树搜索水平，并将其与蒙特卡洛树搜索有机结合，取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步，也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外，神经网络在处理未知规则方面具有优势，虽然传统方法在处理象棋问题上可行，但对于围棋则困难重重，而神经网络专门应对此类未知规则情况。关于这部分内容，推荐阅读《这就是 ChatGPT》一书，其作者备受推崇，美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。

什么AI工具可以实现提取多个指定网页的更新内容

以下 AI 工具可以实现提取多个指定网页的更新内容： 1. Coze：支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容，可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时，输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序，标注要采集的内容，内容上传成功率高。 2. AI Share Card：能够一键解析各类网页内容，生成推荐文案，把分享链接转换为精美的二维码分享卡。通过用户浏览器，以浏览器插件形式本地提取网页内容。

以下是关于文字生成视频（文生视频）的相关信息：一些提供文生视频功能的产品： Pika：擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频。 Runway：老牌工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多相关网站可查看：https://www.waytoagi.com/category/38 。制作 5 秒单镜头文生视频的实操步骤（以梦 AI 为例）：进入平台：打开梦 AI 网站并登录，新用户有积分可免费体验。输入提示词：涵盖景别、主体、环境、光线、动作、运镜等描述。选择参数并点击生成：确认提示词无误后，选择模型、画面比例，点击「生成」按钮。预览与下载：生成完毕后预览视频，满意则下载保存，不理想可调整提示词再试。视频模型 Sora：OpenAI 发布的首款文生视频模型，能根据文字指令创造逼真且充满想象力的场景，可生成长达 1 分钟的一镜到底超长视频，视频中的人物和镜头具有惊人的一致性和稳定性。

Ai在设备风控场景的落地

AI 在设备风控场景的落地可以从以下几个方面考虑：法律法规方面：《促进创新的人工智能监管方法》指出，AI 的发展带来了一系列新的安全风险，如对个人、组织和关键基础设施的风险。在设备风控中，需要关注法律框架是否能充分应对 AI 带来的风险，如数据隐私、公平性等问题。趋势研究方面：在制造业中，AI Agent 可用于生产决策、设备维护、供应链协调等。例如，在工业设备监控与预防性维护中，Agent 能通过监测传感器数据识别异常模式，提前通知检修，减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面，AI Agent 也能发挥重要作用，实现生产的无人化、决策的数据化和响应的实时化。

以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总： 4 月 11 日： Pika 上线 Pika Twists 能力，可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中，结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术，可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术，实现从单张图片快速生成超逼真的 3D 头像，在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage，通过图片生成可自由拼装 3D 场景，再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型，无缝支持各种视频生成任务（文本/图像/视频到视频）。 4 月 9 日： ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下，可生成完整的 1 分钟视频。 4 月 14 日：字节发布一款经济高效的视频生成基础模型 Seaweed7B。可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。

自动生成提示词的开源工具有哪些

以下是一些自动生成提示词的开源工具： 1. Freepik 推出的 Reimagine AI 工具：用户上传图片即可自动生成提示词，无需输入文字。它还能实时提供无限滚动结果展示，边操作边生成图像，通过调整提示词实时修改图片细节，并支持多种风格切换。相关链接：https://freepik.com/pikaso/reimagine 、https://x.com/imxiaohu/status/1770437135738581414?s=20 2. StreamMultiDiffusion 项目：使用区域文本提示实时生成图像，具有交互式操作体验，每个提示控制一个区域，实现精准图像生成。相关链接：https://arxiv.org/abs/2403.09055 、https://github.com/ironjr/StreamMultiDiffusion?tab=readmeovfile 、https://huggingface.co/spaces/ironjr/SemanticPalette 、https://x.com/imxiaohu/status/1770371036967850439?s=20 3. 【SD】自动写提示词脚本 One Button Prompt：可以在主菜单输入人物提示词，在“高级”中设置提示词混合，还具有一键运行放大的模块，包括完整的文生图放大和图生图放大，甚至可接入其他脚本和 controlnet。获取方式：添加公众号【白马与少年】，回复【SD】。

开源flux模型如何快速使用

以下是关于开源 Flux 模型快速使用的方法： 1. 模型的下载：如果因为环境问题，可以在网盘中下载。 siglipso400mpatch14384（视觉模型）：siglip 由 Google 开发的视觉特征提取模型，负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip，在地址栏输入 CMD 回车，打开命令行，输入下面的命令拉取模型（也可以在网盘里下载）。 image_adapter.pt（适配器）：连接视觉模型和语言模型，优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征，使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载，放到 models 的 Joy_caption 文件夹里，如果该文件夹不存在，就新建一个。 MetaLlama3.18Bbnb4bit（语言模型）：大型语言模型，负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM，地址栏输入 CMD 回车，在命令行里面输入下面命令。 2. 下载地址： ae.safetensors 和 flux1dev.safetensors 下载地址：https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。准备了夸克和百度的网盘链接，方便部分同学下载： flux 相关模型（体积较大）的夸克网盘链接：https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型（体积较大）的百度网盘链接：https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码：ub9h 。如果 GPU 性能不足、显存不够，底模可以使用 fp8 的量化版模型，速度会快很多，下载地址：https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载：最后我们再下载 dev 的工作流：。或者下面官方原版的图片链接，图片导入 comfyUI 就是工作流：https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI，把工作流或图片拖拽到 ComfyUI 里。

开源AI Agent软件有哪些

以下是一些开源的 AI Agent 软件： 1. AutoGPT 和 BabyAGI：在去年 GPT4 刚发布时风靡全球科技圈，给出了让 LLM 自己做自动化多步骤推理的解题思路。 2. Coze：新一代的一站式 AI Bot 开发平台，适用于构建基于 AI 模型的各类问答 Bot，集成了丰富的插件工具。 3. Mircosoft 的 Copilot Studio：主要功能包括外挂数据、定义流程、调用 API 和操作，以及将 Copilot 部署到各种渠道。 4. 文心智能体：百度推出的基于文心大模型的智能体（Agent）平台，支持开发者根据自身需求打造大模型时代的产品能力。 5. MindOS 的 Agent 平台：允许用户定义 Agent 的个性、动机、知识，以及访问第三方数据和服务或执行设计良好的工作流。 6. 斑头雁：2B 基于企业知识库构建专属 AI Agent 的平台，适用于客服、营销、销售等多种场景，提供多种成熟模板，功能强大且开箱即用。 7. 钉钉 AI 超级助理：依托于钉钉强大的场景和数据优势，在处理高频工作场景如销售、客服、行程安排等方面表现出色。此外，智谱·AI 开源的语言模型中也有与 Agent 相关的，如 AgentLM7B、AgentLM13B、AgentLM70B 等。

mcp 有什么开源的方案吗

Anthropic 于 2024 年 11 月推出并开源了 MCP（模型上下文协议）。MCP 就像一个“转接头”或“通用插座”，能统一不同的外部服务，如 Google Drive、GitHub、Slack、本地文件系统等，通过标准化接口与大语言模型对接。开发者基于 MCP 规范开发一次“接口适配器”（MCP 服务器），就能让所有兼容 MCP 的模型（MCP 客户端）无缝接入，无需针对每个模型单独适配，大幅提升兼容性与开发效率。MCP 里面还包含 SSE（ServerSent Events），是一种允许服务器向浏览器推送实时更新的技术。MCP 像为 AI 模型量身定制的“USBC 接口”，可以标准化地连接 AI 系统与各类外部工具和数据源。与传统 API 相比，MCP 是单一协议，只要一次整合就能连接多个服务；具有动态发现功能，AI 模型能自动识别并使用可用的工具；支持双向通信，模型不仅能查询数据，还能主动触发操作。相关链接：

帮我列举2025年3月1日以来，国内外、闭源开源模型厂商的更新记录。

以下是 2025 年 3 月 1 日以来，国内外、闭源开源模型厂商的部分更新记录： 2025 年 3 月 20 日，OpenAI 推出了一套全新的音频模型，旨在通过 API 为开发者提供更智能、更可定制的语音代理支持，包括改进的语音转文本和文本转语音功能，为语音交互应用带来显著提升。李开复公开表示 OpenAI 面临生存危机，商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能，开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点，资源限制反而促进了创新。李开复大胆预测，中国将出现三大 AI 玩家，竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》，指出 2022 2025 年经历多阶段发展，国内外模型差距缩小。测评显示 o3mini总分领先，国产模型表现亮眼，如 DeepSeekR1 等在部分能力上与国际领先模型相当，且小参数模型潜力大。性价比上，国产模型优势明显。DeepSeek 系列模型深度分析表明，其 R1 在多方面表现出色，蒸馏模型实用性高，不同第三方平台的联网搜索和稳定性有差异。以上信息来源包括：《》《》《》

现在Ai作图用什么？还是以前的Stable Diffusion吗？还是又出现了新的开源软件？

目前在 AI 作图领域，Stable Diffusion 仍然是常用的工具之一。Stable Diffusion 是 AI 绘画领域的核心模型，能够进行文生图和图生图等图像生成任务，其完全开源的特点使其能快速构建强大繁荣的上下游生态。除了 Stable Diffusion，也出现了一些新的相关开源软件和工具，例如：：Stability AI 开源的 AI 图像生成平台。：拥有超过 700 种经过测试的艺术风格，可快速搜索查找各类艺术家，并支持一键复制 Prompt。同时，市面上主流的 AI 绘图软件还有 Midjourney，其优势是操作简单方便，创作内容丰富，但需要科学上网并且付费。如果您想尝试使用 Stable Diffusion，可以参考 B 站【秋葉 aaaki】这个 Up 主的视频了解具体的安装方法。

AI相关的最前沿技术网站

以下是一些 AI 相关的前沿技术网站： 1. OpenAI：提供了诸如 GPT 等先进的语言模型和相关技术。 2. Google AI：涵盖了多种 AI 领域的研究成果和应用。 3. Microsoft Research：在 AI 方面有众多创新研究和技术展示。此外，WaytoAGI 也是一个致力于人工智能学习的中文知识库和社区平台，汇集了上千个人工智能网站和工具，提供最新的 AI 工具、应用、智能体和行业资讯。在没有任何推广的情况下，WaytoAGI 两年时间已有超过 300 万用户和超千万次的访问量，其目标是让每个人的学习过程少走弯路，让更多的人因 AI 而强大。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝等。

提示词网站

以下是为您精选的一些提示词网站：文本类 Prompt 网站： Learning Prompt：授人以渔，非常详尽的 Prompt 学习资源，包括 ChatGPT 和 MidJourney。网站地址： FlowGPT：国外做的最大的 prompt 站，内容超全面，更新快。网站地址： ChatGPT Shortcut：ChatGPT 提示词网站，提供了非常多使用模板，简单修改即可指定输出。网站地址： ClickPrompt：轻松查看、分享和一键运行模型，创建 Prompt 并与其他人分享。网站地址： Prompt Extend：让 AI 帮你自动拓展 Prompt。网站地址： PromptPerfect：帮你自动优化提示词，你可以看到优化前后的对比。网站地址： PromptKnit：The best playground for prompt designers。网站地址： PromptPort（支持中文）：AI Prompt 百科辞典，其中 prompts 是聚合了市场上大部分优质的 prompt 的词库，快速的寻找到用户需求 prompt。网站地址： Prompt Engineering Guide：GitHub 上点赞量非常高的提示工程指南，基于对大语言模型的浓厚兴趣，编写了这份全新的提示工程指南，介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。网站地址： LangChain Hub：提示词管理工具，LangChain 推出了 LangChain Hub，一个提示词上传、浏览、拉取和管理的工具。网站地址：微软 Prompt Flow：微软发布开源的 LLM 开发工具集 Prompt flow，它简化了基于 LLM 的人工智能应用程序的端到端开发周期，从构思、原型设计、测试、评估到生产部署和监控，对于简单工作流非常实用。网站地址：与 SD 相关的提示词网站： Majinai：词图： Black Lily： Danbooru 标签超市：魔咒百科词典： AI 词汇加速器： NovelAI 魔导书：鳖哲法典： Danbooru tag： AIBooru：

Deepseek自动生成网站前端页面

以下是关于 DeepSeek 自动生成网站前端页面的相关内容： DeepSeek v3 能力更新后虽能生成炫目的前端页面，但多为静态且实用性有限。可结合飞书多维表格将生成的漂亮前端变为真实的系统，如【智能作业分发系统】。该系统整体包括用户登陆（可加飞书调查表二维码实现注册）、作业类型、作业详情（含连连看游戏、AI 智能问答、考试系统）。其实现逻辑为用户登陆系统后进入页面看到老师分配的作业分类，选择分类进入作业详情页面，详情页有学习单词发音及三个模块。对于小白，可用飞书作数据源，通过飞书 API 接口获取内容，用 DeepSeek v3 制作前端+后端（用 Trae 更方便）。获取请求参数时，测试成功后的示例代码中有完整的请求参数和请求体可直接复制使用。创建前后端时，若用 DeepSeek 官网搭建需按代码目录结构创建对应文件（用 Trae 可省略），首次运行可能遇到飞书 API 未正确配置 CORS 导致浏览器拦截请求的问题，V3 会给出修改意见。此外，Same dev 能像素级复制任意 UI 界面并生成前端代码，支持多种文件格式和技术栈代码，但免费额度消耗快，网站被谷歌标记。360 智脑复现了 DeepSeek 强化学习效果并发布开源模型 LightR114BDS。 AI 时代生存法则：会提需求比会写代码更重要，会开脑洞比会复制粘贴更值钱，真正的大佬都是让 AI 当乙方！

图生图网站排名推荐

以下是为您推荐的图生图网站排名： 1. 文生图： Imagen 3：真实感满分，指令遵从强。 Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。 Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。快手可图：影视场景能用，风格化较差。 Flux.1.1：真实感强，需要搭配 Lora 使用。文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。 Luma：影视感强，但风格单一，糊。美图奇想 5.0：AI 油腻感重。腾讯混元：AI 油腻感重，影视感弱，空间结构不准。 SD 3.5 Large：崩。 2. 图生视频： pd 2.0 pro：即梦生成的画面有点颗粒感，p2.0 模型还是很能打的，很适合做一些二次元动漫特效，理解能力更强，更适合连续运镜。 luma 1.6：画面质量挺好，但是太贵了。可灵 1.6 高品质：YYDS！海螺01live：文生视频比图生视频更有创意，图生也还可以，但是有时候大幅度动作下手部会出现模糊的情况，整体素质不错，就是太贵了。 runway：我的快乐老家，画面质量不算差，适合做一些超现实主义的特效、经特殊就容镜头的。智谱 2.0：做的一些画面特效挺出圈的，适合整过，但是整体镜头素质还差点，好处就是便宜，量大，管饱，还能给视频加音效。 vidu1.5：二维平面动画的快乐老家，适合做特效类镜头，单镜头也很惊艳，大范围运镜首尾帧 yyds!就是太贵了！！！！！ seaweed 2.0 pro：s2.0 适合动态相对小的，更适合环绕旋转运镜动作小的。 pixverse v3 高品质：pincerse 的首尾帧还是非常能打的，就是画面美学风格还有待提升的空间。 sora：不好用，文生视频挺强的，但是最需要的图生视频抽象镜头太多，半成品都算不上，避雷避雷避雷，浪费时间。 3. 小白也能使用的国内外 AI 生图网站：可灵可图 1.5：https://app.klingai.com/cn/texttoimage/new 通义万相（每日有免费额度）：https://tongyi.aliyun.com/wanxiang/creation 文心一言：https://yiyan.baidu.com/ 星流（每日有免费额度）：https://www.xingliu.art/ Libiblib（每日有免费额度但等待较久）：https://www.liblib.art/

这个网站的作用是什么？是通过这个网站更好的使用训练AI吗？

WaytoAGI 网站具有以下功能： 1. 和 AI 知识库对话：您可以在此询问任何关于 AI 的问题。 2. AI 网站：集合了精选的 AI 网站，可按需求找到适合您的工具。 3. AI 提示词：集合了精选的提示词，能复制到 AI 对话网站使用。 4. 知识库精选：将每天知识库的精华内容呈现给大家。总之，WaytoAGI 网站和 WaytoAGI 知识库相互独立又有关联，希望成为您学习 AI 路上的好助手。

有没有免费制作数字人的网站？

以下是一些免费制作数字人的网站及使用方法： HEYGEN：优点：人物灵活，五官自然，视频生成很快。缺点：中文的人声选择较少。使用方法：点击网址注册后，进入数字人制作，选择Photo Avatar上传自己的照片。上传后效果如图所示，My Avatar处显示上传的照片。点开大图后，点击Create with AI Studio，进入数字人制作。写上视频文案并选择配音音色，也可以自行上传音频。最后点击Submit，就可以得到一段数字人视频。 DID：优点：制作简单，人物灵活。缺点：为了防止侵权，免费版下载后有水印。使用方法：点击上面的网址，点击右上角的Create vedio。选择人物形象，可以点击ADD添加照片，或者使用DID给出的人物形象。配音时，可以选择提供文字选择音色，或者直接上传一段音频。最后，点击Generate vedio就可以生成一段视频。打开自己生成的视频，可以下载或者直接分享给朋友。 KreadoAI：优点：免费（对于普通娱乐玩家很重要），功能齐全。缺点：音色很AI。使用方法：点击上面的网址，注册后获得120免费k币，这里选择“照片数字人口播”的功能。点击开始创作，选择自定义照片。配音时，可以选择提供文字选择音色，或者直接上传一段音频。打开绿幕按钮，点击背景，可以添加背景图。最后，点击生成视频。此外，在剪映中也可以生成数字人：在剪映右侧窗口顶部，打开“数字人”选项，选取一位免费的、适合的数字人形象，比如“婉婉青春”。选择数字人形象时，软件会播放声音，可判断是否需要，点击右下角的“添加数字人”，将其添加到当前视频中。软件会根据提供的内容生成对应音视频，并添加到当前视频文件的轨道中。左下角会提示渲染完成，可点击预览按钮查看效果。还可以为视频增加背景图片，删除先前导入的文本内容，点击左上角的“媒体”菜单并点击“导入”按钮，选择本地图片上传，将图片添加到视频轨道上，通过拖拽轨道右侧竖线使其与视频对齐。

国内好用的文档排版AI工具

以下是国内一些好用的文档排版 AI 工具： 1. Grammarly：不仅是语法和拼写检查工具，还提供排版功能，可改进文档整体风格和流畅性。 2. QuillBot：AI 驱动的写作和排版工具，能改进文本清晰度和流畅性，保持原意。 3. Latex：虽不是纯粹的 AI 工具，但在学术论文排版方面广泛使用，有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc：文档自动化平台，使用 AI 帮助创建、格式化和自动化文档生成，适合商业和技术文档。 5. Wordtune：AI 写作助手，重新表述和改进文本，使其更清晰专业，保持原始意图。 6. Overleaf：在线 Latex 编辑器，提供丰富模板和协作工具，适合学术写作和排版。选择合适的工具取决于您的具体需求，如文档类型、出版标准和个人偏好。对于学术论文，Latex 和 Overleaf 受欢迎；对于一般文章和商业文档，Grammarly 和 PandaDoc 等可能更适用。此外，还有一些与文档相关的 AI 工具，如文章润色工具： 1. Wordvice AI：集校对、改写转述和翻译等功能于一体，基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT：由 OpenAI 开发的大型语言模型，可用于多方面写作辅助。 3. Quillbot：人工智能文本摘要和改写工具，可用于快速筛选和改写文献资料。 4. HyperWrite：基于 AI 的写作助手和大纲生成器，帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune：AI 驱动的文本改写和润色工具，优化文章语言表达。 6. Smodin：提供 AI 驱动的论文撰写功能，可根据输入生成符合要求的学术论文。制作 PPT 的 AI 工具： 1. Gamma：在线 PPT 制作网站，通过输入文本和想法提示快速生成幻灯片，支持嵌入多媒体格式。 2. 美图 AI PPT：由美图秀秀开发团队推出，通过输入简单文本描述生成专业 PPT 设计，包含丰富模板库和设计元素。 3. Mindshow：AI 驱动的 PPT 辅助工具，提供自动布局、图像选择和文本优化等智能设计功能。 4. 讯飞智文：科大讯飞推出的 AI 辅助文档编辑工具，利用语音识别和自然语言处理技术优势，提供智能文本生成、语音输入、文档格式化等功能。请注意，以上内容由 AI 大模型生成，请仔细甄别。

目前国内各大ai有排名么

目前国内各大 AI 的排名情况如下：从用户规模、新增速度、用户活跃和用户粘性等角度进行数据统计，在 APP 端，截至 2024 年 10 月，共 56 款产品的历史下载量超百万，8 款产品历史下载量超千万，夸克和豆包的历史总下载量已过亿。夸克、豆包和 Kimi 智能助手月增长可达到千万级，DAU 方面，夸克 DAU 超过 2600 万，豆包、Kimi、天天跳绳和文小言 DAU 超百万；用户粘性方面，夸克和叨叨三日留存率超过 30%。在 Web 端，AI 智能助手赛道外的所有赛道都基本处于停滞状态。用户规模方面，月总访问量超千万的共 7 款产品，包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上，共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万，19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次，13 款产品平均访问时长超过 10 分钟。 “量子位智库 AI 100”通过综合 100 和原生 100 两张榜单提名了国内优秀的 AI 产品。需要注意的是，中国国内的大模型排名可能在短时间内会有变化。要获取最新的排名，您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。在通往 AGI 之路的知识库里，在会定期更新相关的排名报告，可以供您查阅。

目前国内各大ai有排名么

目前国内各大 AI 的排名情况如下：从用户规模、新增速度、用户活跃和用户粘性等角度进行数据统计，在 APP 端，截至 2024 年 10 月，共 56 款产品的历史下载量超百万，8 款产品历史下载量超千万，夸克和豆包的历史总下载量已过亿。夸克、豆包和 Kimi 智能助手月增长可达到千万级，DAU 方面，夸克 DAU 超过 2600 万，豆包、Kimi、天天跳绳和文小言 DAU 超百万；用户粘性方面，夸克和叨叨三日留存率超过 30%。在 Web 端，AI 智能助手赛道外的所有赛道都基本处于停滞状态。用户规模方面，月总访问量超千万的共 7 款产品，包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上，共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万，19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次，13 款产品平均访问时长超过 10 分钟。 “量子位智库 AI 100”通过综合 100 和原生 100 两张榜单提名了国内优秀的 AI 产品。需要注意的是，中国国内的大模型排名可能在短时间内会有变化。要获取最新的排名，您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。在通往 AGI 之路的知识库里，在会定期更新相关的排名报告，可以供您查阅。

准确的讲述垂直大模型的概念，国内外的应用现状、场景，发展趋势，最好能附带图片。内容尽量详细、逻辑通顺。

垂直大模型是专注于特定领域的大模型，例如小语种交流、临床医学、AI 蛋白质结构预测等。在国内，大模型分为通用模型如文心一言、讯飞星火等，处理自然语言；也有垂直模型专注特定领域。大模型因其强大的语言理解和生成能力，在多个领域和应用场景中表现出色。比较火的应用场景包括： 1. 文本生成和内容创作：撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手：提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助：代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信：促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘：为市场研究和产品改进提供数据支持。 6. 教育和学习辅助：创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成：如 DALLE 等模型可以根据文本描述生成相应的图像，甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验：创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询：理解和回答医疗相关的问题，提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询：帮助解读法律文件，提供合规建议，降低法律服务的门槛。关于发展趋势，尽管当前市场以基础大模型为主，但将大模型与行业专业知识结合，以满足不同行业的需求，成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出，如何将大模型与行业专业知识结合是重点。同时，在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。很抱歉，暂时无法为您提供相关图片。

在国内如何使用GPT-4O

在国内使用 GPT4 的方法如下：安卓系统： 1. 安装 Google Play：到小米自带的应用商店搜索 Google Play 进行安装，安装好后打开，按照提示一步步操作登录。 2. 下载安装 ChatGPT：到谷歌商店搜索“ChatGPT”进行下载安装（开发者是 OpenAI，别下错）。可能会遇到“google play 未在您所在的地区提供此应用”的问题，解决方法如下：在 google play 点按右上角的个人资料图标，依次点按：设置>常规>帐号和设备偏好设置>国家/地区和个人资料。在这里看到账号没有地区，可以“添加信用卡或借记卡”，国内的双币信用卡就行，填写信息时地区记得选美。如果回到 Google Play 首页还搜不到 ChatGPT，可以卸载重装 Google Play，操作过程保持梯子的 IP 一直是美，多试几次。 3. 体验 ChatGPT：如果只想体验 ChatGPT 3.5 版本，不升级 GPT4，直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本：先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡，然后在 ChatGPT 里订阅 Plus。苹果系统： 1. 在 Apple Store 下载 ChatGPT：中国区正常下载不了，需要切换到美区才可以下载。美区 Apple ID 注册教程参考如下知乎链接：。最终在 Apple Store 搜到 ChatGPT 结果如下，下载安装即可，注意别下错。 2. 支付宝购买苹果礼品卡充值订阅付费 App：打开支付宝，地区切换到【美区任意区】，往下滑，找到【品牌精选折扣礼品卡】，点击进去，可以看到【大牌礼品卡】，往下滑找到【App Store&iTunes US】礼品卡，按需要的金额购买即可，建议先买 20 刀。然后进行以下操作：支付宝购买礼品卡。在 apple store 中兑换礼品卡。在 chatgpt 中购买订阅 gpt plus，如果中途不想继续订阅了，可到订阅列表中取消订阅。完成上述步骤后，就可以开始使用 ChatGPT 4 了。需要注意的是，在国内使用相关服务可能存在法律风险和技术限制，请谨慎操作。

国内有什么好的音乐AI可以用即兴哼唱旋律去写歌

以下是国内一些可用即兴哼唱旋律写歌的音乐 AI 相关信息：《We Are The One》的创作思路：只有词和意向风格：先确定最核心情绪所在段落，用 AI 生成最佳结果，以此作为动机音轨扩展创作。只有词和一小段自己哼唱的旋律：上传哼唱旋律，让 AI 扩展出喜欢的风格，作为动机音轨继续创作。已有 midi 作曲：挂载音源导出，在 AI 帮助下丰满包含主歌、副歌等主要段落的核心音轨，然后继续扩展出其他段落完成全曲创作。已有简单录音小样：利用 REMIX 优化音质与编曲结构，利用 AI 尝试不同曲风版本，找到最喜欢的风格制作成核心音轨，进而完成全曲创作。 Suno 和 Udio 推出的上传音频文件生成音乐的功能：精确控制每首歌的速度（Tempo），无需背绕口的速度词，可精确控制想要的 BPM。控制旋律（Melody），通过自己制作简单旋律让 AI 补全并贯穿整首歌，实现旋律与速度的一谱变速，节省大量 Roll 旋律的时间。选择配器（Instrumentation），按想法选乐器，减少提示词中乐器不灵光的情况，也可选择特殊音色。进行合成（synthesizer），当有两支 BPM 相同、调性相同的音乐时，可尝试更多拆分组合和有趣效果。节省上传音频的点数消耗后，点数可用于：用提示词多 Roll 一些和流派、心情、场景相关的曲子，减少限制让 AI 音乐发挥更多创造力，把好旋律存起来作为制作素材；用于 roll 更多细节调整部分，如让某段曲子升调，提升作品品质。