知識ベースとの対話 - WayToAGI

「AGIへの道」飛書ナレッジベースへ直行 →

ホーム/すべての質問

2024年热门AI模型

以下是 2024 年的热门 AI 模型：在编码任务方面，DeepSeek 的 deepseekcoderv2 成为社区的最爱。阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。清华大学自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目，是可在设备上运行的小型参数模型。在图像视频领域，国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频，且在定制化方面进步显著，还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频，并保持三维一致性等。Google DeepMind 的 Veo 能将文本和图像提示与视频输入结合生成高分辨率视频。在生物医学领域，Profluent 的 CRISPRCas 图谱微调后生成功能性基因编辑器，如开源的 OpenCRISPR1。心智基础模型 BrainLM 基于功能性磁共振成像建立，能检测血氧变化等。在气象预测领域，微软创建的 Aurora 能预测大气化学，比数值模型更优且速度更快。获得诺贝尔物理学奖和化学奖的 AI 推动了机器学习理论创新，并揭示了蛋白质折叠问题。蛋白质结构预测方面，有 DeepMind 和 Isomorphic Labs 发布的 AlphaFold 3。 DeepMind 展示的新实验生物学能力 AlphaProteo 能设计出高亲和力的蛋白结合剂。 Meta 发布的 ESM3 是前沿多模态生成模型，在蛋白质序列、结构和功能上训练。学习设计人类基因组编辑器的语言模型——CRISPRCas 图谱。

数字人播报用什么软件好

以下是一些数字人播报软件的推荐及介绍： 1. HEYGEN：优点：人物灵活，五官自然，视频生成很快。缺点：中文的人声选择较少。使用方法：点击网址注册后，进入数字人制作，选择Photo Avatar上传自己的照片。上传后效果如图所示，My Avatar处显示上传的照片。点开大图后，点击Create with AI Studio，进入数字人制作。写上视频文案并选择配音音色，也可以自行上传音频。最后点击Submit，就可以得到一段数字人视频。 2. DID：优点：制作简单，人物灵活。缺点：为了防止侵权，免费版下载后有水印。使用方法：点击上面的网址，点击右上角的Create vedio。选择人物形象，可以点击ADD添加自己的照片，或者使用DID给出的人物形象。配音时，可以选择提供文字选择音色，或者直接上传一段音频。最后，点击Generate vedio就可以生成一段视频。打开自己生成的视频，可以下载或者直接分享给朋友。 3. KreadoAI：优点：免费（对于普通娱乐玩家很重要），功能齐全。缺点：音色很AI。使用方法：点击上面的网址，注册后获得120免费k币，这里选择“照片数字人口播”的功能。点击开始创作，选择自定义照片。配音时，可以选择提供文字选择音色，或者直接上传一段音频。打开绿幕按钮，点击背景，可以添加背景图。最后，点击生成视频。此外，还有关于数字人的一些案例和方案，如“爱的传承·数字母亲”节目使用了heygen工具，以及剪映数字人“私有化”的方案，可通过特定步骤和链接完成操作。有关数字人使用上的问题，欢迎交流。如果对数字人课程感兴趣，欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程。

新手小白入门AI

新手小白入门 AI 可以参考以下步骤： 1. 了解 AI 基本概念：建议阅读「」部分，熟悉 AI 的术语和基础概念，包括人工智能的主要分支（如机器学习、深度学习、自然语言处理等）以及它们之间的联系。浏览入门文章，了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅：在「」中，能找到为初学者设计的课程，特别推荐李宏毅老师的课程。通过在线教育平台（如 Coursera、edX、Udacity）上的课程，按照自己的节奏学习，并有机会获得证书。 3. 选择感兴趣的模块深入学习： AI 领域广泛，比如图像、音乐、视频等，可根据自己的兴趣选择特定的模块进行深入学习。掌握提示词的技巧，它上手容易且很有用。 4. 实践和尝试：理论学习之后，实践是巩固知识的关键，尝试使用各种产品做出作品。在知识库提供了很多大家实践后的作品、文章分享，欢迎实践后的分享。 5. 体验 AI 产品：与现有的 AI 产品进行互动，如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人，了解它们的工作原理和交互方式。 6. 持续学习和跟进： AI 是一个快速发展的领域，新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体，保持对最新发展的了解。考虑加入 AI 相关的社群和组织，参加研讨会、工作坊和会议，与其他 AI 爱好者和专业人士交流。此外，还推荐【野菩萨的 AIGC 资深课】，这门课程由工信部下属单位【人民邮电出版社】开设，是市面上为数不多的值得推荐的 AI 课程之一，也是全网技术更新最快的课程！课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识。无论您是 AI 初学者还是进阶者，这门课程都能满足您的学习需求。扫码添加菩萨老师助理，了解更多信息。

prompt 从入门到精通

以下是关于 prompt 从入门到精通的相关内容： Claude 在开箱即用时提供了高水平的基线性能，但 prompt 工程可以帮助进一步提升其性能并微调响应以适应特定用例。若要快速开始使用提示或了解提示概念，可参阅提示入门：https://docs.anthropic.com/claude/docs/introtoprompting 。小七姐提供的 Prompt 喂饭级系列教程小白学习指南（一）：对于新手学习 prompt，第一步要有一个大模型帐号并熟悉对话方式，如 ChatGPT4 或国产平替：。海螺 AI Prompt 教学入门认识海螺 AI ： MiniMax 视频模型能识别用户上传的图片，生成高度一致的视频，还能理解超出图片内容的文本并整合到视频生成中。只依靠模型综合能力就能实现顶级影视特效，用户可自由创作丰富多变的电影级视频。人物表情控制力强，5 秒钟内可实现多种表情变化。近期上线提示词优化功能，对无特殊要求的建议开启，专业创作者有 2000 字提示词空间。为达到更好表现效果，设计了两类 Prompt 的参考公式。总之，无论新手还是老手，通过清晰结构和灵活表达，都能掌握 Prompt 编写技巧，实现“一个人+一个 AI=一个专业剧组”的愿景。

以下是一些关于文字生成视频（文生视频）的相关信息：文字生成视频的 AI 产品： Pika：出色的文本生成视频 AI 工具，擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频，由 Stability AI 开源的 video model。 Runway：老牌 AI 视频生成工具，提供实时涂抹修改视频的功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格的视频。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多的文生视频网站可查看：https://www.waytoagi.com/category/38 。内容由 AI 大模型生成，请仔细甄别。 Sora 的相关信息：官方展示 Sora 的应用包括文生视频、图生视频、视频反推、视频编辑、视频融合等。其模型推理策略（做法不唯一）：文生视频：喂入 DiT 的是文本 embedding+全噪声 patch。视频编辑：类似 SDEdit 的做法，在视频上加点噪声（不全是噪声），然后逐步去噪。图生视频、视频反推、视频融合：喂入 DiT 的是文本 embedding（可选）+特定帧用给定图片的 embedding+其他帧用全噪声 patch。 PixVerse 提示词技巧（进阶篇）中的文生视频：文生视频是 AI 生成视频中最直接的方式，通过输入提示词让 PixVerse 生成视频。这种方式简单快速，但需要对提示词有深入了解，能准确描述画面内容。提示词的基本规则可参考：。为方便创作，提供了灵感分镜、风格选择等功能帮助更快掌握文生视频。

ai可以去马赛克吗

AI 可以在一定程度上去除马赛克或水印。目前市面上有一些相关工具，例如： 1. AVAide Watermark Remover：这是一个在线工具，使用 AI 技术从图片中去除水印。它支持多种图片格式，如 JPG、JPEG、PNG、GIF 等。操作简单，只需上传图片，选择水印区域，然后保存并下载处理后的图片即可。这个工具还提供了其他功能，如去除文本、对象、人物、日期和贴纸等。 2. Vmake：这个工具同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片，AI 会自动检测并移除图片上的水印。处理完成后，用户可以选择保存生成的文件。这个工具适合需要快速去除水印的用户，尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器：这个工具提供 AI 智能图片修复去水印的功能，可以一键去除图片中的多余物体、人物或水印，不留任何痕迹。支持直接粘贴图像或上传手机图像，操作简单方便。需要注意的是，这些工具各有特点，可以根据您的具体需求选择最适合您的去水印工具。同时，内容由 AI 大模型生成，请仔细甄别。

chatGPT 如何使用

以下是关于 ChatGPT 的使用方法： 1. 英文学习使用：把特定的 prompt 喂给 ChatGPT（建议开新对话专门用于学习英文）。 ChatGPT 会扮演美国好朋友，对输入的英文和中文表达返回更地道的表达，对俚语部分加粗，还会举一反三给出更多例子。输入特定语句，ChatGPT 会输出对话回顾并建议 3 个任务强化记忆。建议使用方式：开一个窗口复制 prompt，手机端打开历史记录，点右上角耳机图标打电话，既能练口语又能练听力，结束后看回顾帮助阅读。 2. 苹果系统安装、订阅 ChatGPT 4o：在 AppleStore 下载 ChatGPT：中国区正常下载不了，需切换到美区。美区 AppleID 注册教程参考知乎链接：https://zhuanlan.zhihu.com/p/696727277 。最终在 AppleStore 搜索下载安装，注意别下错。支付宝购买苹果礼品卡充值订阅付费 App：打开支付宝，地区切换到美区任意区，找到品牌精选折扣礼品卡，点击大牌礼品卡，下滑找到 App Store&iTunes US 礼品卡，按需购买，建议先买 20 刀。然后支付宝购买礼品卡，在 apple store 中兑换礼品卡，在 chatgpt 中购买订阅 gpt plus，中途不想订阅可在订阅列表中取消。 3. 使用 ChatGPT 4o：开启对话：打开 ChatGPT 应用或网页，点击开始对话。会员在苹果或安卓手机上购买的，电脑上都能登录。体验最新语音对话功能：版本切到 ChatGPT 4o，点击右下角“耳机?”图标，选择一个声音即可体验流畅的语音对话。

关于物流在人工智能配送方面的知识

在物流配送领域，人工智能有以下应用：优化物流路线和配送计划，降低运输成本。实现无人机送货，将货物快速送达偏远地区。例如：美团外卖配送系统利用数据分析和机器学习优化外卖小哥的配送路线，会根据订单位置、餐厅出餐速度等因素，在高峰期自动调整配送路线，确保外卖及时送达。猎聘 APP 作为 AI 招聘求职平台，利用数据分析和自然语言处理技术，连接求职者和招聘企业，促进就业。链家 APP 作为 AI 房地产交易平台，利用数据分析和自然语言处理，为买卖双方提供安全、高效的交易平台。游戏开发工具 Unity 利用图像生成和机器学习技术，为游戏开发者自动生成游戏关卡，提高开发效率。

国内有什么能用ai批量生成短视频的产品吗

以下是一些国内可用的能批量生成短视频的 AI 产品： 1. 扣子（Coze）：可以通过搭建工作流来直接生成文字和图片，实现批量生产。 2. Pika：出色的文本生成视频 AI 工具，擅长动画制作，并支持视频编辑。 3. SVD：如果熟悉 Stable Diffusion，可以安装其最新插件，在图片基础上直接生成视频。需要注意的是，不同的工具适合不同的使用场景和需求，您可以根据自身具体情况进行选择。更多的文生视频网站可查看：

免费的文本转音频

以下是一些免费的文本转音频工具和相关的人工智能音频初创公司：免费的文本转音频工具： Eleven Labs：https://elevenlabs.io/ ，是一款功能强大且多功能的 AI 语音软件，能高保真地呈现人类语调和语调变化，并能根据上下文调整表达方式。 Speechify：https://speechify.com/ ，是一款人工智能驱动的文本转语音工具，可作为多种应用程序使用，用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio：https://speech.microsoft.com/portal ，提供了支持 100 多种语言和方言的语音转文本和文本转语音功能，还提供了自定义的语音模型。 Voicemaker：https://voicemaker.in/ ，可将文本转换为各种区域语言的语音，并允许创建自定义语音模型。人工智能音频初创公司：，将书面内容转化为引人入胜的音频，并实现无缝分发。，提供专业音频、语音、声音和音乐的扩展服务。（被 Spotify 收购），提供完全表达的 AI 生成语音，带来引人入胜的逼真表演。，利用合成媒体生成和检测，带来无限可能。，一键使您的内容多语言化，触及更多人群。，生成听起来真实的 AI 声音。，为游戏、电影和元宇宙提供 AI 语音演员。，为内容创作者提供语音克隆服务。，超逼真的文本转语音引擎。，使用单一 AI 驱动的 API 进行音频转录和理解。，听起来像真人的新声音。，从真实人的声音创建逼真的合成语音的文本转语音技术。，生成听起来完全像你的音频内容。请注意，以上内容由 AI 大模型生成，请仔细甄别。