Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

推荐可以OCR的AI

Answer

目前在 OCR（光学字符识别）领域，有一些表现出色的 AI 工具，例如百度 OCR、腾讯 OCR 等。这些工具通常具有较高的识别准确率和丰富的功能，可以满足不同场景下的 OCR 需求。

Content generated by AI large model, please carefully verify (powered by aily)

Others are asking

如何让企业微信可以接上 AI？让我的企业微信号变成一个 AI 客服

要让企业微信接上 AI 并变成一个 AI 客服，可以参考以下内容： 1. 基于 COW 框架的 ChatBot 实现方案：这是一个基于大模型搭建的 Chat 机器人框架，可以将多模型塞进微信（包括企业微信）里。张梦飞同学写了更适合小白的使用教程，链接为：。可以实现打造属于自己的 ChatBot，包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能，以及常用开源插件的安装应用。正式开始前需要知道：本实现思路需要接入大模型 API 的方式实现（API 单独付费）。风险与注意事项：微信端因为是非常规使用，会有封号危险，不建议主力微信号接入；只探讨操作步骤，请依法合规使用，大模型生成的内容注意甄别，确保所有操作均符合相关法律法规的要求，禁止将此操作用于任何非法目的，处理敏感或个人隐私数据时注意脱敏，以防任何可能的滥用或泄露。支持多平台接入，如微信、企业微信、公众号、飞书、钉钉等；多模型选择，如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等；多消息类型支持，能处理文本、语音和图片，以及基于自有知识库进行定制的企业智能客服功能；多部署方法，如本地运行、服务器运行、Docker 的方式。 2. DIN 配置：先配置 FastGpt、OneAPI，装上 AI 的大脑后，可体验知识库功能并与 AI 对话。新建应用，在知识库菜单新建知识库，上传文件或写入信息，最后将拥有知识库能力的 AI 助手接入微信。

围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中，AI 面临着巨大挑战，如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法，利用价值网络评估棋面优劣，策略网络选择最佳落子，且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练，达到蒙特卡洛树搜索水平，并将其与蒙特卡洛树搜索有机结合，取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步，也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外，神经网络在处理未知规则方面具有优势，虽然传统方法在处理象棋问题上可行，但对于围棋则困难重重，而神经网络专门应对此类未知规则情况。关于这部分内容，推荐阅读《这就是 ChatGPT》一书，其作者备受推崇，美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。

什么AI工具可以实现提取多个指定网页的更新内容

以下 AI 工具可以实现提取多个指定网页的更新内容： 1. Coze：支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容，可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时，输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序，标注要采集的内容，内容上传成功率高。 2. AI Share Card：能够一键解析各类网页内容，生成推荐文案，把分享链接转换为精美的二维码分享卡。通过用户浏览器，以浏览器插件形式本地提取网页内容。

以下是关于文字生成视频（文生视频）的相关信息：一些提供文生视频功能的产品： Pika：擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频。 Runway：老牌工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多相关网站可查看：https://www.waytoagi.com/category/38 。制作 5 秒单镜头文生视频的实操步骤（以梦 AI 为例）：进入平台：打开梦 AI 网站并登录，新用户有积分可免费体验。输入提示词：涵盖景别、主体、环境、光线、动作、运镜等描述。选择参数并点击生成：确认提示词无误后，选择模型、画面比例，点击「生成」按钮。预览与下载：生成完毕后预览视频，满意则下载保存，不理想可调整提示词再试。视频模型 Sora：OpenAI 发布的首款文生视频模型，能根据文字指令创造逼真且充满想象力的场景，可生成长达 1 分钟的一镜到底超长视频，视频中的人物和镜头具有惊人的一致性和稳定性。

以下是在钉钉上学 AI 的相关内容：从 AI 助教到智慧学伴的应用探索：登录钉钉客户端，在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后，填写 AI 助理信息，设置完成即可创建成功。 AI 领导力向阳乔木：未提及具体的在钉钉上学 AI 的操作方法。基于 COW 框架的 ChatBot 实现步骤：创建应用：进入，登录后点击创建应用，填写应用相关信息。点击添加应用能力，选择“机器人”能力并添加。配置机器人信息后点击发布，发布后点击“点击调试”，会自动创建测试群聊，可在客户端查看。点击版本管理与发布，创建新版本发布。项目配置：点击凭证与基础信息，获取 Client ID 和 Client Secret 两个参数。参考项目，将相关配置加入项目根目录的 config.json 文件，并设置 channel_type:"dingtalk"，注意运行前需安装依赖。点击事件订阅，点击已完成接入，验证连接通道，会显示连接接入成功。使用：与机器人私聊或将机器人拉入企业群中均可开启对话。

以下是一些常见的 AI 术语解释： Agents（智能体）：一个设置了一些目标或任务，可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同，Agent 拥有复杂的工作流程，模型本质上可以自我对话，无需人类驱动每一部分的交互。属于技术范畴。 ASI（人工超级智能）：尽管存在争议，但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention（注意力）：在神经网络的上下文中，有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias（偏差）：AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot（聊天机器人）：一种计算机程序，旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP（对比语言图像预训练）：由 OpenAI 开发的 AI 模型，用于连接图像和文本，使其能够理解和生成图像的描述。属于技术范畴。 TPU（张量处理单元）：谷歌开发的一种微处理器，专门用于加速机器学习工作负载。属于技术范畴。 Training Data（训练数据）：用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning（迁移学习）：机器学习中的一种方法，其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data（验证集）：机器学习中使用的数据集的子集，独立于训练数据集和测试数据集。用于调整模型的超参数（即架构，而不是权重）。属于技术范畴。 Knowledge Distillation（数据蒸馏）：数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集，使得在这一小数据集上训练出的模型，和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用，特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型，并能够促进模型的迁移学习和模型集成，提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG（检索增强生成）：检索增强生成。属于技术范畴。 Forward Propagation（前向传播）：在神经网络中，输入数据被馈送到网络并通过每一层（从输入层到隐藏层，最后到输出层）以产生输出的过程。网络对输入应用权重和偏差，并使用激活函数生成最终输出。属于技术范畴。 Foundation Model（基础模型）：在广泛数据上训练的大型 AI 模型，旨在适应特定任务。属于技术范畴。 GAN（通用对抗网络）：一种机器学习模型，用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗：一个“生成器”，创建新数据，另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI（生成式 AI）：AI 的一个分支，专注于创建模型，这些模型可以根据现有数据的模式和示例生成新的原创内容，例如图像、音乐或文本。属于通识范畴。 GPU（图形处理单元）：一种特殊类型的微处理器，主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。

COE团队需要什么AI能力，比如AI辅助编程；AI部署+和调优；AI智能体；AI提示词； OCR识别

COE 团队可能需要以下 AI 能力： 1. AI 辅助编程：虽然 AI CODING 目前适用于小场景和产品的第一个版本，但在复杂应用中可能存在需求理解错误导致产品出错的情况。 2. AI 部署和调优：涵盖服务器创建、搭建微信机器人到引入 coze API 的全过程，包括 Docker 部署、本地运行、RailWay 部署等多种方式。 3. AI 智能体：从最初只有对话框的 chatbot 到有更多交互方式，低代码或零代码的工作流等场景做得较好。例如以证件照为例，实现了相关智能体和交互。创建智能体工作流包括创建、编辑人设、编排设计等步骤。 4. AI 提示词：在编写系统提示词时需要用{{input}}作为参数引入，以使大模型知道需要生成与输入相关的结果。 5. OCR 识别：未提及相关具体内容。同时，在图像能力方面，支持图片生成、图片识别、图生图等，可选择 Dal3、stable diffusion、replicate、midjourney、CogView3、vision 模型。具有丰富插件，支持个性化插件扩展，已实现多角色切换、文字险、敏感词过滤、聊天记录总结、文档总结和对话、联网搜索等插件。通过上传知识库文件可自定义专属机器人，作为数字分身、智能客服、私域助手使用，基于 LinkAI 实现。

有哪些效果好的开源OCR模型值得推荐

以下是一些效果较好的开源 OCR 模型推荐： 1. Mistral OCR：当前最强的 OCR 模型，具有多语言支持，超越 Gemini 2.0 Flash，可在 Le Chat 及 API 调用。ElevenLabs 赠送 $25 Mistral API 额度，免费领取！领取地址： 2. Gemini 2.0 Flash：也是一款 OCR 模型。

OCR（Optical Character Recognition，光学字符识别）是一种将图像中的文字转换为计算机可处理的文本数据的技术。在移动端图片视觉处理中，特别是试卷拍照去除书写笔迹方面，OCR 有着重要的应用。以下是相关的处理方法： 1. 图像预处理：图像去噪：使用去噪算法（如高斯滤波、中值滤波）去除图像中的噪声。图像增强：通过增强算法（如直方图均衡化、对比度增强）提升图像的清晰度和对比度。 2. 图像分割：使用图像分割算法将试卷图像中的书写笔迹和背景分离。常用的分割算法包括阈值分割、边缘检测和基于区域的分割方法。 3. 文字检测：在分割后的图像中，使用文字检测算法（如基于深度学习的文本检测模型）识别出试卷上的文字区域。 4. 文字识别：对检测到的文字区域进行文字识别，将文字内容转换为计算机可处理的文本数据。常用的文字识别技术包括基于深度学习的端到端文本识别模型和传统的 OCR 技术。 5. 后处理：根据需求进行后处理，如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练（可选）：如有足够的数据，可以采用机器学习技术训练模型，通过学习样本中的书写笔迹特征来自动去除试卷上的笔迹。 7. 优化算法：对整个处理流程进行优化，提高处理速度和准确度。可以采用并行计算、硬件加速等方法提升算法的效率。 8. 移动端集成：将设计好的算法和模型集成到移动应用程序中，以实现试卷拍照去除书写笔迹的功能。可以使用移动端开发框架（如 iOS 的 Core ML、Android 的 TensorFlow Lite）来实现模型的部署和调用。当前最强的 OCR 模型如 Mistral OCR，具有多语言支持，超越 Gemini 2.0 Flash，可在 Le Chat&API 调用。ElevenLabs 赠送 $25 Mistral API 额度，免费领取！在一些项目中，如 0 基础跨界 AI 编程共学零基础手搓 AI 拍立得，也应用了 OCR 识别，对图片进行 OCR 识别以获取图片中的文本信息，并对识别结果进行调整和优化。

OCR 识别是指对图片进行光学字符识别，以获取图片中的文本信息。以下是关于 OCR 识别的一些相关内容：在拍立得工作流中，OCR 识别可对图片进行处理，获取文本信息，并对识别结果进行调整和优化。 GPT 在进行 OCR 识别时可能存在问题，如开启代码执行功能时会尝试用代码完成 OCR 导致无法正确识别图片文字。解决方案包括：如果是自定义 GPT，关闭 Code Interpreter；无法关闭时，提问时明确说明“不要执行代码，请用自身多模态能力识别文字”；直接使用 ChatGPT 而非 GPT。在移动端试卷拍照去除书写笔迹方面，OCR 识别可作为其中的一个环节。具体步骤包括图像预处理（去噪、增强）、图像分割、文字检测、文字识别、后处理等，还可以进行机器学习模型训练和算法优化，并将其集成到移动端应用程序中。

请罗列出你掌握的OCR技术以【方式名称+曾使用过自认最熟练的操作】的格式填写

以下是我掌握的 OCR 技术： OCR 识别：对图片进行 OCR 识别，获取图片中的文本信息，并对识别结果进行调整和优化。

文档自动化的技术方案： OCR+NLP pipeline指的是什么，个人具体怎么实施

OCR（Optical Character Recognition，光学字符识别）+NLP（Natural Language Processing，自然语言处理）pipeline 是一种将 OCR 技术和 NLP 技术相结合的文档自动化处理流程。 OCR 用于将文档中的图像或扫描的文字转换为可编辑的文本。 NLP 则对转换后的文本进行分析、理解和处理，例如提取关键信息、分类、情感分析等。对于个人实施 OCR + NLP pipeline，大致可以按照以下步骤进行： 1. 选择合适的 OCR 工具和服务：有许多开源和商业的 OCR 工具可供选择，根据您的需求和技术能力进行评估和选用。 2. 准备数据：收集和整理需要处理的文档，并确保其质量适合 OCR 处理。 3. 进行 OCR 处理：使用选定的 OCR 工具对文档进行转换。 4. 选择 NLP 框架和模型：根据具体的任务和需求，选择适合的 NLP 框架和预训练模型。 5. 数据预处理：对 OCR 输出的文本进行清洗、预处理，以便 NLP 模型能够更好地处理。 6. 训练和优化 NLP 模型（如果需要）：如果通用模型不能满足需求，可以使用标注数据进行训练和优化。 7. 集成和部署：将 OCR 和 NLP 部分集成在一起，并部署到实际应用环境中。需要注意的是，实施过程中可能会遇到一些技术挑战，例如文档格式的复杂性、OCR 识别的准确性、NLP 模型的适应性等，需要不断调试和优化。

trae 推荐安装那个版本的 vscode插件

在 Trae 中安装 VS Code 插件可以通过以下方式： 1. 从 Trae 的插件市场安装：在左侧导航栏中，点击插件市场图标，界面左侧显示插件市场面板。搜索您想要的插件并在未安装列表中将其选中，界面上显示该插件的详情窗口，展示该插件的详细说明、变更日志等信息。点击安装，Trae 开始安装该插件。安装完成后，该插件会出现在已安装列表中。 2. 从 VS Code 的插件市场安装：前往。搜索您想要的插件，例如：Pylance。在搜索结果中，点击您所需的插件，您会前往该插件的详情页。在详情页中，点击 Version History。结合插件页的 URL 和 Version History 中的信息，提取出以下信息（以 Pylance 为例）： itemName：URL Query 中的 itemName 字段，如截图中的 mspython.vscodepylance，并将小数点（.）前后的内容分成以下两个字段： fieldA：mspython fieldB：vscodepylance version：如截图中的 2025.1.102 使用提取出来的 3 个字段的值替换下方 URL 中的同名字段。在浏览器中输入修改后的 URL，然后按下回车键，浏览器开始下载该插件。下载完成后，返回 Trae 并打开插件市场。将下载的.vsix 文件拖拽至插件市场面板中，Trae 开始自动安装该插件。安装完成后，该插件会出现在已安装列表中。此外，如果 VS Code 插件市场中某个版本的插件依赖了新版 VS Code 中的某些接口，则可能会导致该插件与 Trae 不兼容。您可以查看该插件的 Version History，然后下载该插件的历史版本。管理插件还包括禁用插件和卸载插件： 1. 禁用插件：在 Trae 中，打开插件市场。在已安装列表中，找到需禁用的插件。鼠标悬浮至列表中的插件，然后点击设置>禁用。或点击该插件以打开其详情窗口，然后点击禁用。 2. 卸载插件：在 Trae 中，打开插件市场。在已安装列表中，找到需卸载的插件。鼠标悬浮至该插件，然后点击卸载。或点击该插件以打开其详情窗口，然后点击卸载。

我想找一个好用的ai绘画，有什么推荐吗

以下是为您推荐的一些好用的 AI 绘画平台： 1. Midjourney：综合体验较好，尤其是其 v6 版本。 2. 可灵 AI：成熟的综合类工具。 3. 即梦 AI：成熟的综合类工具。 4. Krea：集成平台。 5. MewXAI：操作简单，功能丰富，包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址：https://www.mewxai.cn/

推荐一些 AI 工具

以下是为您推荐的一些 AI 工具：辅助编程的 AI 工具： 1. GitHub Copilot：由 GitHub 联合 OpenAI 和微软 Azure 团队推出，支持多种语言和 IDE，能为程序员快速提供代码建议。 2. 通义灵码：阿里巴巴团队推出，提供多种编程相关能力。 3. CodeWhisperer：亚马逊 AWS 团队推出，由机器学习技术驱动，为开发人员实时提供代码建议。 4. CodeGeeX：智谱 AI 推出的开源免费 AI 编程助手，基于 130 亿参数的预训练大模型。 5. Cody：Sourcegraph 推出的 AI 代码编写助手，借助强大的代码语义索引和分析能力了解开发者的整个代码库。 6. CodeFuse：蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手。 7. Codeium：由 AI 驱动的编程助手工具，提高编程效率和准确性。更多辅助编程 AI 产品，还可以查看这里：https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同，您可根据需求选择。内容仿写的 AI 工具： 1. 秘塔写作猫：https://xiezuocat.com/ ，是 AI 写作伴侣，能推敲用语、斟酌文法、改写文风，还能实时同步翻译，支持全文改写等功能，并智能分析文章属性。 2. 笔灵 AI 写作：https://ibiling.cn/ ，是得力的智能写作助手，支持多种写作类型的一键改写/续写/扩写等。 3. 腾讯 Effidit 写作：https://effidit.qq.com/ ，由腾讯 AI Lab 开发的创作助手，提升写作者的写作效率和创作体验。更多 AI 写作类工具可以查看这里：https://www.waytoagi.com/sites/category/2 。内容由 AI 大模型生成，请仔细甄别。与思维导图相关的 AI 工具： 1. GitMind：免费跨平台，可通过 AI 自动生成思维导图，支持多种模式。 2. ProcessOn：国内思维导图+AIGC 的工具，能利用 AI 生成思维导图。 3. AmyMind：轻量级在线，无需注册登录，支持自动生成节点。 4. Xmind Copilot：Xmind 推出的基于 GPT 的 AI 思维导图助手，可一键拓展思路，生成文章大纲。 5. TreeMind：“AI 人工智能”思维导图工具，可输入需求由 AI 自动完成思维导图生成。 6. EdrawMind：提供一系列 AI 工具，包括 AI 驱动的头脑风暴功能。这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图，提高制作效率，为知识工作者带来便利。内容由 AI 大模型生成，请仔细甄别。

想要学习AIGC，推荐下相关的行业大V

以下是一些 AIGC 相关的行业大 V 推荐：：归臧整理的 AIGC 周刊，关注 AI 的朋友每周必读。：连续创业者，Prompt 版块共建者。。：“互联网的那点事”，微博互联网观察家。 ZHO：建筑师｜ComfyUI 设计师。：AIGC 社区野神殿创始人。。赛博禅心：最新最快的 AI 资讯，作者大聪明。张蔚：华兴资本经理，架构和投资版块共建者。：热爱分享，永远好奇，AI 高质量社群组织者。汗青：产品经理｜AI 设计师。此外，还有北京分队中的一些相关人士： Lucky：在信息技术领域公司任职 7 年+，目前担任江西 5 家公司企业级 information security 管理，3 个地区千万级企业级 confidentiality Project 管理，5 个地区上海、合肥、苏州、南京、深圳 information security 体系建设管理顾问，目前一只 20 人+AI 项目团队，终身学习践行者。能提供 AI 相关技术的所有项目，包括 AI 图片视频、2D 动画视频、AI prompt、AI 提示词企业培训、AI 大模型、AI agent、数字人等产品。坐标南昌。粉仔：目前抖音上的 AIGC 相关博主，粉丝画像特别受到中老年妇女们的喜爱，俨然成了她们的偶像。熟悉目前主流的 AIGC 工具。坐标北京。 sam：做技术行业，热爱互联网和 AI 技术。海地老师：AI 影视共创社北京分社的负责人。逍遥游的制片人和编剧。 Sunkim：自由体验设计师，前保利威设计负责人，先后在新浪、百度、脉脉做体验设计工作。对 AIGC 感兴趣，目前在做 AI 口语教育类产品（上线了），和 web3 相关设计，以及跟大伙学习 AI 视频制作。胡凯翔：国企工作 10 余年，后沉迷 AI 提示词研究编写，小七姐第一期课程毕业生，微软、讯飞认证提示词工程师，曾担任破局俱乐部企业培训和 AI+教育行动营教练，共创有约 10 万字 AI+教育手册，使用 AI 辅助阅读和开智，标书、论文的写作，玄学取名和头像设计，目前沉迷个人知识体系的搭建和离谱村系列视频的共创。陈皓/Robin：目前在家科技公司从事产品工作，主要和 Ai，3D 视觉内容+数字人相关；有过知识付费和海外教育的创业经历。

图生图网站排名推荐

以下是为您推荐的图生图网站排名： 1. 文生图： Imagen 3：真实感满分，指令遵从强。 Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。 Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。快手可图：影视场景能用，风格化较差。 Flux.1.1：真实感强，需要搭配 Lora 使用。文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。 Luma：影视感强，但风格单一，糊。美图奇想 5.0：AI 油腻感重。腾讯混元：AI 油腻感重，影视感弱，空间结构不准。 SD 3.5 Large：崩。 2. 图生视频： pd 2.0 pro：即梦生成的画面有点颗粒感，p2.0 模型还是很能打的，很适合做一些二次元动漫特效，理解能力更强，更适合连续运镜。 luma 1.6：画面质量挺好，但是太贵了。可灵 1.6 高品质：YYDS！海螺01live：文生视频比图生视频更有创意，图生也还可以，但是有时候大幅度动作下手部会出现模糊的情况，整体素质不错，就是太贵了。 runway：我的快乐老家，画面质量不算差，适合做一些超现实主义的特效、经特殊就容镜头的。智谱 2.0：做的一些画面特效挺出圈的，适合整过，但是整体镜头素质还差点，好处就是便宜，量大，管饱，还能给视频加音效。 vidu1.5：二维平面动画的快乐老家，适合做特效类镜头，单镜头也很惊艳，大范围运镜首尾帧 yyds!就是太贵了！！！！！ seaweed 2.0 pro：s2.0 适合动态相对小的，更适合环绕旋转运镜动作小的。 pixverse v3 高品质：pincerse 的首尾帧还是非常能打的，就是画面美学风格还有待提升的空间。 sora：不好用，文生视频挺强的，但是最需要的图生视频抽象镜头太多，半成品都算不上，避雷避雷避雷，浪费时间。 3. 小白也能使用的国内外 AI 生图网站：可灵可图 1.5：https://app.klingai.com/cn/texttoimage/new 通义万相（每日有免费额度）：https://tongyi.aliyun.com/wanxiang/creation 文心一言：https://yiyan.baidu.com/ 星流（每日有免费额度）：https://www.xingliu.art/ Libiblib（每日有免费额度但等待较久）：https://www.liblib.art/

现在比较好用的AI硬件工具推荐一下，比如鼠标，眼镜，耳机啥的

以下是为您推荐的一些 AI 硬件工具： 1. 对于将 Raspberry Pi 连接到其他设备的配件，您可以参考：防止过热的散热器 MicroUSB 转 USB 适配器，用于 Logitech 键盘的无线传感器用于显示器的 MiniHDMI 转 HDMI 适配器键盘和鼠标：推荐 2. 在可穿戴方面，以 GenAI 硬件为例，Meta 雷朋眼镜是具有代表性的产品。您还可以查看 GenAI 硬件榜单获取更多信息，比如：，该榜单包含多个分类，数据来源包括 google、tiktok、twitter、亚马逊等。