Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

我需要一份可以搜索并加以应用的文字类AI

Answer

目前文字类的 AI 应用有很多，比如 ChatGPT ，它能够生成自然语言文本，回答各种问题，并进行对话。还有百度的文心一言，能够提供丰富的文字创作和信息搜索服务。您可以根据自己的需求选择适合的文字类 AI 并加以应用。

Content generated by AI large model, please carefully verify (powered by aily)

Others are asking

如何让企业微信可以接上 AI？让我的企业微信号变成一个 AI 客服

要让企业微信接上 AI 并变成一个 AI 客服，可以参考以下内容： 1. 基于 COW 框架的 ChatBot 实现方案：这是一个基于大模型搭建的 Chat 机器人框架，可以将多模型塞进微信（包括企业微信）里。张梦飞同学写了更适合小白的使用教程，链接为：。可以实现打造属于自己的 ChatBot，包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能，以及常用开源插件的安装应用。正式开始前需要知道：本实现思路需要接入大模型 API 的方式实现（API 单独付费）。风险与注意事项：微信端因为是非常规使用，会有封号危险，不建议主力微信号接入；只探讨操作步骤，请依法合规使用，大模型生成的内容注意甄别，确保所有操作均符合相关法律法规的要求，禁止将此操作用于任何非法目的，处理敏感或个人隐私数据时注意脱敏，以防任何可能的滥用或泄露。支持多平台接入，如微信、企业微信、公众号、飞书、钉钉等；多模型选择，如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等；多消息类型支持，能处理文本、语音和图片，以及基于自有知识库进行定制的企业智能客服功能；多部署方法，如本地运行、服务器运行、Docker 的方式。 2. DIN 配置：先配置 FastGpt、OneAPI，装上 AI 的大脑后，可体验知识库功能并与 AI 对话。新建应用，在知识库菜单新建知识库，上传文件或写入信息，最后将拥有知识库能力的 AI 助手接入微信。

围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中，AI 面临着巨大挑战，如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法，利用价值网络评估棋面优劣，策略网络选择最佳落子，且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练，达到蒙特卡洛树搜索水平，并将其与蒙特卡洛树搜索有机结合，取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步，也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外，神经网络在处理未知规则方面具有优势，虽然传统方法在处理象棋问题上可行，但对于围棋则困难重重，而神经网络专门应对此类未知规则情况。关于这部分内容，推荐阅读《这就是 ChatGPT》一书，其作者备受推崇，美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。

什么AI工具可以实现提取多个指定网页的更新内容

以下 AI 工具可以实现提取多个指定网页的更新内容： 1. Coze：支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容，可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时，输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序，标注要采集的内容，内容上传成功率高。 2. AI Share Card：能够一键解析各类网页内容，生成推荐文案，把分享链接转换为精美的二维码分享卡。通过用户浏览器，以浏览器插件形式本地提取网页内容。

以下是关于文字生成视频（文生视频）的相关信息：一些提供文生视频功能的产品： Pika：擅长动画制作，支持视频编辑。 SVD：Stable Diffusion 的插件，可在图片基础上生成视频。 Runway：老牌工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多相关网站可查看：https://www.waytoagi.com/category/38 。制作 5 秒单镜头文生视频的实操步骤（以梦 AI 为例）：进入平台：打开梦 AI 网站并登录，新用户有积分可免费体验。输入提示词：涵盖景别、主体、环境、光线、动作、运镜等描述。选择参数并点击生成：确认提示词无误后，选择模型、画面比例，点击「生成」按钮。预览与下载：生成完毕后预览视频，满意则下载保存，不理想可调整提示词再试。视频模型 Sora：OpenAI 发布的首款文生视频模型，能根据文字指令创造逼真且充满想象力的场景，可生成长达 1 分钟的一镜到底超长视频，视频中的人物和镜头具有惊人的一致性和稳定性。

Ai在设备风控场景的落地

AI 在设备风控场景的落地可以从以下几个方面考虑：法律法规方面：《促进创新的人工智能监管方法》指出，AI 的发展带来了一系列新的安全风险，如对个人、组织和关键基础设施的风险。在设备风控中，需要关注法律框架是否能充分应对 AI 带来的风险，如数据隐私、公平性等问题。趋势研究方面：在制造业中，AI Agent 可用于生产决策、设备维护、供应链协调等。例如，在工业设备监控与预防性维护中，Agent 能通过监测传感器数据识别异常模式，提前通知检修，减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面，AI Agent 也能发挥重要作用，实现生产的无人化、决策的数据化和响应的实时化。

以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总： 4 月 11 日： Pika 上线 Pika Twists 能力，可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中，结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术，可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术，实现从单张图片快速生成超逼真的 3D 头像，在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage，通过图片生成可自由拼装 3D 场景，再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型，无缝支持各种视频生成任务（文本/图像/视频到视频）。 4 月 9 日： ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下，可生成完整的 1 分钟视频。 4 月 14 日：字节发布一款经济高效的视频生成基础模型 Seaweed7B。可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。

我想做一个，基于我个人知识库的chatbot，以供我随时搜索和提问，且优先搜索知识库内的内容而非联网搜索，你有什么建议吗？

以下是为您提供的关于创建基于个人知识库的 chatbot 的建议： 1. 选择合适的平台和工具：例如可以考虑使用飞书智能伙伴创建平台（Aily）或扣子（https://www.coze.cn/home）等。 2. 数据分段储存：由于大模型的上下文长度有限制，需要将上传的资料根据特定符号或字符长度进行分段，如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索：当用户输入问题，大模型会根据相似度检索出若干最相关的数据片段，再据此生成答案，这一技术称为 RAG（检索增强生成）。 4. 配置知识库：在 Bot 内使用知识库：登录相关平台。在左侧导航栏的工作区区域，选择进入指定团队。在 Bots 页面，选择指定 Bot 并进入 Bot 详情页。在 Bot 编排页面的知识库区域，单击加号图标，添加指定的知识库。（可选）添加知识库后，可以在自动调用下拉界面内，调整知识库的配置项，如最大召回数量、最小匹配度、调用方式等。在工作流内使用 Knowledge 节点：登录相关平台。在左侧导航栏的工作区区域，选择进入指定团队。在页面顶部进入工作流页面，并打开指定的工作流。在左侧基础节点列表内，选择添加 Knowledge 节点。 5. 注意使用限制：单用户最多创建 1000 个知识库，文本类型知识库下最多支持添加 100 个文档，单用户每月最多新增 2GB 数据，累计上限是 10GB。此外，知识库可以解决大模型幻觉、专业领域知识不足的问题，提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复，也可以在工作流中添加知识库节点，成为工作流中的一环。

DeepSeek，里面搜索怎么能出来图片？

要在 DeepSeek 中搜索出图片，您可以参考以下信息：在即梦 AI 平台上找到 DeepSeek 入口，简单描述您想要的画面，DeepSeek 会生成详细的提示词，将提示词复制到生图功能的输入框，选择 3.0 模型，点击生成。 DeepSeek 使用平台包括 DeepSeek 官网、API（V3 需要为 0324 更新的版本，DS 官网及 API 已更新，如调用其它平台 API 需要查看 DS 版本号）。Deepseek 需要复制代码到 html 文件里，然后保存进行查看。将下载的 html 文件及图片放到同一个文件夹，让 Cursor 进行图片增加即可。此外，DeepSeek 深夜发布了大一统模型 JanusPro，将图像理解和生成统一在一个模型中。其具有统一 Transformer 架构，提供 1B 和 7B 两种规模，全面开源，支持商用，MIT 协议，部署使用便捷，Benchmark 表现优异等特点。模型地址：模型（7B）：https://huggingface.co/deepseekai/JanusPro7B 模型（1B）：https://huggingface.co/deepseekai/JanusPro1B 下载地址：https://github.com/deepseekai/Janus

ai搜索引擎哪个好

以下是一些推荐的 AI 搜索引擎： 1. 秘塔 AI 搜索：由秘塔科技开发，具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能，能提升用户搜索效率和体验。 2. Perplexity：聊天机器人式搜索引擎，允许用自然语言提问，通过生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索：360 公司推出，通过 AI 分析问题，生成清晰有理的答案，支持增强模式和智能排序。 4. 天工 AI 搜索：昆仑万维推出，采用生成式搜索技术，支持自然语言交互和深度追问，未来将支持图像、语音等多模态搜索。 5. Flowith：创新的 AI 交互式搜索和对话工具，基于节点式交互方式，支持多种 AI 模型和图像生成技术，有插件系统和社区功能。 6. Devv：面向程序员的 AI 搜索引擎，专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind：专为开发者设计，利用大型语言模型提供相关搜索结果和动态答案，擅长处理编程和技术问题。做好 AI 搜索引擎的关键在于： 1. 准确度：取决于问答底座模型的智能程度和挂载上下文的信息密度。要选用智能的问答底座模型，并对 RAG 的检索结果进行排序去重以保证信息密度。 2. 差异化创新：错位竞争，如对问答结果以 outline/timeline 等形式输出，支持多模态搜索问答，允许挂载自定义信息源等策略。 3. 具备“准/快/稳”的特点：回复结果要准，响应速度要快，服务稳定性要高。在使用 AI 搜索引擎时需注意： 1. 幻觉风险较高，大多数 AI 搜索引擎未连接到互联网。 2. 必应通常是较好的选择，特别是在某些特定场景下，如技术支持、决定吃饭地点或获取建议等，必应可能比谷歌更好。但这是一个迅速发展的领域，使用时应小心。对于儿童，可汗学院的 Khanmigo 提供由 GPT4 驱动的良好的人工智能驱动辅导。

我们是搜索团队的产品经理，团队定位倾向于“对于插件的建设与调用”定位，现在要做AI相关的产品规划，请以通俗易懂的方式对以下问题做出回答 1、请通过流程图的方式，介绍【插件/工具】能力在大模型生态架构中的环节、定位、实现流程是什么 2、调研下对于我们搜索团队而言，插件应该做什么，可以做什么 3、思考对于大模型来说，有哪些（通用或垂类）的模块/功能/插件是无法绕开的，或高频使用的，作为我们团队后续争取的发力点（如搜索推荐对于传统综合搜索结果页）

以下是为您提供的关于 AI 相关产品规划的回答：一、插件/工具能力在大模型生态架构中的环节、定位、实现流程从 2023 年 3 月份 OpenAI 宣布插件计划开始，到 5 月份上线，其中包括联网、代码、画图三个插件。其实现流程大致为： 1. 经过对模型的微调，检测何时需要调用函数（取决于用户的输入）。 2. 使用符合函数签名的 JSON 进行响应。 3. 在接口层面声明可调用的工具。 4. 使用函数和用户输入调用模型。 5. 使用模型响应调用 API。 6. 将响应发送回模型进行汇总。二、对于搜索团队，插件可以做和应该做的事目前没有直接针对搜索团队插件具体可做和应做事项的明确内容，但可以参考 OpenAI 的插件计划，例如开发与搜索相关的特定功能插件，或者探索如何将现有的搜索推荐功能与大模型更好地结合。三、对于大模型无法绕开或高频使用的模块/功能/插件目前没有直接指出对于大模型无法绕开或高频使用的具体模块、功能或插件。但从相关信息中可以推测，例如与数据获取和处理相关的插件（如联网）、与技术开发相关的插件（如代码）以及与内容生成相关的插件（如画图）可能是较为重要和高频使用的。对于搜索团队来说，可以考虑在这些方向上寻找发力点，结合搜索推荐等传统功能，开发出更具竞争力的插件。

小白不懂MCP，请搜索waytoAGI中与智能体相关的内容（特别是视频形式的）让我来学习

以下是为您整理的关于 MCP 的相关内容：一、什么是 MCP MCP（Model Context Protocol）是一种通用的方式，向各类大语言模型提供数据源和工具。它是一个开放协议，用于标准化应用程序向大语言模型提供上下文的方式。可以将 MCP 想象成 AI 应用程序的 USBC 接口，为 AI 模型连接不同的数据源和工具提供了标准化方式。二、相关文章的写作目的和探讨内容 1. 作者因在 WaytoAGI 社区阅读了他人优秀文章，决定逼自己做输出，对自我学习进行总结。 2. 文章从作者自身疑问出发，通过动手实践的方式探索：利用自然语言交互，大模型为什么会调用 MCP 工具；大模型调用 MCP 工具，从客户端到服务端发生了什么；安装了类似 MCP 工具，大模型如何选择用哪一个。三、MCP 和 AI 工具的未来自 OpenAI 发布函数调用以来，思考解锁智能体和工具使用生态系统所需条件。MCP 于 2024 年 11 月推出，在开发者和 AI 社区中已获广泛关注，被视为潜在解决方案。探讨了其如何改变 AI 与工具的交互方式、开发人员的使用情况及仍需解决的挑战。四、MCP 小白图文使用教程 MCP 服务器有三大核心功能： 1. 资源：是服务器提供给 AI 的数据内容，如文件、数据库结构或特定信息，每个资源通过唯一 URI 标识。 2. 工具：允许 AI 模型执行特定操作，如查询数据库、调用 API 或执行计算，每个工具由名称和描述其模式的元数据唯一标识。 3. 提示：提供结构化消息和指令，用于与语言模型交互，客户端可以发现可用提示、检索其内容并提供参数进行自定义。希望以上内容对您有所帮助。

如何搜索知识库

以下是关于知识库搜索的相关信息：知识库搜索网址：https://search.atomecho.cn/ Coze 中工作流配置知识库：添加知识库：可同时添加多个知识库。参数设置：搜索策略：包括语义检索（像人类一样理解词与词、句与句之间的关系，适用于需要理解语义关联度和跨语言查询的场景）、全文检索（基于关键词进行，适用于特定名称、专有名词、术语、缩写词、ID 等场景）、混合检索（结合全文检索和语义检索的优势，并对结果进行综合排序召回相关内容片段）。最大召回数量：选择从检索结果中返回给大模型使用的内容片段数量，数值越大，返回的越多。最小匹配度：根据设置的匹配度选取要返回给大模型的内容片段，低于设定匹配度的内容不会被返回。提示：最大召回数量和最小匹配度直接影响输出效果，需进行协调的多轮测试找出最优值。认识大模型 Embedding 技术加实战中： Embedding 增强 GPT 的能力的过程包括搜索内部知识库检索相关文本、将检索到的文本内容部分发送给 GPT 大模型并向其提出问题。具体操作步骤：准备搜索数据（仅一次）：搜集数据、切块、嵌入、存储（对于大型数据集的 Embedding 结果，可使用向量数据库保存）。搜索（每次查询一次）：给定用户问题，从 OpenAI API 生成查询的 embeddings，使用 embeddings 按照与查询相关性对文本部分进行排序，距离函数推荐使用余弦相似性。提问（每次查询一次）：将问题和最相关的部分插入到发送给 GPT 的消息中返回 GPT 的答案。 Embedding 的作用：搜索（结果按与查询字符串的相关性进行排名）、聚类（文本字符串按相似性分组）、建议（建议包含相关文本字符串的项目）、异常检测（识别出相关性很小的离群值）、多样性测量（分析相似性分布）、分类（文本字符串按其最相似的标签分类）。

图片提取文字

以下是关于图片提取文字的相关信息：大模型招投标文件关键数据提取方案：输入模块设计用于处理各种格式的文档输入，包括 PDF、Word、Excel、网页等，转换成可解析的结构化文本。多种文件格式支持，对于图片，可以借助 OCR 工具进行文本提取，如开放平台工具：。网页可以使用网页爬虫工具抓取网页中的文本和表格数据。谷歌 Gemini 多模态提示词培训课：多模态技术可以从图像中提取文本，使从表情包或文档扫描中提取文本成为可能。还能理解图像或视频中发生的事情，识别物体、场景，甚至情绪。 0 基础手搓 AI 拍立得：实现工作流包括上传输入图片、理解图片信息并提取图片中的文本内容信息、场景提示词优化/图像风格化处理、返回文本/图像结果。零代码版本选择 Coze 平台，主要步骤包括上传图片将本地图片转换为在线 OSS 存储的 URL 以便调用，以及插件封装将图片理解大模型和图片 OCR 封装为工作流插件。

文字转语音

以下是关于文字转语音的相关内容： DubbingX2.0.3：界面与国内版相同，使用了沉浸式翻译功能，可能看起来较乱。第一个选项是文字转语音，与国内版相同，不做重复演示。重点介绍第二项“创建您的语音克隆”：上传语音（想克隆的声音原始文件）。给声音命名，方便以后配音选择。选择语言。勾选相关选项，点击转变即可生成。注意：原音频若有背景音乐，最好在剪影中去除，以使生成的音色模型效果更好、更纯净。 Hedra：可以直接文字转语音，目前有 6 个语音。也可以直接上传音频。

图片文字转文档

图片文字转文档可以通过以下方式实现： coze 插件中的 OCR 插件：插件名称：OCR 插件分类：实用工具 API 参数：Image2text，图片的 url 地址必填用途：包括文档数字化、数据录入、图像检索、自动翻译、文字提取、自动化流程、历史文献数字化等。例如将纸质文档转换为可编辑的电子文档，自动识别表单、票据等中的信息，通过识别图像中的文字进行搜索和分类，识别文字后进行翻译，从图像中提取有用的文字信息，集成到其他系统中实现自动化处理，保护和传承文化遗产。插件的使用技巧：暂未提及。调用指令：暂未提及。 PailidoAI 拍立得（开源代码）：逻辑：用户上传图片后，大模型根据所选场景生成相关的文字描述或解说文本。核心：包括图片内容识别，大模型需要准确识别图片中的物体、场景、文字等信息；高质量文本生成，根据图片生成的文字不仅需要准确，还需符合专业领域的要求，保证文字的逻辑性、清晰性与可读性。场景应用：产品文档生成（电商/零售）：企业可以利用该功能将商品的图片（如电器、服饰、化妆品等）上传到系统后，自动生成商品的详细描述、规格和卖点总结，提高电商平台和零售商的商品上架效率，减少人工编写文案的工作量。社交媒体内容生成（品牌营销）：企业可使用图片转文本功能，帮助生成社交媒体平台的营销文案。通过上传产品展示图片或品牌活动图片，模型可自动生成具有吸引力的宣传文案，直接用于社交媒体发布，提高营销效率。法律文件自动生成（法律行业）：法律行业可以使用图片转文本技术，自动提取合同、证据材料等图片中的文本信息，生成法律文件摘要，辅助律师快速进行案件分析。

如何去除图片中的文字内容

以下是去除图片中文字内容的方法： 1. 图像预处理：图像去噪：使用去噪算法（如高斯滤波、中值滤波）去除图像中的噪声。图像增强：通过增强算法（如直方图均衡化、对比度增强）提升图像的清晰度和对比度。 2. 图像分割：使用图像分割算法将图片中的文字和背景分离。常用的分割算法包括阈值分割、边缘检测和基于区域的分割方法。 3. 文字检测：在分割后的图像中，使用文字检测算法（如基于深度学习的文本检测模型）识别出文字区域。 4. 文字识别：对检测到的文字区域进行文字识别，将文字内容转换为计算机可处理的文本数据。常用的文字识别技术包括基于深度学习的端到端文本识别模型和传统的 OCR（Optical Character Recognition）技术。 5. 后处理：根据需求进行后处理，如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练（可选）：如有足够的数据，可以采用机器学习技术训练模型，通过学习样本中的文字特征来自动去除图片上的文字。 7. 优化算法：对整个处理流程进行优化，提高处理速度和准确度。可以采用并行计算、硬件加速等方法提升算法的效率。 8. 移动端集成：将设计好的算法和模型集成到移动应用程序中，以实现去除图片文字的功能。可以使用移动端开发框架（如 iOS 的 Core ML、Android 的 TensorFlow Lite）来实现模型的部署和调用。此外，像 Gemini 2.0 Flash 等工具也可以通过自然语言指令来去除图片中的文字，指令如“去掉 XXX”。DALL·E 也能实现去掉图片中的错误文字等操作。

搭建链接转文字的智能体

搭建链接转文字的智能体可以参考以下步骤： 1. 创建一个智能体，输入人设等信息，并放上相关工作流。 2. 配置完成后进行测试。但注意工作流中【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token，为避免他人调用消耗您的费用，您可以将 api_token 作为工作流最开始的输入，让用户购买后输入使用，然后再发布。 3. 在阿里云百炼平台中，Deepseek R1 模型无需部署可直接使用。使用该模型需要解锁和授权，若没有授权按钮需对阿里云进行实名认证，可通过支付宝扫码或在右上角头像处进行，共学群里有相关指引。 4. 新建智能体应用时，可选择模型并调整参数，如回复字数限制和携带上下文轮数等。 5. 对于模型的连接，可通过模型广场的 API 调用示例获取链接，截断后粘贴到 Chat Box 的设置中，添加自定义提供方，设置模型名称为 Deepseek R1，并获取 API key。还可重置 API key 以方便本地软件连接。

文字生成故事视频

以下是关于文字生成故事视频的相关信息： Sora 具有文字生成视频的功能，时长可达 60 秒，还能进行图片生成视频、扩展视频等操作。案例中有把学生写的函数小故事变成动画视频，如深圳福田区梅山中学梁玉老师使用百度文库的 AI 有声画本导入故事生成。将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等步骤。可利用的工具及网址有： Stable Diffusion（SD）：一种 AI 图像生成模型，网址： Midjourney（MJ）：另一个 AI 图像生成工具，网址： Adobe Firefly：Adobe 的 AI 创意工具，网址： Pika AI：文本生成视频的 AI 工具，网址： Clipfly：一站式 AI 视频生成和剪辑平台，网址： VEED.IO：在线视频编辑工具，具有 AI 视频生成器功能，网址：极虎漫剪：结合 Stable Diffusion 技术的小说推文视频创作提效工具，网址：故事 AI 绘图：小说转视频的 AI 工具，网址：

用deepseek写一份课题申报书，请提供相关指令

以下是一些用 DeepSeek 写课题申报书的相关指令和要点： 1. 思维链引导：分步标记法：请逐步思考，如问题分析→方案设计→风险评估。苏格拉底式追问：在得出最终结论前，先列举三个可能存在的认知偏差。 2. 知识库调用：领域限定指令：基于特定的标准或文献，如 2023 版中国药典，说明相关内容。文献引用模式：以特定的论文为参考，解释相关突破。 3. 多模态输出：模糊指令优化：对于宽泛需求添加维度约束，将主观表述量化标准。迭代优化法：包括首轮生成获取基础内容、特征强化、风格调整和最终校验等步骤。 4. 在课题申报书的内容方面：关于提示词编写及 AI 应用的探讨：介绍用于不确定世界中理性决策的提示词编写方法，包括收集信息、重新定义问题、运用 Mini Max Regret 方法等步骤。注意示例的价值，自用与他用提示词在稳定性、经济性、可维护性等方面的区别。 AI 应用于软件开发：未来借助 AI 模型的 API 和编写提示词，可快速实现软件开发。关于写作与模型：用 DeepSeek 写小说要能引起共鸣和考虑人类共性，文字要感动人。注意模型特点与推荐，如 Cloud 3.5 模型多样性差，DeepSeek R1 有缺陷但也不错。以上内容仅供参考，您可以根据具体的课题需求进一步调整和完善。

给我提供一份清华大学104页的deepseek从入门到精通的手册的链接

以下是为您找到的与清华大学 DeepSeek 相关的一些资料链接： https://pan.quark.cn/s/56e2713e95f4 https://docs.qq.com/doc/DSG9SWFpjVXI3aHZ1 清华大学 104 页的 DeepSeek 从入门到精通的手册：https://waytoagi.feishu.cn/record/FjWorH （2 月 11 日更新附录）

给我提供一份清华大学104页的deepseek从入门到精通的手册

以下是为您整合的相关信息：清华大学出品了《DeepSeek：从入门到精通》的指南，该指南详细阐述了 DeepSeek 的功能，如智能对话、文本生成、代码生成、自然语言理解等，并探讨了其使用方法，包括推理模型与通用模型的区别、提示语设计策略等，旨在帮助用户更好地掌握这一 AI 工具的使用，提升工作效率和创新能力。您可以通过以下链接获取：https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg 。此外，还有一些相关的更新和资料，如 2 月 11 日更新附录的清华大学 104 页 Deepseek 从入门到精通、1 月 21 日更新热门 AI deepseek 推荐及案例征稿通知、1 月 14 日更新爱好者交流 g 群和微信群、12 月 30 日更新案例 24,25,26 等。同时还有关于 AI 赋能教学的课程实施流程及案例亮点等内容，如利用 AI 生成开放性问题引发深度思考、通过多维数据分析支持全面客观的判断、通过辩论提升批判性思维和表达能力等。

我有一份青年创新讲稿，想用自己的数字形象和我自己的声音讲解，背景要做一些和讲稿内容相符的视频。什么工具最称手呢？

以下是一些适合您需求的工具： 1. HeyGen：这是一个 AI 驱动的平台，能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量肖像和角色模型，适用于游戏、电影和虚拟现实等领域。 2. Synthesia：一个 AI 视频制作平台，允许创建虚拟角色并进行语音和口型同步，支持多种语言，可用于教育视频、营销内容和虚拟助手等场景。 3. DID：一家提供 AI 拟真人视频产品服务和开发的公司，只需上传人像照片和输入要说的内容，平台的 AI 语音机器人会自动转换成语音，然后合成逼真的会开口说话的视频。此外，还有以下工具供您参考： 1. 开源且适合小白用户的工具：具有一键安装包，无需配置环境，简单易用。其功能包括生成数字人视频，支持语音合成和声音克隆，操作界面中英文可选，系统兼容 Windows、Linux、macOS，模型支持 MuseTalk（文本到语音）、CosyVoice（语音克隆）。使用时需下载 8G+3G 语音模型包，启动模型即可。相关链接：GitHub： 2. Google Veo 2：能生成逼真的 Vlog 视频，效果接近真实，几乎难以分辨，适合创作和内容制作。相关链接：请注意，这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时，请确保遵守相关使用条款和隐私政策，并注意对生成内容的版权和伦理责任。

我是一个ai新手，请根据知识库现有的内容帮我拟一份学校ai的学习计划，以及更新知识的跟进和学习

以下是为您拟定的学校 AI 学习计划，以及知识更新的跟进和学习方法：一、了解 AI 基本概念首先，建议阅读「」部分，熟悉 AI 的术语和基础概念。了解什么是人工智能，它的主要分支（如机器学习、深度学习、自然语言处理等）以及它们之间的联系。同时，浏览入门文章，这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。二、开始 AI 学习之旅在「」中，您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台（如 Coursera、edX、Udacity）上的课程，按照自己的节奏学习，并有机会获得证书。三、选择感兴趣的模块深入学习 AI 领域广泛（比如图像、音乐、视频等），您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧，它上手容易且很有用。四、实践和尝试理论学习之后，实践是巩固知识的关键。尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享，欢迎您实践后的分享。五、体验 AI 产品与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人，了解它们的工作原理和交互方式。六、持续学习和跟进 AI 是一个快速发展的领域，新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体，保持对最新发展的了解。考虑加入 AI 相关的社群和组织，参加研讨会、工作坊和会议，与其他 AI 爱好者和专业人士交流。希望这份学习计划对您有所帮助，祝您在 AI 学习的道路上取得成功！

如何让AI帮我做一份PPT

以下是让 AI 帮您做一份 PPT 的一些方法和步骤： 1. 可以使用 Claude+Gamma.app 这两个工具。Claude 能够帮助您快速寻找符合条件的论文、提取精炼论文中某部分信息，还能帮您找到适合的 PPT 制作工具并教会您使用。例如，您可以向 Claude 提出诸如“帮我搜索一下营销领域最权威的期刊是哪几本”“帮我搜索一下这几本期刊中关于 chatgpt 的最新论文，并帮我筛选出 3 篇被引用次数最多的论文”等问题。 2. 利用 WPS AI 制作 PPT，等待不到 2 分钟 PPT 即可做好，然后可以修改主题配色和字体，还能通过 WPS 插件 chatPPT 为 PPT 添加动画。 3. 与 Claude 沟通时，要详细描述您想要的视觉风格，比如希望模仿类似 TheVerge 网站的科技风格，需要具体描述为“帮我生成数据可视化 PPT，类似 theverge 这样的科技风格，强烈的颜色对比，深色底色，以明亮的绿色和紫色作为高亮颜色，符合数学规律的配色，带有淡淡的网格线，体现科技感，使用 16:9 的画布，不能有元素溢出画布，保证布局的合理性，简洁的几何图形化作为装饰，所有装饰需要和内容相关，并且尽可能少使用，使用英文，模拟 2 个 PPT 的版式或者数据可视化，来测试效果”。如果初次效果不理想，需要耐心与 Claude 继续沟通和调整。