直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何让 ai 写作的内容不要太有 AI 的味道?
要让 AI 写作的内容不那么有“AI 味”,可以从以下几个方面入手: 1. 模型选择:不同模型的文风有所差异。例如,Claude 和 Google 的 gemini 模型相对没有明显的“AI 味”,而 OpenAI 的 GPT 模型在文风上也不断改进。 2. 避免特定文风:如避免使用“首先、其次、再者、最后”等套话,减少概括性描述、生硬叙述、死板结构和过度道德正确的表达。 3. 融入感情:让 AI 在回复中加入感情,例如通过营造特定环境、用括号补充动作等方式,增加画面感和生动性。 4. 明确输出要求:让 AI 扮演特定角色,给出具体而明确的输出要求,避免古板的回答方式。 5. 评估和改进:从实际角度出发,自己想办法评估模型的能力,不断改进写作内容。
2025-02-01
如何开发一个有关“精油”的智能体
开发一个有关“精油”的智能体可以参考以下步骤: 1. 技术实现原理: 由 1 个工作流和多个数据库组成。工作流设计较简单,包括输入、对接知识库、搭载大模型和输出。数据库的收集和二次校对有一定难度,需要专业知识。为保证回答准确性,提示词约定回答只能来自知识库。 2. 商业化场景: 可替代大部分传统医药数据库商业化场景,如医药企业研发立项、科研机构临床转化评估、投资机构评估标的公司等方面的相关问题。 此外,还可以参考以下通用的智能体开发步骤: 1. 创建大模型问答应用: 通过创建百炼应用获取大模型的推理 API 服务。 进入百炼控制台的“我的应用”,选择智能体应用并创建。 模型选择通义千问Plus,可设置 Prompt 引导大模型应对客户咨询。 提问验证模型效果并发布。 2. 获取调用 API 所需的凭证: 在“我的应用>应用列表”中查看百炼应用 ID 并保存。 在顶部导航栏右侧创建新的 APIKEY 并保存。 对于图像相关的智能体开发,如制作公司周边图片,流程分为三个部分: 1. 获取 Logo 图片的描述:从摄影、标志设计等方面详细描述图像内容,控制在 50 字左右。 2. 根据 Logo 图片的描述和生成意图生成图片提示词:参考示例,根据具体需求创作提示词。 3. 将图片和提示词输入 Comfyui 工作生成。
2025-02-01
Excel表格办公AI工具
以下是一些关于 Excel 表格办公的 AI 工具: 1. Excel Labs:是 Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出,整合了多种办公软件,用户通过聊天告知需求,Copilot 自动完成任务,包括 Excel 中的数据分析和格式创建等。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、相关文本内容、执行情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。 另外,在软件架构设计中,以下是一些可以绘制逻辑视图、功能视图、部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,可拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 6. draw.io(diagrams.net):免费在线图表软件,支持多种视图创建。 7. PlantUML:文本到 UML 转换工具,通过描述文本自动生成视图。 8. Gliffy:基于云的绘图工具,提供多种架构图创建功能。 9. Archi:免费开源工具,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持多种视图创建。
2025-02-01
介绍两款好用免费的文字转音频的AI工具
以下为您推荐两款好用免费的文字转音频的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 另外,您还可以在 WaytoAGI 的工具网站上查看更多相关工具:https://waytoagi.com/sites/category/50 。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-01
Deepseek本地部署
DeepSeek 是一项非常出色的科技成果,由一家小规模的年轻中国公司开发完成。它具有以下显著特点: 1. 强大的推理能力,可与 O1 比肩。 2. 成本低廉,参数少,训练开销与使用费用小。 3. 开源,任何人都可自行下载与部署,并提供了详细的论文说明训练步骤与窍门,还有可运行在手机上的 mini 模型。 4. 免费,官方提供的服务完全免费,任何人随时随地可用。 5. 支持联网搜索,是暂时唯一支持联网搜索的推理模型。 如果您想使用 DeepSeek,可以直接访问相关网页链接或移动 APP 马上用起来。 另外,关于本地部署,SDXL 在生成时间上,对于高配电脑如 4080ti 显卡,速度在十秒左右,配置较低的需要自行测试。还可以安装 refine 插件,在文生图界面直接使用 refine 模型进一步绘画。 此外,基于多模态大模型的相关代码开源,有动手能力的小伙伴可以自己部署,如在手机上部署 llava,采用 server 方式需要 9 秒,最快只能加速到 1.5 秒,要达到毫秒级,移动端侧推理才是王道。
2025-02-01
提取视频中的文字
以下是关于提取视频中文字的相关内容: 视频会根据画面匹配生成音乐,音乐和视频还能卡点,视频里的文字也可以识别并转化为歌词。 对于 B 站视频,若有字幕,可通过安装油猴脚本获取字幕,选择多种字幕格式,将字文字内容全选复制发送给 GPTs 即可进行总结。 制作视频时,需要先准备一段视频中播放的内容文字,例如产品介绍、课程讲解、游戏攻略等,也可利用 AI 生成。使用剪映 App 进行处理,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号添加文字内容轨道,替换默认文本内容,为数字人提供语音播放及生成相应口型。
2025-02-01
识别图片文字
以下是关于识别图片文字的方法: 1. 图像预处理: 图像去噪:使用去噪算法(如高斯滤波、中值滤波)去除图像中的噪声。 图像增强:通过增强算法(如直方图均衡化、对比度增强)提升图像的清晰度和对比度。 2. 图像分割:使用图像分割算法将试卷图像中的书写笔迹和背景分离。常用的分割算法包括阈值分割、边缘检测和基于区域的分割方法。 3. 文字检测:在分割后的图像中,使用文字检测算法(如基于深度学习的文本检测模型)识别出试卷上的文字区域。 4. 文字识别:对检测到的文字区域进行文字识别,将文字内容转换为计算机可处理的文本数据。常用的文字识别技术包括基于深度学习的端到端文本识别模型和传统的 OCR(Optical Character Recognition)技术。 5. 后处理:根据需求进行后处理,如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练(可选):如有足够的数据,可以采用机器学习技术训练模型,通过学习样本中的书写笔迹特征来自动去除试卷上的笔迹。 7. 优化算法:对整个处理流程进行优化,提高处理速度和准确度。可以采用并行计算、硬件加速等方法提升算法的效率。 8. 移动端集成:将设计好的算法和模型集成到移动应用程序中,以实现试卷拍照去除书写笔迹的功能。可以使用移动端开发框架(如 iOS 的 Core ML、Android 的 TensorFlow Lite)来实现模型的部署和调用。 此外,关于 GPT 的 OCR 识别问题及解决方案: 问题:开启代码执行功能时,GPT 会尝试用代码完成 OCR,导致无法正确识别图片文字。 解决方案: 如果是自定义 GPT,关闭 Code Interpreter。 无法关闭时,提问时明确说明“不要执行代码,请用自身多模态能力识别文字”。 直接使用 ChatGPT,而非 GPT。 关于 Glif 的使用: 首先确认 glif 的入口参数,设计输入项,如宠物的性别、语言、用户提供的一张宠物照片,并分别新增相应的节点。 接下来将图片内容识别出来,有两种选择:使用 Image to Text 节点或 GPTVision 的多模态能力。 由于识别图的内容可能混乱,可通过大模型做清理,新增一个 Text Generator(LLM)节点。
2025-02-01
U-net
Unet 是一种常用于图像处理,尤其是图像分割的特别神经网络结构。 其工作方式主要包括: 1. 编码部分:逐步缩小图像,从中提取重要特征,类似于提取图片的精华。 2. 解码部分:逐步放大图像,把提取的特征重新组合成高分辨率的图像。 3. 跳跃连接:在缩小和放大的过程中,保留一些细节信息,使最终生成的图像更清晰。 在一些应用中,如 ComfyUi 中,Unet 发挥着重要作用: ComfyUi 的底层依赖 Stable Diffusion,去噪过程由 Unet 网络完成。去噪的每个步骤通过模型推理模块实现,这个模块会调用训练好的 Unet 模型,逐步将噪声图像还原成有意义的图像。 在图像生成过程中,如潜在空间放大,先生成潜在表示,再放大潜在表示,然后将其反馈到稳定扩散 Unet 中进行低噪声扩散处理以生成高分辨率图像。 在 Stable Diffusion 中: 点击 Generate 按钮后的图片生成过程,就是 Unet 不断去除噪声的过程。 Stable Diffusion 中的 Unet,在传统深度学习时代的 EncoderDecoder 结构基础上,增加了 ResNetBlock(包含 Time Embedding)模块、Spatial Transformer(SelfAttention+CrossAttention+FeedForward)模块以及 CrossAttnDownBlock,CrossAttnUpBlock 和 CrossAttnMidBlock 模块。
2025-02-01
deepseek
DeepSeek 是一家具有独特特点和优势的公司。 DeepSeek 不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期才发生。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文也在 AI 研究界被广泛分享和讨论。而当时在国内,DeepSeek 被描摹成“大模型价格战的发起者”。这表明 DeepSeek 与硅谷更有对话和交流的密码,其秘方是硅谷味儿的。 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但 DeepSeek 作为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。 DeepSeek 是推理型大模型,具有以下特点与优势: 1. 不需要用户提供详细步骤指令,通过理解用户真实需求和场景提供答案。 2. 能够理解用户用“人话”表达的需求,无需学习特定提示词模板。 3. 回答问题时能进行深度思考,而非简单罗列信息。 4. 可以模仿不同作家的文风进行写作,适用于多种文体和场景。 使用 DeepSeek 的正确方法包括: 1. 可以扔掉提示词模板,用自然语言描述,直接描述真实场景和具体需求,使用提示词模板也完全没问题。 2. 在提问时加上“说人话”“小学生能听懂”“菜市场大妈能听懂的话”等,让回答更加通俗易懂。 3. 激发深度思考,如让 DeepSeek 进行批判性思考、反面思考和复盘,以恢复其深度思考能力。 4. 通过指定模仿的作家和文体,让 DeepSeek 生成符合特定风格的文本。
2025-02-01
能帮我写一份deepseek的洞察分析报告吗
以下是关于 DeepSeek 的洞察分析报告: 一、用户体验 用户 May 第一次使用 DeepSeek 后,有以下感受: 1. 深度思考过程展示:将如何写白皮书的思考过程全程展示,与习惯的 ChatGPT 黑盒子模式不同,这种坦白的方式体验良好。 2. 回答的白皮内容和排版: 有引用链接:答案的每一句话都标注了引用的网站,方便用户判断出处的严谨性。 有参考文献:直接在文末列出参考的白皮书,为用户查找相关资料提供便利。 回答内容质量:质量不错,没有明显的 AI 痕迹。 二、华尔街分析师的反应 DeepSeek 展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,并在全球主要市场的 App Store 登顶。但也有不同观点,Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 三、实际使用表现 1. 文字能力:在中文场景中高度符合日常和写作习惯,但在专业论文总结方面稍弱。 2. 数学能力:经过优化,表现不错。 3. 编程能力:略逊于 GPT,据用户反馈。 4. 技术创新:采用 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 四、相关动态 复旦大学 OpenMOSS 发布实时语音交互模型。
2025-02-01