「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
现阶段AI应用有哪些
现阶段 AI 应用主要包括以下方面: 1. AI 视频生成: 专业创作者(艺术家、影视人等):能够为作品赋予独特风格和想象力,提供灵感,降低后期制作门槛和成本,目前主要集中在音乐 MV、短篇电影、动漫等方向。 自媒体、非专业创作者:解决视频剪辑痛点,如快速生成脚本分镜、视频,将文章高效转 PPT 再转视频,解决同一素材在不同平台分发的成本问题。 企业客户:为小企业、非盈利机构大幅缩减视频制作成本。 2. 交通领域: 自动驾驶:提高交通安全性和效率。 交通管理:优化交通信号灯和交通流量,缓解交通拥堵。 物流和配送:优化物流路线和配送计划,降低运输成本。 无人机送货:将货物快速送达偏远地区。 3. 其他领域: 教育:提供个性化学习体验。 农业:分析农田数据,提高农作物产量和质量。 娱乐:开发虚拟现实和增强现实体验。 能源:优化能源使用,提高能源效率。 此外,从使用场景来看,还包括改善大模型产品的使用体验、助力用户工作流、细分场景独立实用工具、AI 社区、Chatbot 等方向;从产品形态上来看,分为插件、辅助现有产品能力、深度结合 LLM 能力的独立网站&应用、AI 社区等。目前产品大多分布在 PC 端。
2025-03-03
我想通过ai换脸,把一张网图的照片变成我的脸,该怎么办
以下是将网图照片换成您的脸的一些方法和步骤: 1. 星流一站式 AI 设计工具: 选中图像进入扩展功能界面,自动提取面部信息。 上传想要替换到图像的图片。 参数方面:提示词框会自动根据图像进行填充,无需手动填写;重绘风格选择与放大图像相对应的风格,会提升换脸效果,其余参数默认即可。 2. 【SD】无需 Lora,一键换脸插件 Roop: 勾选相关项目,确保包含 Python 和 C++包。 更改到您想要安装的位置,点击右下角的安装。 安装时间较长,需耐心等待。 安装好后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”,然后回车。 在打开的 dos 界面里,粘贴“python m pip install insightface==0.7.3 user”代码,自动开始安装 insightface。 若此阶段出现错误,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】即可下载。 安装完成后,重新打开启动器,后台会继续下载一些模型,全程需保证科学上网。 启用 ROOP 插件,选择想要替换的人物照片,面部修复选择“GFPGAN”。右边的参数数值越低,人物会越像,但图像会很模糊;数值越高人物越不像,但图像会很清晰,可根据需求设置,如使用 0.5 测试。最下面还有放大算法,可使用一个模型放大图像,相当于高清修复。设置好后点击生成。若人脸部分像素偏低、有点模糊,可将图发送到“图生图”,开一个较小的重绘幅度。 需要注意的是,AI 换脸存在一定的法律风险。除上述诈骗、寻衅滋事、编造、传播虚假信息罪外,AI 换脸技术既然要对“人脸”进行更换,其民事侵权风险自不言而明,相对应地构成侮辱、诽谤罪及制作、贩卖、传播淫秽色情物品罪的案例亦会出现。就民事侵权而言,《民法典》第一千零一十九条明确规定,“任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。”因此,一旦换脸技术所生成之人脸系自然人的肖像,那么未经他人同意,使用他人肖像的行为当然侵犯了自然人的肖像权。在刑事犯罪方面,行为人使用他人肖像进行 AI 换脸旨在侮辱、诽谤、恶意丑化他人,并在网络上肆意传播,该行为就极有可能涉嫌刑法上的侮辱、诽谤罪。此外,现阶段还存在大量行为人利用 AI 换脸技术专门进行违法犯罪活动,其中较为典型的是诈骗罪和制作、复制、出版、贩卖、传播淫秽物品牟利罪或传播淫秽物品罪。
2025-03-03
一个可以总结文章的AI应用是怎么训练出来的?
一个可以总结文章的 AI 应用通常通过以下方式训练: 1. 数据准备:收集大量的文本数据,包括各种类型和主题的文章。 2. 模型选择:使用适合自然语言处理任务的大型语言模型,如 OpenAI 的 GPT 系列。 3. 导入相关库和加载 API 密钥:例如导入 OpenAI 并加载 API 密钥。 4. 设计提示:制定明确的提示,如要求从电子商务网站的产品评论中生成简短摘要。 5. 针对不同需求训练: 文字总结:对一般性的文字进行总结。 针对某种信息总结:例如特定领域或特定类型的信息。 尝试“提取”而不是“总结”:更侧重于关键信息的提取。 针对多项信息总结:处理多个相关的文本信息。 6. 应用拓展:不仅可以总结文章,还能总结群聊消息、B站视频等。对于 B 站视频,通过获取字幕并发送给 AI 来实现总结。 7. 与 API 配合:通过 OpenAI API 等获取有效密钥,并结合示例代码进行开发和优化。
2025-03-03
win7能安装 ComfyUI吗
Win7 可以安装 ComfyUI,但需要满足一定的硬件要求和进行一系列的环境安装操作。 硬件要求: 1. 系统:Windows 7 以上。 2. 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 3. 硬盘留有足够的空间,最低 100G 起步(包括模型)。 环境安装操作: 1. 下载并更新 Nvidia 显卡驱动,下载地址:https://www.nvidia.cn/geforce/drivers/ 2. 依次下载并安装 Python(https://www.python.org/downloads/release/python3119/ ,安装时选中“将 Python 添加到系统变量”)、Git(https://gitscm.com/download/win )、VSCode(https://code.visualstudio.com/Download ),安装过程中一直点击勾选对应选项,一直下一步。 3. 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 。 此外,还可能涉及克隆 ComfyUI 仓库、创建 python 虚拟环境、安装 Pytorch 和依赖包等操作。关于部分安装操作,网上有较多教程可供参考。同时,模型权重和工作流的获取也有相应的途径。
2025-03-03
使用AI,comfyui是必学的吗?
ComfyUI 并非是使用 AI 时必学的。但如果您想在 AI 水平上有更高的提升,掌握 ComfyUI 的理论基础是很有帮助的。它在图像、视频等领域有诸多应用和发展,例如在差分算法、年龄渐变和特定内容替换、q 列模型、语言模型的迁移和发展、深度图检测和分层处理等方面具有优势。同时,了解其技术细节如 clip 的 skip 层、scheduler 和 sample 的区别、CFG 等能让您更灵活选择参数。ComfyUI 的生态发展稳定,节点和项目增多,相关大会也在多地举办。此外,其生态外的收费视频软件能用 API 节点接入所有体系,飞书大群方便交流,会同步课件及相关信息。
2025-03-03
推理行大模型对于RAG的准确性提升,带来哪些改变
推理行大模型对 RAG 准确性提升带来了以下改变: 1. 当辅以能有效提取文档中结构化信息并整合为提示词的 PDF 解析器时,大语言模型能作出更准确的响应,提高了提供给模型的数据质量和相关性,从而提升模型输出质量。 2. 大模型应用领域常用的 RAG 方法,能让模型用自定义数据生成结果,处理无尽私有数据,将模型当成高效推理机器。但 RAG 存在一些常见误区: 随意输入任何文档不一定能得到准确回答,RAG 流程中的多个环节都会影响最终质量。 RAG 虽能减少幻觉,但不能完全消除,只要有大模型参与就可能产生幻觉。 RAG 仍消耗大模型的 Token,最终需大模型处理检索结果生成通顺回答。 未来,将研究分享更多基于深度学习的文档解析方法,以更全面理解 RAG 质量和文档解析质量的关系。同时,前沿模型研发团队力争做到吞吐量、速度和准确度的最佳平衡。
2025-03-03
怎么用AI写论文开题报告
利用 AI 写论文开题报告可以按照以下步骤进行: 1. 确定课题主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课题涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写课题的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课题的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保课题的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课题写作时,应保持批判性思维,并确保研究的质量和学术诚信。让 AI 去做那些机械重复、结构固定的部分,而把有判断力、价值取向的部分牢牢掌握在自己手中。例如,在写论文时,可以用 AI 校对格式、润色语法,但选题、新见解、论证框架这些核心创作环节一定要由自己完成。在与 AI 互动中,可以主动思考,比如问完 AI 问题后,思考如果自己回答会怎样,对比 AI 答案的新颖或不足之处,还可以利用 AI 检查漏洞,完善自己的思考。
2025-03-03
抠图换装
以下是关于抠图换装的相关内容: 在 SD 中,画蒙版存在一定难度。在 SD 里用鼠标涂画笔工具少且不稳定,精确绘制困难;在 PS 里画蒙版虽简单但流程麻烦,需不停导入导出图片且有人可能不会 PS。 对于大多数人,能在一个软件解决就不开第二个。基于此,介绍 SD 中的抠图神器 Segment Anything,它是基于深度学习算法的图像分割工具,能将图像像素分配到对应区域,实现精准边缘识别,自动检测提高分割效率。 另外,GFPGAN 可进行面部修复,找一张模糊人像,将其参数拉到 1 即可。背景去除需安装插件 REMBG,安装地址是 https://github.com/AUTOMATIC1111/stablediffusionwebuirembg.git 。安装重启后有选项框,测试抠图效果不错但有黑边,可通过点击 Alpha matting 调整参数如 Erode size:6、Foreground threshold:143、Background threshold:187 去掉黑边,还能直接生成蒙版。此外,还有专门做服装抠图的模型,方便换装处理,也有专门给动漫抠图的模型。 在 MJ 应用中,提到做一些秀气女性角色时,style expressive/style cute 有一定效果。出图靠量累积,实现基本统一画风后可进一步抠图换底。非人生物的 OC 出图成功率低,如 2 号机器人生成方便,3 号神秘人难做,可先绘制符合部分要求的图像再局部重绘。7 号泰迪熊先生同理,MJ 出的泰迪熊多为全身像,可扩展出身体。
2025-03-03
有没有工作流可以将宠物的照片变成手绘的电子画像
以下是一些可以将宠物照片变成手绘电子画像的工作流: 1. SDXL Prompt Styler 工作流:可以把图片转化成近百种风格。例如,将手绘风格的宠物照片转绘成折纸风时,最好不要加入线稿边缘(canny)的 controlnet 控制,或者需把 canny 的控制强度(strength)调到较小。原始图像是手绘风格时,手绘线条和折纸风格本身互斥。若转成漫画风格并想较好保留人物外轮廓,加入 canny 控制能更好还原人物原本造型。有时直接用插件内置预设的提示词组合不一定能达到想要的效果,需在 prompt 中再加一些特定风格的关键词。此外,该工作流结合 Vid2Vid Style Transfer with IPA&Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。 2. 小王子 Roy 的工作流:用 Coze 搭建神奇宠物诞生器。包括随机生成属性和宠物描述,对于不会写代码的小伙伴,可使用内置的“尝试 AI”功能,但要注意尽量选择 python 代码编写,书写前确定好输出变量等。生成宠物形象使用 coze 自带的文生图工具 text2image 插件,宠物形象描述文字生成使用图片理解插件 imgUnderstand,生成宠物的名字借鉴特定逻辑,生成宠物小传/技能/使命调用前面节点的数据,最后整理输出引用前面节点的多个数据。 3. 《艾小喵绘本》工作流:基于扣子的全自动绘本创作 Agent,源于兴趣和好奇,尝试从半自动实现全自动。
2025-03-03
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量,如非洲动物、真实风格、2。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 2. Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型的思考流程,过长提示会带来大量的 Token 浪费和上下文污染,特别是在多轮对话中。在 deepseek 时代,用户只需要在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 3. 让 DeepSeek 生成相机运动轨迹的提示词:以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合,现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式来描写,可以得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。对空间理解和对语义的遵循能让有光影变化的泳池自然地生成出来,海螺 AI 甚至还知道给主角穿上与场景匹配的拖鞋。
2025-03-03