直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
AI图片制作视频如何保持人脸一致性的工具
以下是一些关于在 AI 图片制作视频中保持人脸一致性的工具和方法: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。 2. PixVerse:其“角色(Character)”新功能能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的真实人脸图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。 3. Midjourney:在有了 Midjourney 的新功能 Cref 以后,可在一定程度上保持人物一致性。先跑一张主角的定妆照,然后在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但 Midjourney 对亚洲人脸的一致性效果,尤其是亚洲老人的一致性效果较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以能不用则不用。 需要注意的是,目前对于场景一致性,基本上还没有任何有效的解决办法。
2025-01-31
layer_xl_bg2ble.safetensors,layer_xl_transparent_conv.safetensors,vae_transparent_encoder.safetensors这一类是大模型,还是Lora?
layer_xl_bg2ble.safetensors、layer_xl_transparent_conv.safetensors、vae_transparent_encoder.safetensors 这类文件可能是大模型的一部分,也可能是 Lora 模型。 在 AI 模型中: 基础模型(英文名 Checkpoint)是生图必需的,任何生图操作必须要选定一个基础模型才能开始。 Lora 是低阶自适应模型,可以理解为基础模型的小插件,生图时可有可无,但在控制面部、材质、物品等细节方面有明显价值。 同时,VAE 是个编码器,功能类似于滤镜,可调整生图的饱和度。
2025-01-31
提示词怎么用
提示词在现代大型语言模型中具有重要作用,以下是关于提示词使用的相关知识: 1. 理解提示词的作用:提示词为模型提供上下文和指示,直接影响模型输出质量。 2. 学习提示词的构建技巧: 明确任务目标,用简洁准确的语言描述。 给予足够的背景信息和示例,帮助模型理解语境。 使用清晰的指令,如“解释”“总结”“创作”等。 对特殊要求应给予明确指示,如输出格式、字数限制等。 3. 参考优秀案例:可在领域社区、Github 等资源中研究和学习已有的优秀提示词案例。 4. 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量,尝试各种变体,持续优化。 5. 活用提示工程工具:如 Anthropic 的 Constitutional AI 等。 6. 跟上前沿研究:持续关注提示工程最新的研究成果和方法论。 在具体的应用场景中,如星流一站式 AI 设计工具: 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(一个长头发的金发女孩),基础模型 1.5 使用单个词组(女孩、金发、长头发),支持中英文输入。 提示词优化方面,启用提示词优化后可帮您扩展提示词,更生动地描述画面内容。 写好提示词的方法: 小白用户可点击提示词上方官方预设词组进行生图。 提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 调整负面提示词,点击提示框下方的齿轮按钮,弹出负面提示词框,帮助 AI 理解不想生成的内容。 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大越优先。 辅助功能包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 在 Stable Diffusion 中: 根据想画的内容写出提示词,多个提示词之间使用英文半角符号“,”。 一般而言,概念性的、大范围的、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。 每个词语本身自带的权重可能有所不同,关键词最好具有特异性,措辞越不抽象越好,尽可能避免留下解释空间的措辞。 可以使用括号人工修改提示词的权重。
2025-01-31
怎么学习AI提示词??
以下是关于学习 AI 提示词的建议: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,您可以根据兴趣选择特定模块,比如一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,在知识库中也有很多实践后的作品和文章分享。 5. 体验 AI 产品:与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式。 6. 学习提示词的构建技巧: 理解提示词的作用,它向模型提供上下文和指示,影响模型输出质量。 明确任务目标,用简洁准确的语言描述,给予足够背景信息和示例,使用清晰指令,对特殊要求明确指示,如输出格式、字数限制等。 7. 参考优秀案例:研究和学习已有的优秀提示词案例,在领域社区、Github 等资源中可找到大量案例。 8. 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量,尝试各种变体,比较分析输出差异,持续优化提示词构建。 9. 活用提示工程工具:目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 10. 跟上前沿研究:提示工程是前沿研究领域之一,持续关注最新研究成果和方法论。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。
2025-01-31
Deepseek网站
DeepSeek 相关信息如下: 一个提示词让 DeepSeek 能力更上一层楼: 效果对比:用 Coze 做了小测试,可对比查看。 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白后正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计阈值系统,可能形式大于实质,之后根据反馈可能修改。 用 XML 进行更规范设定,而非 Lisp 和 Markdown。 完整提示词:v 1.3 特别鸣谢:李继刚、Thinking Claude、Claude 3.5 Sonnet。 Yeadon:cursor 杀手!?超强性价比开发方案曝光!DeepSeekR1+RooCline: 环境配置指南: DeepSeek 平台设置:首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。早期 deepseek 有赠送额度,没有赠送余额可充值,支持美元和人民币两种结算方式及各种个性化充值方式,创建一个 API key,注意及时保存,因为 API key 只会出现一次。 设置代码编辑器:下载 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/),以 cursor 为例,下载安装后在插件页面搜索并安装 Roocline,安装完打开三角箭头可看到 RooCline,选中并点击齿轮进入设置,依次设置基本参数,包括 API Provider 选择 DeepSeek、填入已创建的 key、选择 DeepSeekreasoner 模型、语言偏好设置等,记得把 HighRisk 选项都打开,最后点击 Done 保存修改,在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。 详解:DeepSeek 深度推理+联网搜索目前断档第一: 评论:游戏科学创始人、黑神话悟空制作人冯骥称 DeepSeek 可能是国运级别的科技成果,V3 已用一个月,R1 仅用 5 天。DeepSeek 做到了强大(比肩 O1 的推理能力)、便宜(参数少,训练开销与使用费用小了一个数量级)、开源(任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的 mini 模型)、免费(官方目前提供的服务完全免费,任何人随时随地可用)、联网(暂时唯一支持联网搜索的推理模型)、本土(由没有海外经历甚至没有资深从业经验的本土团队开发完成)。呼吁大家访问网页链接马上用起来,也有移动 APP。
2025-01-31
AI的发展历史
AI 的发展历史可以追溯到二十世纪中叶,大致经历了以下几个阶段: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论等。心理学家麦卡洛克和数学家皮特斯在 1943 年提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,马文·明斯基和约翰·麦凯西等人共同发起召开了著名的达特茅斯会议,“人工智能”一词被正式提出,并作为一门学科被确立下来。 2. 知识驱动时期(1970s 1980s):这一时期专家系统、知识表示、自动推理较为流行。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等得到发展。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术兴起。当前的前沿技术点包括大模型(如 GPT、PaLM 等)、多模态 AI(视觉 语言模型、多模态融合)、自监督学习(自监督预训练、对比学习、掩码语言模型等)、小样本学习(元学习、一次学习、提示学习等)、可解释 AI(模型可解释性、因果推理、符号推理等)、机器人学(强化学习、运动规划、人机交互等)、量子 AI(量子机器学习、量子神经网络等)、AI 芯片和硬件加速等。 然而,AI 的发展并非一帆风顺,20 世纪 70 年代曾出现“人工智能寒冬”,因为当时符号推理等方法在实现应用场景大规模拓展时面临诸多困难。但随着计算资源变得便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,在过去十年中,“人工智能”一词常被用作“神经网络”的同义词。
2025-01-31
如何设置程序里的触发器
在程序中设置触发器可以参考以下内容: 触发器类型及特点: 定时触发(Scheduled trigger):让 Bot 在指定时间执行任务,无需编写任何代码。 事件触发(Event trigger):触发器会生成 Webhook URL,当您的服务端向触发器 Webhook URL 发送 HTTPS 请求时,触发任务执行。 触发时执行任务的方式: Bot 提示词(Bot prompt):通过自然语言设置提示词。后续触发时,提示词会自动发送给 Bot,Bot 根据提示词向用户发送提醒消息。例如,为一个生活提醒机器人设置该触发器,提示词为每周一早上 7:00 提醒用户做有氧运动。 调用插件(Plugin):为触发器添加一个插件。后续触发时,Bot 会调用该插件获取返回结果并发送给用户。例如,添加一个查询天气的插件,当触发后向用户发送指定地点的天气信息。 调用工作流(Workflow):为触发器添加一个工作流。如果工作流有输入参数,则需要传入参数值。后续触发时,Bot 会调用该工作流获取返回结果并发送给用户。例如,添加一个审批工作流,当触发后执行工作流完成业务审批。 允许用户与 Bot 聊天时设置定时任务: 在 Bot 编排页面的触发器区域,选中允许用户在与 Bot 对话时创建定时任务复选框。 单击显示出来的在开场白中添加引导。 如有需要,修改开场白中添加的定时任务,然后在预览与调试内单击此问题进行调试。必须配置开场白文案,使开场白预置问题生效。开场白预置问题配置超过 3 条时,系统将随机展示其中 3 条。 添加定时触发器: 登录。 在左侧导航栏的团队空间区域,选择进入指定团队。 在 Bots 页面,选择进入指定 Bot。 在 Bot 编排页面触发器区域,单击右上角“+”图标。 在创建触发器对话框,完成以下配置,并单击保存。 名称:触发器名称。 触发器类型:选择定时触发。 触发时间:设置定时触发器的时区以及触发时间。 任务执行:设置触发后执行任务的方式。支持选择: 机器人提示:该方式需要通过自然语言设置提示词。 插件或工作流:这两种方式需要单击右侧“+”图标,添加插件或工作流(仅可添加一个)。如果插件或工作流有输入参数,则需要设置参数值。 使用限制:一个 Bot 内的触发器最多可添加 10 个,触发器仅当 Bot 发布飞书时生效。
2025-01-31
我是一名会计从业者,可以怎样利用AI赚钱
作为一名会计从业者,您可以通过以下方式利用 AI 赚钱: 1. 利用生成式 AI 改进金融服务团队的内部流程,简化财务团队的日常工作流程。例如,帮助编写 Excel、SQL 和 BI 工具中的公式和查询,实现分析的自动化;发现模式,并从更广泛、更复杂的数据集中为预测建议输入,为公司决策提供依据。 2. 借助生成式 AI 自动创建文本、图表、图形等内容,并根据不同的示例调整报告,无需手动将数据和分析整合到外部和内部报告中。 3. 利用生成式 AI 综合、总结税法和潜在的扣除项,并就其提出可能的答案。 4. 利用生成式 AI 自动生成和调整合同、采购订单和发票以及提醒。 此外,您还可以研究 Prompt 提示词,例如像雪梅 May 那样,尝试不同的方法,让 AI 识别会计分类,训练出一个在会计专业领域能提高效率的 AI。
2025-01-31
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
怎么制作一个AI agent?
制作一个 AI Agent 通常有以下几种方式和步骤: 方式: 1. Prompttuning:通过 Prompt 来构建大脑模块,但一般适合拟人化不是很重的情况,其缺点是使用的 Prompt 越长,消耗的 Token 越多,推理成本较高。 2. Finetuning:针对“有趣的灵魂”,通过微调一个定向模型来实现,能将信息直接“记忆”在 AI 的“大脑模块”中,提高信息提取效率,减少处理数据量,优化性能和成本。 3. Prompttuning + Finetuning:对于复杂情况,一般是两种方式结合。 步骤(以工作流驱动的 Agent 为例): 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。
2025-01-31