「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
怎么看sd的插件不兼容
SD 插件不兼容可能有多种情况和解决方法: 对于提示词服从度增强插件,当生成图与提示词不太相符时,可以通过多刷图来找到符合需求的绘图。若条件太多始终达不到效果,可提高 cfg 值并启用修复插件。但开启插件并提高 CFG 值后,画面可能会发黄,颜色偏差可利用 PS 做后续调整。安装方式可以在扩展列表中搜索插件名字,或放在特定路径文件夹下,安装完成后重启 webUI 即可启用。 对于无需 Lora 的一键换脸插件 Roop,安装时间较长,需耐心等待。安装过程包括在特定文件夹地址栏输入“cmd”回车,在打开的 dos 界面粘贴代码安装 insightface。若出现错误,可下载最新秋叶 4.2 整合包。安装完成后重新打开启动器,后台会继续下载模型,需全程科学上网。使用时要注意参数设置,人脸像素可能偏低,可发送到“图生图”并使用 controlnet 中的 tile 模型重绘。此插件谨慎使用,切勿触犯法律。获取插件可添加公众号【白马与少年】回复【SD】。
2025-01-02
生成的效果总不是自己想要的
以下是关于生成效果不理想的一些解决方法: 1. 在使用 Midjourney 生成图片时,如果想要更加可控,可以利用 seed 参数进行反向生成。先从官方文档了解 seed 参数的作用,Midjourney 会用种子号绘图,可使用 Seed 或 same eseed 参数指定,默认种子号随机,若想获得相似图片需固定 seed,如在关键词后添加 seed 参数(数字在 0–4294967295 范围内),这样能保证每次生成相同的图,还可基于确定图片的 seed 加上新关键词进行微调。 2. 在使用 SD 绘图时,当提示词中有多个条件但生成的图像无法全部满足,这与提示词引导系数(CFG 值)有关。通过使用“X/Y/Z 脚本”进行横向对比不同 CFG 值(5/10/15/20/25/30)下的画面效果,发现随着 CFG 值提高,画面与提示词关联度更高,但可能出现画面崩坏。可安装 dynamicthresholding 插件来解决,安装方式可在扩展列表中搜索或放在指定路径文件夹下,安装完成后重启 webUI 启用生效。 3. 在使用 LTX Studio 工具时,可能会遇到一些问题: 音效不识别:句子识别率低,最好用词语,有些词语无法识别或声音不理想时可用近似音效。 音效在预览时大,生成后不明显:目前工具暂无调整音效音量功能,预览合适但合成后可能被背景音乐盖掉,后续可能会出音量功能。 对人物角度提示词识别不精准:可采用取巧方式,如不限定角色并写其在看远处某物,可能得到想要的画面。 目前整体视频分辨率较低:生成的视频分辨率基本在 480P 到 720P,画面较糊,工具暂无放大图片和提升画质选项,后续可能会开发。此外,目前工具较封闭,不支持用户上传内容,后续可能会开放。
2025-01-02
为什么有的大模型不能和lora一起用
大模型不能和 Lora 一起用可能有以下原因: 1. 不配套:一般情况下,只有配套的大模型和 Lora 一起使用才能达到 Lora 的最佳效果。不同的大模型和 Lora 可能在特征、参数等方面不匹配。 2. 触发条件:除了加载 Lora 外,还需要加入一些特定的触发词才能保证其正常使用,如果没有满足触发条件,可能无法协同工作。 同时,模型的类型和安装位置也很重要: 1. 大模型(Ckpt)应放入 models\\Stablediffusion 目录。 2. Lora/LoHA/LoCon 模型应放入 extensions\\sdwebuiadditionalnetworks\\models\\lora 或 models/Lora 目录。 使用 Lora 时要注意作者使用的大模型,也不排除一些 Lora 和其他大模型会产生奇妙的效果。此外,文件后缀名相似,难以通过后缀名区分文件类型,可通过特定网站检测。
2025-01-02
个人知识库训练
个人知识库训练主要有以下内容: 私人知识库中的内容一般包括从互联网收集的优质信息以及个人日常的思考和分享。 基于私人知识库打造个人专属的 ChatGPT 常见有两种技术方案: 训练专有大模型:KimiChat 和 ChatGPT 等能精准回答问题是因用整个互联网语料训练从而拥有相关知识。也可用个人知识库训练专有大模型,效果虽好但并非当下主流,存在高成本、更新难度大等缺陷。 RAG(检索增强生成)技术:大模型训练数据有截止日期,当需依靠不在训练集中的数据时,可通过 RAG 实现。RAG 应用包括文档加载、文本分割、存储(包括嵌入和向量数据存储)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 使用 embeddings:将文本转换成向量能节省空间,可理解为索引。把大文本拆分成小文本块并转换成 embeddings 向量,在向量储存库保存这些向量和文本块作为知识库。用户提问时,问题先转成向量,与储存库向量比对,提取关联度高的文本块与问题组合成新 prompt 发送给 GPT API。例如对“此文作者是谁?”的提问,可通过比较 embeddings 向量得出关联度高的文本块,发送给 GPT API 以获取答案。
2025-01-02
语料库训练相关文档
以下是为您提供的语料库训练相关文档: 中文数据集 |ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注| ||||||||||| |6||2020 年|CLUE||CLUENER2020 数据集,是在清华大学开源的文本分类数据集 THUCTC 基础上,选出部分数据进行细粒度命名实体标注,原数据来源于 Sina News RSS。数据包含 10 个标签类别,训练集共有 10748 条语料,验证集共有 1343 条语料|细粒度;CULE|命名实体识别|\\|中文| |7||英文| |8||||EMNLP2015|命名实体识别||| |9||2005 年|MSR/PKU|||bakeoff2005|命名实体识别||| TTS 超全教程 音库制作和文本前端 音库制作 音频录制 音频的录制对合成语音的表现较为重要,较差的语音甚至会导致端到端声学模型无法正常收敛。用于训练的录音至少要保证录音环境和设备始终保持一致,无混响、背景噪音;原始录音不可截幅;如果希望合成出来的语音干净,则要删除含口水音、呼吸音、杂音、模糊等,但对于目前的端到端合成模型,有时会学习到在合适的位置合成呼吸音、口水音,反而会增加语音自然度。录音尽可能不要事先处理,语速的调节尚可,但调节音效等有时会造成奇怪的问题,甚至导致声学模型无法收敛。音频的录制可以参考录音公司的标准,购买专业麦克风,并保持录音环境安静即可。在音库录制过程中,可尽早提前尝试声学模型,比如音库录制 2 个小时语音后,就可尝试训练基线语音合成系统,以防止录音不符合最终的需求。 语料整理 检查文本和录制的语音是否一一对应,录制的音频本身一句话是否能量渐弱,参与训练的语音前后静音段要保持一致,能量要进行规范化。可使用预训练的语音活动检测(Voice Activity Detection,VAD)工具,或者直接根据语音起止的电平值确定前后静音段。可以使用一些开源的工具,比如统一所有语音的整体能量,这将有助于声学模型的收敛。当然,在声学模型模型训练时,首先就要对所有语料计算均值方差,进行统一的规范化,但是这里最好实现统一能量水平,防止一句话前后能量不一致。能量规整的示例代码如下。
2025-01-02
怎么样学习AI
以下是关于学习 AI 的全面指导: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。同时,一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 六、中学生学习 AI 的建议 1. 从编程语言入手学习 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,学习 AI 可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能,为未来的发展做好准备。 七、在医疗保健中应用 AI 的学习 为了在医疗保健中让 AI 产生真正的改变,应投资于创建一个模型生态系统——比如“专家”AI——使其像优秀的医生和药物开发者那样学习。成为医疗领域顶尖人才通常以多年的密集信息输入开始,通过正规学校教育和学徒实践,从该领域出色的实践者那里学习。对于 AI 来说,应通过使用彼此堆叠的模型来训练,而不是仅依靠大量数据和生成模型。例如,先训练生物学的模型,然后是化学的模型,再添加特定于医疗保健或药物设计的数据点。预医学生的课程从化学和生物学基础开始,设计新疗法的科学家也需要经历多年学习和实践。这种学习方式有助于培养处理细微差别决策的直觉。
2025-01-02
sora和lora是什么
LoRA(LowRank Adaptation)是一种低阶自适应模型,您可以将其理解为基础模型(Checkpoint)的小插件。在生图时,LoRA可有可无,但它具有明显的价值,常见于对一些精细的控制,如面部、材质、物品等细节的控制。其权重在相关界面会有显示。 Sora 并非常见的 AI 领域特定术语,上述知识库中未提及相关内容。
2025-01-02
关于医疗辅助诊断的AI有哪些
以下是一些关于医疗辅助诊断的 AI 应用: 1. 医学影像分析:AI 可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:用于加速药物研发过程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每个患者提供个性化的治疗方案。 4. 机器人辅助手术:控制手术机器人,提高手术的精度和安全性。 5. 平安好医生 APP 中的 AI 医疗诊断辅助系统:辅助医生进行疾病诊断,提高诊断准确性。用户上传症状描述和检查报告后,系统能给出初步的诊断建议和治疗方案,为医生提供参考。
2025-01-02
LLM输出的结果一致性如何保证
要保证 LLM 输出结果的一致性,可以采取以下几种策略: 1. Prompt 工程: 明确的待处理内容指引:在构建 Prompt 时,清晰地定义需要处理的文本,并使用标记框起来,让模型准确识别待处理内容范围,从中提取信息。 提供明确字段定义:具体化每个字段的名称、用途及要求,为 LLM 提供明确的提取方向和标准。 异常处理:设置异常处理原则,如规定缺失数据使用默认值填充,特殊数据类型符合标准格式,确保模型输出的完整性和一致性。 要求结构化输出:指示 LLM 以结构化格式(如 JSON)输出数据,便于后续处理和系统集成。 2. 自我一致性增强可靠性:促使 LLM 对同一问题产生多个答案,通过一致性审查衡量其可信度。一致性评估可从内容重叠、语义相似性评估及高级指标(如 BERT 分数或 ngram 重叠)等多方面进行,增强 LLM 在事实核查工具中的可靠性。 3. 衡量和评估不确定性:如牛津大学通过生成一个问题的多个答案,并使用另一个模型根据相似含义分组来衡量 LLM 不确定性。 4. 利用外部工具验证:如 Google DeepMind 推出的 SAFE,通过将 LLM 响应分解为单个事实、使用搜索引擎验证事实以及对语义相似的陈述进行聚类来评估 LLM 响应的真实性。 5. 借助其他 LLM 发现错误:如 OpenAI 推出的 CriticGPT,使用基于大量有缺陷输入数据集训练的 GPT 式 LLM 来发现其他 LLM 生成代码中的错误。 6. 利用 LLM 生成的评论增强 RLHF 的奖励模型:如 Cohere 使用一系列 LLM 为每个偏好数据对生成逐点评论,评估提示完成对的有效性。
2025-01-02
如何在fastgpt里做企业微信搭建
在 FastGPT 里搭建企业微信可以按照以下步骤进行: 1. 搭建 OneAPI:这是为了汇聚整合多种大模型接口,方便后续更换使用各种大模型。 2. 搭建 FastGpt:这是一个知识库问答系统,将知识文件放入,并接入上面的大模型作为分析知识库的大脑,最后回答问题。如果不想接到微信,搭建到这里就可以,它也有问答界面。 3. 搭建 chatgptonwechat 接入微信: 克隆项目代码,如遇网络问题,可把链接替换为国内镜像。 安装 Python 3 和 pip。 安装核心依赖(必选)和拓展依赖(可选,建议安装)。 复制一份 config 文件,方便后续配置。 用公网 ip:3000 打开 FastGpt,在应用中获取对外的 API 接口(操作:应用>发布应用>Api 访问),点击“新建”API 秘钥,复制 API KEY 和新建按钮旁边的 API 根地址 2 个内容,用于配置接入微信。 回到宝塔,在【文件】菜单中找到 root 下的 chatgptonwechat 文件夹中的 config.json 文件,双击文件,复制下方的配置全部替换掉并保存文件。 点击文件夹上方功能栏中的【终端】,运行程序,返回扫描执行命令后的“终端”内的二维码,完成登录。 4. 搭建完后想拓展功能,可参考 Yaki.eth 同学的教程,里面的 cow 插件能进行文件总结、MJ 绘画的能力。 此外,还有以下补充内容: 第四天教程:FastGPT 教学中的部署项目: 1. 使用特定版本的微信,点击下载进行替换安装。若下载不了,可去 https://f.ws59.cn/f/egjbgm2p565 复制链接到浏览器打开。若过期,去公众号回复:Hook,自动获取下载地址。 2. 下载 NGCbot 机器人项目,解压缩。 3. 解压后,在空白处 shift+鼠标右键,点击“在此处打开 Powershell 窗口”,打开 shell 窗口后粘贴代码并回车。 4. 在当前的 NGCbot 文件夹下,找到 Config 文件中的 config.yaml,右键选择用记事本方式打开。
2025-01-02