与知识库对话 - WayToAGI

直达「通往AGI之路」飞书知识库 →

首页/全部问答

Mac部署stable diffusion

在 Mac 上部署 Stable Diffusion 存在一定限制，功能可能不全且出错率偏高，严重影响使用体验。个人建议升级设备或者采用云服务器玩耍。如果您仍想在 Mac 上部署，可以参考以下步骤： 1. 电脑硬件要求：系统：无明确针对 Mac 的特定系统要求。显卡：未明确针对 Mac 的显卡要求。硬盘：留有足够的空间，最低 100G 起步（包括模型）。 2. 环境安装：未提供 Mac 系统下的具体环境安装步骤。由于 Mac 系统的特殊性，更推荐您采用云端部署的方式，相关教程可参考：https://qa3dhma45mc.feishu.cn/wiki/A6WYw1Nm0ikGplkuO9Ecwomqnnd

怎么用chatGPT

以下是关于如何使用 ChatGPT 的一些方法： 1. 英文学习：推特博主的英语老师制作了一个 GPT 工作流，基于每个人的日常需求生成定制素材。具体使用方法：先把特定 prompt 喂给 ChatGPT（建议开新对话专门用于学习英文），然后 ChatGPT 会扮演美国好朋友，对输入的英文和中文表达返回更地道的表达，对俚语部分加粗，还会举一反三给出更多例子，输入“Hey GPT,run the end of day task.”，ChatGPT 会输出对话回顾并建议 3 个任务。建议使用方式：开一个窗口复制 prompt，手机端打开历史记录，点右上角耳机图标打电话，可练口语和听力，结束后看回顾帮助阅读。群友在讯飞上做了类似尝试，效果不错。 2. 产品经理使用：需求及现状问题输入：在完成原 SQL 输入后，将真实业务需求场景及问题输入给 ChatGPT，帮助其更好理解需求，给出针对性优化建议，输出更符合需求的代码。这有好几轮输入输出，不断强化对需求的认知。根据优化结果不断调试：输入旧代码、需求和问题后，GPT 给出新代码，不断调试优化，直到生成满足需求的新代码。例如，GPT 提出每次更新 1 天数据、创建中间结果表、利用 CASE WHEN 合并查询约束条件相同的指标等优化建议。 3. 苹果系统安装、订阅：在 AppleStore 下载 chatgpt：中国区需切换到美区，美区 AppleID 注册教程参考知乎链接。支付宝购买苹果礼品卡充值订阅付费 App：打开支付宝，地区切换到美区任意区，找到品牌精选折扣礼品卡，购买【App Store & iTunes US】礼品卡，按需要金额购买，建议先买 20 刀。然后在 apple store 中兑换礼品卡，在 chatgpt 中购买订阅 gpt plus，可在订阅列表中取消订阅。使用 ChatGPT 4o：打开应用或网页点击开始对话，会员在苹果或安卓手机购买，电脑上能登录，版本切到 ChatGPT 4o，点击右下角“耳机?”图标选择声音可体验语音对话。

有哪些免费的可以提高图片分辨率的网站

以下是一些免费提高图片分辨率的方法和相关网站： 1. 在 Stable Diffusion 中：文生图功能中有内置的高清修复（HiresFix）功能。将初始分辨率设置为 800x420 时，选择放大倍率为 2，理论上放大倍率越高，图片越清晰，但最高可达 4 倍，实际效果与电脑配置和显卡显存有关。先以较低分辨率画图，获取生成图的种子值，然后将其填入随机数种子以固定图片，再进行高清修复，放大算法如二次元绘图可选择 RESRGAN 4x+ Anime6B，写实类风格可选择 RESRGAN 4x+。 2. Stability AI 推出的基于 Discord 的工具：：将低分辨率、低质量的图像转换为 4k 杰作，价格为 25 积分。：简单、低成本的分辨率提升，价格为 0.2 积分。此外，在 MJ 应用中也有相关操作，如复制图像链接和提示词等步骤来生成新的图像，并通过改变比例和镜头拉远等操作调整构图，最终提升分辨率。

企业微信个人账户接入大模型

企业微信个人账户接入大模型可以参考以下内容：基于 COW 框架的实现步骤： COW 是基于大模型搭建的 Chat 机器人框架，将多模型塞进自己的微信里实现方案。张梦飞同学写了更适合小白的使用教程：。可以实现：打造属于自己的 ChatBot（文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等等）；常用开源插件的安装应用。正式开始前需要知道：ChatBot 相较于在各大模型网页端使用区别，本实现思路需要接入大模型 API 的方式实现（API 单独付费）。风险与注意事项：微信端因为是非常规使用，会有封号危险，不建议主力微信号接入；本文只探讨操作操作步骤，请依法合规使用，大模型生成的内容注意甄别，确保所有操作均符合相关法律法规的要求，禁止将此操作用于任何非法目的，处理敏感或个人隐私数据时注意脱敏，以防任何可能的滥用或泄露。支持多平台接入：微信、企业微信、公众号、飞书、钉钉等。有多模型选择：GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等。支持多消息类型：能处理文本、语音和图片，以及基于自有知识库进行定制的企业智能客服功能。有多部署方法：本地运行、服务器运行、Docker 的方式。全程白嫖拥有一个 AI 大模型的微信助手的实现步骤：搭建，用于汇聚整合多种大模型接口，方便更换使用各种大模型，下面会告知如何白嫖大模型接口。搭建，这是个知识库问答系统，把知识文件放进去，再把上面的大模型接进来，作为分析知识库的大脑，最后回答问题，如果不想接到微信去，自己用用，搭建完就可以，它也有问答界面。搭建，里面的 cow 插件能进行文件总结、MJ 绘画的能力。

如何编辑更改图片中的文字

以下是一些关于编辑更改图片中文字的方法和示例： DALL·E 推出了编辑功能，例如可以添加耳机、去掉错误文字、添加正确文字、修改鹿角等。但对于添加较多区域小的文字识别可能不太好。 Ideogram 2.0 在生成图像时，AI 基于学习内容创造文字，可能存在字体版权、字体生成错误等问题。纠正方式包括多次生成提示、使用编辑器修改文本、更换同义词、上传包含所需文本的图像等。 Midjourney 有新的图片编辑器功能，如增加主体数量（以狐狸为例，涂抹空白区域并修改关键词）、轻松扩图（自由操作图片并点击生成）、扩图并增加主体（缩放原图、涂抹空白区域并修改关键词），还能添加文字。进入 Midjourney 图片编辑器的步骤为：打开 MJ 官网（https://www.midjourney.com），选择要修改的图片，点击图片后再点击右下角的 Editor 按钮。需要注意的是，新生成的主体须与原图一致，且部分操作目前 discord 暂不支持。

以下是关于利用 AI 做 PPT 的相关内容：目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作： 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构一些可用的 AI 做 PPT 的工具包括： 1. GPT4、WPS AI 和 chatPPT。 2. Gamma：在线 PPT 制作网站，通过输入文本和想法提示快速生成幻灯片，支持嵌入多媒体格式，如 GIF 和视频，网址：https://gamma.app/ 3. 美图 AI PPT：由美图秀秀开发团队推出，通过输入简单文本描述生成专业 PPT 设计，包含丰富模板库和设计元素，网址：https://www.xdesign.com/ppt/ 4. Mindshow：AI 驱动的 PPT 辅助工具，提供自动布局、图像选择和文本优化等智能设计功能，网址：https://www.mindshow.fun/ 5. 讯飞智文：由科大讯飞推出的 AI 辅助文档编辑工具，利用语音识别和自然语言处理技术优势，提供智能文本生成、语音输入、文档格式化等功能，网址：https://zhiwen.xfyun.cn/ 您可以参考上述信息，根据自己的需求选择合适的工具来制作 PPT。

请告诉我有哪些AI+医疗项目

以下是一些 AI+医疗项目：蛋白质结构预测和蛋白质合成：用于生成漂亮图片的 AI 也可以帮助科学家研究并设计新的蛋白质。健康生物制药的研究：AI 极大加速了医疗健康生物制药的研究，在抗癌、抗衰老、早期疾病防治等的研究应用中起着重要作用。医学：中医应用：将人工智能与中医结合，通过观察口腔、舌苔和抓脉，生成选择题让患者作答，最后 AI 生成药方，目前用于辅助看诊，提高诊疗效率，未来愿景是实现 24 小时独立问诊开药。 AI 洞察：一线医生如何实际使用 ChatGPT：来自纽约时报最新报道，再现了 ChatGPT 在美国一流医院的实际场景。

最好的ai学习视频课程

以下为您推荐野菩萨的 AI 学习视频课程：预习周课程：包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。基础操作课：涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影穿越的大门等内容。核心范式课程：涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程：包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程：有 ChatGPT 基础、核心文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程：包含部署和基本概念、基础工作流搭建、动画工作流搭建等。应对 SORA 的视听语言课程：涉及通识欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。目前该课程内容丰富，比之前有很大提升。如果您想要免费获得这门课程，可以来参与 video battle，这是唯一获胜者可拥有课程的机会。每期的 video battle 评委野菩萨老师非常严格，需要寓意深度审美并存。冠军奖励 4980 课程一份，亚军奖励 3980 课程一份，季军奖励 1980 课程一份，入围奖励 598 野神殿门票一张。这门课程无论您是 AI 小白还是深入学习者，都能带来帮助。您可以扫码添加菩萨老师助理，了解更多课程信息。让我们一起在“通往 AGI 之路”社区学习成长，探索 AI 的无限可能！

AI生成视频的关键词

以下是关于 AI 生成视频的相关信息： ChatGPT 生成视频脚本：您可以设定自己为深受年轻人喜欢的电影导演，创作一个约 1 分钟、内容为山海经中的神兽在赛博朋克世界的宣传视频脚本。过程中可与 ChatGPT 讨论、修改细节并撰写宣传文案，把控核心内容以优化脚本。文字生成视频的 AI 产品： Pika：擅长动画制作，支持视频编辑。 SVD：可在 Stable Diffusion 基础上安装使用，能在图片基础上生成视频。 Runway：老牌 AI 视频生成工具，提供实时涂抹修改视频功能，但收费。 Kaiber：视频转视频 AI，能将原视频转换成各种风格的视频。 Sora：由 OpenAI 开发，可生成长达 1 分钟以上的视频。更多产品可查看。进阶技巧和关键词：主题描述：可描述场景、故事、元素、物体或人物细节等。若描述场景中的人物，建议独立描述，避免长串文字，否则 AI 可能识别不到。设计风格：可参考风格类关键词或垫图/喂图，让 AI 结合主题描述生成相应风格图片。对于材质的描述，如玻璃、透明塑料、霓虹色彩等，关键词的运用较为复杂，需针对特定风格进行“咒语测试”。

什么是RAG的分词？

RAG（RetrievalAugmented Generation，检索增强生成）是一种结合检索和生成能力的自然语言处理架构，旨在为大语言模型（LLM）提供额外的、来自外部知识源的信息。通过检索的模式为大语言模型的生成提供帮助，使大模型生成的答案更符合要求。 LLM 需要 RAG 进行检索优化的原因在于 LLM 存在一些缺点： 1. 无法记住所有知识，尤其是长尾的，受限于训练数据和现有的学习方式，对长尾知识的接受能力不高。 2. 知识容易过时且不好更新，微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证，存在内容黑盒、不可控以及受幻觉干扰等问题。 4. 容易泄露隐私训练数据。 5. 规模大，训练和运行成本高。 RAG 具有以下优点： 1. 数据库对数据的存储和更新稳定，不存在模型学不会的风险。 2. 数据库的数据更新敏捷，增删改查可解释，且对原有知识无影响。 3. 数据库内容明确、结构化，加上模型的理解能力，能降低大模型输出出错的可能。 4. 知识库存储用户数据，便于管控用户隐私数据，且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本，新知识存储在数据库即可，无需频繁更新模型。在 PDF 结构识别方面，基于规则的方法 PyPDF 存在一些问题： 1. 不擅于检测段落的边界，没有解析段落的边界，使用特殊分隔符“.\n”的启发式方法在很多情况下不成立。 2. 无法识别表格内的结构，表格的结构会被完全破坏，大语言模型无法从中辨别有意义的信息。 3. 无法识别内容的阅读顺序，按照字符存储顺序解析文档，面对复杂布局时可能导致解析结果混乱。 4. 无法识别段落和表格的边界，会错误地分割表格，并将部分与后续段落合并。 PyPDF 的解析和分块工作流程是：先将 PDF 文档中的字符序列化为没有文档结构信息的长序列，然后使用分割规则如换行符“\n”进行分割，仅当组合块的长度不超过预定限制 N 个字符时，才会合并相邻块。