直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
Mac部署stable diffusion
在 Mac 上部署 Stable Diffusion 存在一定限制,功能可能不全且出错率偏高,严重影响使用体验。个人建议升级设备或者采用云服务器玩耍。 如果您仍想在 Mac 上部署,可以参考以下步骤: 1. 电脑硬件要求: 系统:无明确针对 Mac 的特定系统要求。 显卡:未明确针对 Mac 的显卡要求。 硬盘:留有足够的空间,最低 100G 起步(包括模型)。 2. 环境安装: 未提供 Mac 系统下的具体环境安装步骤。 由于 Mac 系统的特殊性,更推荐您采用云端部署的方式,相关教程可参考:https://qa3dhma45mc.feishu.cn/wiki/A6WYw1Nm0ikGplkuO9Ecwomqnnd
2024-11-06
怎么用chatGPT
以下是关于如何使用 ChatGPT 的一些方法: 1. 英文学习: 推特博主的英语老师制作了一个 GPT 工作流,基于每个人的日常需求生成定制素材。 具体使用方法:先把特定 prompt 喂给 ChatGPT(建议开新对话专门用于学习英文),然后 ChatGPT 会扮演美国好朋友,对输入的英文和中文表达返回更地道的表达,对俚语部分加粗,还会举一反三给出更多例子,输入“Hey GPT,run the end of day task.”,ChatGPT 会输出对话回顾并建议 3 个任务。 建议使用方式:开一个窗口复制 prompt,手机端打开历史记录,点右上角耳机图标打电话,可练口语和听力,结束后看回顾帮助阅读。群友在讯飞上做了类似尝试,效果不错。 2. 产品经理使用: 需求及现状问题输入:在完成原 SQL 输入后,将真实业务需求场景及问题输入给 ChatGPT,帮助其更好理解需求,给出针对性优化建议,输出更符合需求的代码。这有好几轮输入输出,不断强化对需求的认知。 根据优化结果不断调试:输入旧代码、需求和问题后,GPT 给出新代码,不断调试优化,直到生成满足需求的新代码。例如,GPT 提出每次更新 1 天数据、创建中间结果表、利用 CASE WHEN 合并查询约束条件相同的指标等优化建议。 3. 苹果系统安装、订阅: 在 AppleStore 下载 chatgpt:中国区需切换到美区,美区 AppleID 注册教程参考知乎链接 。 支付宝购买苹果礼品卡充值订阅付费 App:打开支付宝,地区切换到美区任意区,找到品牌精选 折扣礼品卡,购买【App Store & iTunes US】礼品卡,按需要金额购买,建议先买 20 刀。然后在 apple store 中兑换礼品卡,在 chatgpt 中购买订阅 gpt plus,可在订阅列表中取消订阅。 使用 ChatGPT 4o:打开应用或网页点击开始对话,会员在苹果或安卓手机购买,电脑上能登录,版本切到 ChatGPT 4o,点击右下角“耳机?”图标选择声音可体验语音对话。
2024-11-06
有哪些免费的可以提高图片分辨率的网站
以下是一些免费提高图片分辨率的方法和相关网站: 1. 在 Stable Diffusion 中: 文生图功能中有内置的高清修复(HiresFix)功能。将初始分辨率设置为 800x420 时,选择放大倍率为 2,理论上放大倍率越高,图片越清晰,但最高可达 4 倍,实际效果与电脑配置和显卡显存有关。 先以较低分辨率画图,获取生成图的种子值,然后将其填入随机数种子以固定图片,再进行高清修复,放大算法如二次元绘图可选择 RESRGAN 4x+ Anime6B,写实类风格可选择 RESRGAN 4x+。 2. Stability AI 推出的基于 Discord 的工具: :将低分辨率、低质量的图像转换为 4k 杰作,价格为 25 积分。 :简单、低成本的分辨率提升,价格为 0.2 积分。 此外,在 MJ 应用中也有相关操作,如复制图像链接和提示词等步骤来生成新的图像,并通过改变比例和镜头拉远等操作调整构图,最终提升分辨率。
2024-11-06
企业微信个人账户接入大模型
企业微信个人账户接入大模型可以参考以下内容: 基于 COW 框架的实现步骤: COW 是基于大模型搭建的 Chat 机器人框架,将多模型塞进自己的微信里实现方案。 张梦飞同学写了更适合小白的使用教程: 。 可以实现:打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等等);常用开源插件的安装应用。 正式开始前需要知道:ChatBot 相较于在各大模型网页端使用区别,本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;本文只探讨操作操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入:微信、企业微信、公众号、飞书、钉钉等。 有多模型选择:GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等。 支持多消息类型:能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 有多部署方法:本地运行、服务器运行、Docker 的方式。 全程白嫖拥有一个 AI 大模型的微信助手的实现步骤: 搭建,用于汇聚整合多种大模型接口,方便更换使用各种大模型,下面会告知如何白嫖大模型接口。 搭建,这是个知识库问答系统,把知识文件放进去,再把上面的大模型接进来,作为分析知识库的大脑,最后回答问题,如果不想接到微信去,自己用用,搭建完就可以,它也有问答界面。 搭建,里面的 cow 插件能进行文件总结、MJ 绘画的能力。
2024-11-06
如何编辑更改图片中的文字
以下是一些关于编辑更改图片中文字的方法和示例: DALL·E 推出了编辑功能,例如可以添加耳机、去掉错误文字、添加正确文字、修改鹿角等。但对于添加较多区域小的文字识别可能不太好。 Ideogram 2.0 在生成图像时,AI 基于学习内容创造文字,可能存在字体版权、字体生成错误等问题。纠正方式包括多次生成提示、使用编辑器修改文本、更换同义词、上传包含所需文本的图像等。 Midjourney 有新的图片编辑器功能,如增加主体数量(以狐狸为例,涂抹空白区域并修改关键词)、轻松扩图(自由操作图片并点击生成)、扩图并增加主体(缩放原图、涂抹空白区域并修改关键词),还能添加文字。进入 Midjourney 图片编辑器的步骤为:打开 MJ 官网(https://www.midjourney.com),选择要修改的图片,点击图片后再点击右下角的 Editor 按钮。需要注意的是,新生成的主体须与原图一致,且部分操作目前 discord 暂不支持。
2024-11-05
AI怎么做PPT
以下是关于利用 AI 做 PPT 的相关内容: 目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 一些可用的 AI 做 PPT 的工具包括: 1. GPT4、WPS AI 和 chatPPT。 2. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 3. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 5. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 您可以参考上述信息,根据自己的需求选择合适的工具来制作 PPT。
2024-11-05
请告诉我有哪些AI+医疗项目
以下是一些 AI+医疗项目: 蛋白质结构预测和蛋白质合成:用于生成漂亮图片的 AI 也可以帮助科学家研究并设计新的蛋白质。 健康生物制药的研究:AI 极大加速了医疗健康生物制药的研究,在抗癌、抗衰老、早期疾病防治等的研究应用中起着重要作用。 医学:中医应用:将人工智能与中医结合,通过观察口腔、舌苔和抓脉,生成选择题让患者作答,最后 AI 生成药方,目前用于辅助看诊,提高诊疗效率,未来愿景是实现 24 小时独立问诊开药。 AI 洞察:一线医生如何实际使用 ChatGPT:来自纽约时报最新报道,再现了 ChatGPT 在美国一流医院的实际场景。
2024-11-05
最好的ai学习视频课程
以下为您推荐野菩萨的 AI 学习视频课程: 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 目前该课程内容丰富,比之前有很大提升。如果您想要免费获得这门课程,可以来参与 video battle,这是唯一获胜者可拥有课程的机会。每期的 video battle 评委野菩萨老师非常严格,需要寓意深度审美并存。冠军奖励 4980 课程一份,亚军奖励 3980 课程一份,季军奖励 1980 课程一份,入围奖励 598 野神殿门票一张。 这门课程无论您是 AI 小白还是深入学习者,都能带来帮助。您可以扫码添加菩萨老师助理,了解更多课程信息。让我们一起在“通往 AGI 之路”社区学习成长,探索 AI 的无限可能!
2024-11-05
AI生成视频的关键词
以下是关于 AI 生成视频的相关信息: ChatGPT 生成视频脚本:您可以设定自己为深受年轻人喜欢的电影导演,创作一个约 1 分钟、内容为山海经中的神兽在赛博朋克世界的宣传视频脚本。过程中可与 ChatGPT 讨论、修改细节并撰写宣传文案,把控核心内容以优化脚本。 文字生成视频的 AI 产品: Pika:擅长动画制作,支持视频编辑。 SVD:可在 Stable Diffusion 基础上安装使用,能在图片基础上生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多产品可查看。 进阶技巧和关键词: 主题描述:可描述场景、故事、元素、物体或人物细节等。若描述场景中的人物,建议独立描述,避免长串文字,否则 AI 可能识别不到。 设计风格:可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格图片。对于材质的描述,如玻璃、透明塑料、霓虹色彩等,关键词的运用较为复杂,需针对特定风格进行“咒语测试”。
2024-11-05
什么是RAG的分词?
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。通过检索的模式为大语言模型的生成提供帮助,使大模型生成的答案更符合要求。 LLM 需要 RAG 进行检索优化的原因在于 LLM 存在一些缺点: 1. 无法记住所有知识,尤其是长尾的,受限于训练数据和现有的学习方式,对长尾知识的接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在内容黑盒、不可控以及受幻觉干扰等问题。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,且对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,能降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本,新知识存储在数据库即可,无需频繁更新模型。 在 PDF 结构识别方面,基于规则的方法 PyPDF 存在一些问题: 1. 不擅于检测段落的边界,没有解析段落的边界,使用特殊分隔符“.\n”的启发式方法在很多情况下不成立。 2. 无法识别表格内的结构,表格的结构会被完全破坏,大语言模型无法从中辨别有意义的信息。 3. 无法识别内容的阅读顺序,按照字符存储顺序解析文档,面对复杂布局时可能导致解析结果混乱。 4. 无法识别段落和表格的边界,会错误地分割表格,并将部分与后续段落合并。 PyPDF 的解析和分块工作流程是:先将 PDF 文档中的字符序列化为没有文档结构信息的长序列,然后使用分割规则如换行符“\n”进行分割,仅当组合块的长度不超过预定限制 N 个字符时,才会合并相邻块。
2024-11-05