直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
文生图
以下是关于文生图的详细教程: 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。 ControlNet:可控制图片中特定图像,如人物姿态、特定文字、艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需管语法,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文书写想要 AI 避免产生的内容,同样是单词和短语组合,用英文半角逗号隔开。 采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 在不同的工具中,如 Tusiart 和 Liblibai,操作流程大致相同,但在一些细节上可能有所差异: Tusiart: 定主题 选择 Checkpoint 选择 lora ControlNet(高阶技能,后续学习) 局部重绘(下篇再教) 设置 VAE Prompt 提示词 负向提示词 Negative Prompt 采样算法 采样次数 尺寸 Liblibai: 定主题 选择 Checkpoint 选择 lora 设置 VAE CLIP 跳过层(设为 2) Prompt 提示词 负向提示词 Negative Prompt 采样方法 迭代步数 尺寸 生成批次(默认 1 批)
2025-02-16
人工智能时代对社会有什么冲击
人工智能时代对社会的冲击主要体现在以下几个方面: 1. 劳动力市场:预计在未来几年对劳动力市场产生重大影响,包括好的和坏的方面,但工作变化速度比多数人想象的慢,人们不必担心缺乏事情可做。 2. 能力放大:能使人类天生的创造和彼此有用的欲望得到前所未有的放大,社会将重新进入不断扩张的世界。 3. 深度学习:是一种有效的算法,计算能力和数据量越大,解决难题的能力越强,将随着规模而变得更好,对全球人民生活产生有意义的改善。 4. 个人助理:人工智能模型将很快作为自主的个人助理,代表用户执行特定任务。 5. 资源分配:获得充足的计算和能源对于实现人工智能民主化和防止不平等至关重要。 6. 风险控制:控制人工智能的风险对于最大限度地发挥其优势并确保积极的未来至关重要。 同时,在教育方面,孩子将拥有虚拟导师,能够提供个性化教学,类似概念还可应用于医疗保健改进、创建各种软件等领域,带来共享的繁荣。
2025-02-16
请帮我找出在课堂可以使用的AI
以下是在课堂中可以使用的一些 AI 应用和方法: 1. 让 AI 出题,如出 Python 题,可先出 20 道再挑选修改。 2. 利用 AI 进行智慧课程设计,例如围绕巴以冲突出相关数学题,将维基百科的史料借助 AI 变成数学课教案,让孩子从生活中学习多学科知识。 3. 输入书上例题,让 AI 生成新颖解法,引发学生思考。 4. 进行交互式学习,随时要求 AI 解释关键代码并举例,为学生提供支架。 5. 利用 AI 分担低阶认知,让人有精力投入高阶认知加工。 6. 借助 AI 工具,将知识作为解决问题的方法来教。 7. 声音克隆:可在 Elevenlabs.io、speechify.com 等网站进行,还能通过 HeyGen 定制“数字分身”。 8. 视频生成:如用 runway 让互联网梗图动起来,用 lumalabs.ai 让图片动起来。 同时要注意对学生思维训练的引导,关注和设法引导“偷懒”的学生,避免差距拉大。
2025-02-16
Ollama配置
以下是关于 Ollama 配置的详细步骤: 1. 进入 ollama.com 下载程序并安装,该程序支持 Windows、Linux 和 MacOS 系统。 2. 查找 cmd 进入命令提示符(Windows 系统)或通过相应方式进入终端(Mac 系统),输入“ollama v”检查版本,安装完成后版本应显示 0.1.26。 3. 输入“cls”清空屏幕,然后直接输入“ollama run gemma”运行模型(默认是 2b 版本),首次需要下载,需等待一段时间。若想用 7b 版本,运行“ollama run gemma:7b”。 4. 完成以上操作后就可以直接对话。2b 版本的反应速度快,但能互动的话题有限。7b 版本能运行,但可能会有卡顿,输出内容质量相对较高,但无论 2b 还是 7b,对非英文语种的反馈都不是很稳定。 5. 模型里一些常用的内部指令:“/set”显示设置界面可调整的设置项,“/show”显示模型信息。 另外,还有一种部署 Ollama 的方式: 1. 点击进入 ollama.com 根据电脑系统下载 Ollama。 2. 下载完成后,双击打开,点击“Install”。 3. 安装完成后,将“http://127.0.0.1:11434/”复制进浏览器中,若出现相应字样,表示安装完成。 4. 下载 qwen2:0.5b 模型(可根据自身设备情况选择更大的模型)。 对于 Windows 电脑,点击 win+R,输入 cmd 点击回车。 对于 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。 5. 复制相关命令行,粘贴进入并回车,等待下载完成。下载完成后,大模型已在本地运行,输入文本即可进行对话。
2025-02-16
哪个AI查文献靠谱
以下是一些在查文献方面较为靠谱的 AI 工具和平台: 专利审查方面: 1. 专利检索与分类: Google Patents:使用 AI 技术帮助用户检索和分析专利文献。 IBM Watson for IP:利用 NLP 和机器学习技术,自动化地检索和分类专利文献,提高检索的准确性和效率。 2. 专利分析和评估: TurboPatent:使用 AI 技术进行专利文档的自动审查和分析,评估专利的授权可能性和潜在风险。 PatentBot:AI 驱动的平台,可以自动分析专利文本,评估专利的技术范围和创新性。 3. 自动化专利申请: Specifio:利用 AI 技术自动生成专利申请文件,包括专利说明书和权利要求书,提高专利申请的效率。 PatentPal:使用 AI 技术自动生成和编辑专利申请文件,减少人工工作量。 4. 专利图像和图表分析: Aulive:利用 AI 技术分析专利中的图像和图表,自动识别技术内容和创新点。 AIpowered image recognition tools:用于专利文献中的图像识别和分析,提高图像处理的效率和准确性。 5. 专利趋势分析和预测: Innography:利用 AI 技术分析专利数据,提供技术趋势分析和竞争情报。 PatSnap:AI 驱动的平台,分析专利数据和技术趋势,提供全面的专利情报和市场分析。 论文写作方面: 1. 文献管理和搜索: Zotero:结合 AI 技术,可以自动提取文献信息,帮助研究人员管理和整理参考文献。 Semantic Scholar:一个由 AI 驱动的学术搜索引擎,能够提供相关的文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,帮助提高论文的语言质量。 Quillbot:一个基于 AI 的重写和摘要工具,可以帮助研究人员精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:一个用于数学建模和优化的软件,可以帮助研究人员进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽然不是纯粹的 AI 工具,但结合了自动化和模板,可以高效地处理论文格式和数学公式。 Overleaf:一个在线 LaTeX 编辑器,提供丰富的模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: Turnitin:一个广泛使用的抄袭检测工具,帮助确保论文的原创性。 Crossref Similarity Check:通过与已发表作品的比较,检测潜在的抄袭问题。 使用这些平台时,通常需要以下步骤: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献或输入检索关键词:如在专利审查平台上传待审查的专利文献,在论文写作平台输入相关主题关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成等功能,在论文写作平台选择相应的辅助功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果等。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件或完善论文内容。 需要注意的是,这些内容由 AI 大模型生成,请仔细甄别。
2025-02-16
LLM 训练推理模型有哪些
以下是一些常见的 LLM 训练推理模型: 1. FengshenbangLM: 地址: 简介:是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系,开源了姜子牙通用大模型 V1,是基于 LLaMa 的 130 亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外,还开源了太乙、二郎神系列等模型。 2. BiLLa: 地址: 简介:开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力,并尽可能减少对原始 LLaMA 英文能力的损伤;训练过程增加较多的任务型数据,利用 ChatGPT 生成解析,强化模型理解任务求解逻辑;全量参数更新,追求更好的生成效果。 3. Moss: 地址: 简介:支持中英双语和多种插件的开源对话语言模型,MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 此外,Andrej Karpathy 的相关介绍中提到了 LLM 训练的一些情况,如训练过程涉及大约 10TB 的文本,通常来源于互联网的抓取,需要大量的互联网资源和一个 GPU 集群,费用大约 200 万美元。Karpathy 的视频还详细介绍了 LLM 训练的全部过程,包括预训练、有监督微调和强化学习等。
2025-02-16
AI工具换衣服面料
以下是关于 AI 工具换衣服面料的相关内容: 在使用某些 AI 工具进行换衣操作时,例如在 Stable Diffusion(SD)中,可按照以下步骤进行: 1. 进入图生图模式,若蒙版有 bug 看不见,错误时可手动保存。 2. 输入提示词如“蓝色毛衣”,将蒙版区域内容处理改为“填充”,尺寸改为和图像一致,重绘幅度设为 1。但由于蒙版区域较大,可能会出现与之前的手衔接不上的问题,此时可通过降低重绘幅度或添加 openpose 控制人物身体姿势来解决。 3. 除了图生图的局部重绘,还可使用 controlnet 的局部重绘功能,控制模式选择“更注重提示词”,具体效果可自行试验选择。 在 MidJourney 中,有以下实用技巧: 1. 角色一致性:使用 cref 后接角色图片的 URL 可保持角色形象一致性,通过 cw 调整参考强度,范围 100 到 0,默认 100 会使用面部、头发和衣服,强度为 0 时只专注面部,适合更换服装或发型等。 2. 风格一致性:使用 sref 后接风格参考图像的 URL,可生成风格一致的图像,可添加多个风格参考链接,并通过 :: 后跟权重数字设置不同风格的相对重要性。还可结合使用垫图和 sref,垫图影响画面构图和元素,sref 影响画风。 另外,关于基于 AI 的换衣工作流,可参考以下步骤: 1. 下载文件链接:https://ixqye9ulc13.feishu.cn/drive/folder/Q8D0fvjPll59o7dMKVvcWowOnQh?from=space_personal_filelist 。 2. 载入工作流后若发现缺少节点,需下载文件夹 custom_nodes 中的“ComfyUIIDMVTON.rar”压缩包,解压到 customs 路径下作为节点使用,并将文件夹“LayerNorm”放入指定路径(如 C:\\Users\\Admin\\Desktop\\ComfyUIakiv1.3\\custom_nodes\\comfyui_controlnet_aux\\ckpts)。 3. 若重新打开出现问题,可将节点 custom_nodes“Marigold”、“KwaiKolorWrapper”、"mixlabnodes"剪切放到桌面(不要放在 comfyui 中),先跑工作流。
2025-02-16
零基础,如何开始学搭建
对于零基础学习搭建,以下是一些建议和相关资源: 从网站搭建方面,您可以参考以下直播内容: 大雨将介绍软件安装情况并分享零基础搭建可修改网站的目标。在直播中,大雨会先介绍需要下载的东西并去转发,还会询问观众编程基础、学习目标等。当天目标是搭建网站并修改,目的是降低编程难度。 大雨介绍了自己的职业背景,包括曾在央企做架构师、外企做咨询顾问、互联网公司产品经理,现在运营公众号。他提到去年开始认识一些人,上个月在切磋大会后开始做 AI 编程相关的事,表示做编程不是为成为程序员,而是提高日常工作学习效率,还提及后续的共学安排。 共学搭建网站部分,主要围绕搭建自己网站所需的账号注册展开,包括 GitHub 与 Radio 账号注册流程。 关于 Stable Diffusion 方面,您可以在知乎上查看以下教程: 深入浅出完整解析 Stable Diffusion(SD)核心基础知识,涵盖系列资源、核心基础原理、核心网络结构解析、搭建使用推理流程、经典应用场景、训练自己的 AI 绘画模型等多个方面。 如果您想搭建 AI 微信聊天机器人,可以参考以下内容: 纯 GPT 大模型能力的微信聊天机器人搭建,重点是修改 dockercompose.yml 文件中的具体配置来串联微信号和已创建好的 AI 机器人。配置时需留意相关参数,如私聊或群聊的触发前缀、群组自动回复的配置等。
2025-02-16
有关agent的介绍
AI Agent 是当前 AI 领域中较为热门的概念,被认为是大模型未来的主要发展方向之一。 从原理上看,中间的“智能体”通常是 LLM(语言模型)或大模型。为其增加的四个能力分别是工具、记忆、行动和规划。目前行业中主要使用 langchain 框架,将 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。例如,给大模型提供长期记忆,相当于给予一个数据库工具让其记录重要信息;规划和行动则是在大模型的 prompt 层进行逻辑设计,如将目标拆解并输出不同的固定格式 action 指令给工具。 从产品角度,Agent 可以有不同的设定。比如是一个历史新闻探索向导,身份为历史新闻探索向导,性格知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析,还可以为其设计背景故事使其更加生动。 在人工智能领域,Agent 智能代理是一种能够感知环境并根据感知信息做出决策以实现特定目标的系统,能够自动执行任务,如搜索信息、监控系统状态或与用户交互。
2025-02-16
Ai换衣服材质
以下是关于 AI 换衣服材质的相关信息: 在 AIGC 1.0 时代,AIGC 主要起到产生参考图像的作用,仅使用 controlnet 无法精确控制特征材质,如阿牛的橙色身体部分、蓝色金属牛角等,适合整体全身材质风格替换,可使用正视图或手绘线稿图输入 controlnet 进行控制。 在 AIGC 2.0 时代,基于 Stable diffusion 的 Lora 模型训练能直出较高质量的形象,但对于要求高的场景仍有问题,如四肢比例失调、手指数量错误等,随着 SDXL 大模型的更新,这些问题有望解决。目前 AIGC 工具存在问题,仍需专业设计师大量介入与修复,但它是设计师的强大辅助工具。 对于人物服装的选择,可使用万能固定句式“「主题」+「风格」+「材质」+「元素」+「玄学佐料」”来尝试。例如,服装示例咒语关键词:Chinese dress,生成思路:一个穿着中国清代宫廷刺绣旗袍,宽袖渐变红色加上刺绣雪纺面料,镶钻工艺,上面还有金丝雀和白玫瑰元素等刺绣元素。添加材质装饰细节后服装会更精致。 在【SD】商业换装中,可通过以下步骤进行: 1. 在扩展面板中使用网址安装 Segment Anything,guthub 地址:https://github.com/continuerevolution/sdwebuisegmentanything。 2. 重启后安装 SAM 模型,github 上有三个 SAM 模型,由大到小分别是 vit_h,大部分情况下选择 vit_l 即可。 3. 将下载好的 SAM 模型放在指定路径下。 4. 测试 SAM 模型效果,左键点击要保留的部分打上黑点,右键点击不要的部分打上红点,双击不需要的点可移除。 5. 预览分离结果,选择合适的蒙版进行服装或背景替换。 6. 点开“展开蒙版设置”,设定蒙版扩展量,建议 30,然后点击发送到“重绘蒙版”。
2025-02-16