直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
本地 部署deepseek
DeepSeek 相关信息如下: DeepSeek 有多种含义,包括公司、网站、手机应用和大模型,尤其是具有推理功能的 DeepSeek R1 大模型,其权重文件开源,可本地部署。 模型方面,JanusPro 是一种新型自回归框架,将图像理解和生成统一在一个模型中,模型(7B):https://huggingface.co/deepseekai/JanusPro7B ,模型(1B):https://huggingface.co/deepseekai/JanusPro1B 。 联网版的实现方式:通过工作流+DeepSeek R1 大模型,需要拥有扣子专业版账号,开通 DeepSeek R1 大模型的访问地址为:https://console.volcengine.com/cozepro/overview?scenario=coze ,添加在线推理模型,添加后在扣子开发平台才能使用,还需创建智能体。 相关新闻: 《》提到 DeepSeek 最新模型 V3 与 R1 采用混合专家(MoE)架构,显著提升计算效率,挑战 OpenAI 的闭源模型。V3 引入多头潜注意力(MLA),将 KV 缓存压缩至新低,提升计算性能。R1 则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。 《》介绍了字节跳动推出的新技术 OmniHuman,利用单张图片和音频生成生动的视频,突破了传统技术的局限。 《》指出 DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。同时,AI 基础大模型的参数量迎来拐点,2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能。此外,报告强调 2025 年是算法变革的元年,DeepSeek 的推理模型开启了算法变革,其训练过程聚焦于强化学习,提升了模型的推理能力。
2025-02-07
ai绘画现在处于什么发展阶段
AI 绘画目前处于不断发展和演进的阶段。 在早期,AI 绘画的成果较为简单和粗糙。但随着技术的进步,尤其是深度学习算法如卷积神经网络等的应用,AI 绘画能够生成更加复杂、逼真和富有创意的图像,涵盖了各种风格和题材,从写实到抽象,从风景到人物。 AI 绘画在与人类艺术家的互动和融合中不断创新,为艺术创作带来了新的可能性和挑战。其场景应用广泛,包括广告设计、游戏开发、影视制作、建筑设计等领域。 然而,AI 绘画的发展也引发了一系列讨论和争议。例如,人们对于 AI 生成的艺术品和人类创作的艺术品的接受程度存在差异,AI 在表达情感和创造性意图方面存在局限性,同时也带来了版权、原创性和伦理等问题,以及对文化创意领域从业者职业安全的焦虑。 尽管存在争议,AI 绘画仍为艺术创作提供了新的工具和可能性,如帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动等。目前,生成式 AI 仍处于非常早期的阶段,为其寻找高价值应用场景或许还需要较长时间。
2025-02-07
comfyui
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,以下是关于它的详细介绍: 简介:可以想象成集成了 stable diffusion 功能的 substance designer,通过将 stable diffusion 的流程拆分成节点,实现更精准的工作流定制和完善的可复现性。 优劣势: 优势:对显存要求相对较低,启动速度快,出图速度快;具有更高的生成自由度;可以和 webui 共享环境和模型;可以搭建自己的工作流程,可以导出流程并分享给别人,报错时能清晰发现错误所在;生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势:操作门槛高,需要有清晰的逻辑;生态没有 webui 多(常用的都有),也有一些针对 Comfyui 开发的有趣插件。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档按照即可:https://github.com/comfyanonymous/ComfyUI 安装部署: 电脑硬件要求: 系统:Windows7 以上。 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 硬盘留有足够的空间,最低 100G 起步(包括模型)。 注:mac 系统,AMD 显卡,低显卡的情况也可以安装使用,功能不全,出错率偏高,严重影响使用体验个人建议升级设备或者采用云服务器玩耍。 下载并安装所需要环境: 依次下载并安装 python、Git、VSCode,安装过程中一直点击勾选对应选项,一直下一步。 安装 Python:https://www.python.org/downloads/release/python3119/ ,安装的时候选中“将 Python 添加到系统变量”。 安装 VSCode:https://code.visualstudio.com/Download 。 安装 Git:https://gitscm.com/download/win 。 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 。 地址:https://github.com/comfyanonymous/ComfyUI ,可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ,或者下载安装包 file:ComfyUI.zip ,下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动。启动完成即进入基础界面。 节点存放目录:comfyUI 的节点包括后面安装的拓展节点都存放在本目录下 D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 模型存放目录: 大模型:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 。 模型共用:已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可,这样就不用重复下载模型了。找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件,将后缀.example 删除,然后右键用记事本打开。
2025-02-07
生成名片的AI工具
以下是一些生成名片的 AI 工具: 一泽 Eze:只需 1 句提示词和 1 个品牌 Logo,就能通过 Claude Artifacts 生成超级符合品牌调性的创意名片。整个流程简单,输入 Prompt 和 Logo 即可。提示词已开源,若生成结果不符合预期,可尝试让模型重新生成或与 AI 对话提出修改意见。注意事项包括提示词主要用于设计符合品牌调性的创意名片,Logo 建议使用清晰、底图透明的 PNG 格式。 以下是一些生成 Logo 的 AI 产品: Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 Tailor Brands:AI 驱动的品牌创建工具,通过回答问题生成 Logo 选项。 Designhill:Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 LogoMakr:提供简单易用的设计工具,可利用 AI 建议的元素和颜色方案。 Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 LogoAI by Tailor Brands:根据输入的品牌名称和行业类别快速生成 Logo 设计方案。 标小智:中文 AI Logo 设计工具,利用人工智能技术创建个性化 Logo。 以下是一些设计海报的 AI 产品: Canva(可画):受欢迎的在线设计工具,提供大量模板和元素,AI 可帮助选择颜色搭配和字体样式。 稿定设计:智能设计工具,采用先进人工智能技术,自动分析和生成设计方案。 VistaCreate:简单易用的设计平台,提供大量模板和元素,可使用 AI 工具创建个性化海报,智能建议功能帮助找到合适元素。 Microsoft Designer:通过拖放界面快速创建内容,集成丰富模板库和自动图像编辑功能。
2025-02-07
推荐与 AI 会计、AI 金融相关的内容
以下是与 AI 会计、AI 金融相关的内容推荐: 在金融服务业方面,生成式 AI 除了能回答财务问题,还能改进金融服务团队的内部流程,简化财务团队日常工作。例如,它能从更多数据源获取数据,自动化突出趋势、生成预测和报告的过程,包括预测分析的自动化、报告的自动创建、为会计和税务团队提供帮助、协助采购和应付账款工作等。 100 个 AI 应用中,东方财富网投资分析工具是一个 AI 金融投资分析平台,利用数据分析和机器学习技术,分析金融市场数据,为投资者提供投资建议和决策支持。 AI 在金融服务领域的应用场景广泛,包括风控和反欺诈、信用评估、投资分析、客户服务等。例如,通过识别和阻止欺诈行为降低金融机构风险,评估借款人信用风险辅助贷款决策,分析市场数据助力投资者做出明智投资选择,提供 24/7 客户服务并回答常见问题。
2025-02-07
垂直领域大模型训练指南
以下是一份垂直领域大模型训练指南: 一、大模型入门 通俗来讲,大模型就是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。 大模型的训练和使用过程可以用“上学参加工作”来类比: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型更好理解 Token 之间的关系。 4. 就业指导:为了让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词等,具体取决于所使用的分词方法。在将输入进行分词时,会对其进行数字化,形成一个词汇表。 二、LLM 开源中文大语言模型及数据集集合 1. 医疗领域 XrayGLM:首个会看胸部 X 光片的中文多模态医学大模型。 地址: 简介:该项目发布了 XrayGLM 数据集及模型,在医学影像诊断和多轮交互对话上显示出非凡潜力。 MeChat:中文心理健康支持对话大模型。 地址: 简介:该项目开源的中文心理健康支持通用模型由 ChatGLM6B LoRA 16bit 指令微调得到,数据集通过调用 gpt3.5turbo API 扩展真实的心理互助 QA 为多轮的心理健康支持多轮对话,提高了通用语言大模型在心理健康支持领域的表现,更加符合在长程多轮对话的应用场景。 MedicalGPT 地址: 简介:训练医疗大模型,实现包括二次预训练、有监督微调、奖励建模、强化学习训练。发布中文医疗 LoRA 模型 shibing624/ziyallama13bmedicallora,基于 ZiyaLLaMA13Bv1 模型,SFT 微调了一版医疗模型,医疗问答效果有提升,发布微调后的 LoRA 权重。 三、100 基础训练大模型 步骤三·Lora 生图: 1. 点击预览模型中间的生图会自动跳转到相应页面。 2. 模型上的数字代表模型强度,可在 0.6 1.0 之间调节,默认为 0.8。 3. 可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。 4. VAE 不需要替换。 5. 正向提示词输入所写的提示词,可以选择基于这个提示词一次性生成几张图。 6. 选择生成图片的尺寸,包括横板、竖版、正方形。 7. 采样器和调度器新手小白可以默认不换。 8. 迭代步数可以按照需求在 20 30 之间调整。 9. CFG 可以按照需求在 3.5 7.5 之间调整。 10. 随机种子 1 代表随机生成图。 11. 所有设置都完成后,点击开始生成,生成的图会显示在右侧。 12. 如果有某次生成结果不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,下次生成的图就会和这次的结果近似。 13. 如果确认了一张很合适的种子和参数,想要高清放大,则点开高清修复,可以选择放大的倍数。新手小白可以默认算法,迭代步数建议在 20 30 之间,重回幅度根据需求在 0.3 0.7 之间调整。 今日作业:按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。 提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd
2025-02-07
coze
Coze 是由字节跳动推出的具有以下特点的产品: 1. 是一个 AI 聊天机器人和应用程序编辑开发平台,旨在简化 AI 机器人的开发过程,让开发者和非技术用户都能快速搭建基于 AI 模型的各类问答 Bot,处理从简单问答到复杂逻辑对话的任务。 2. 字节跳动旗下的子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent。 3. 目前可以白嫖海量的大模型免费使用,有丰富的插件生态。 4. 多语言模型支持,如使用 GPT48K 和 GPT4128K 及云雀语言模型等。 5. 拥有插件系统,集成超过 60 款插件,涵盖资讯阅读、旅游出行、效率办公、图片理解等功能,同时支持用户创建自定义插件。 6. 具备知识库功能,允许用户上传和管理多种格式的数据,并支持 Bot 与用户数据交互。 7. 提供数据库和记忆能力,允许 Bot 访问会话内存和上下文,持久记住用户对话中的重要参数或内容。 8. 支持工作流设计,用户可通过拖拉拽方式搭建工作流,处理复杂任务流,提供大量灵活可组合的节点。 9. 具有多代理模式,一个机器人中可运行多个任务,允许添加多个代理。 10. 对用户完全免费,且易于发布和分享,用户可将搭建的 Bot 发布到各类社交平台和通讯软件上。 此外,Coze 可以接入抖音评论区,帮用户自动回复评论。还有基于 Coze 平台能力搭建的记账管家应用,用户可直接和 Coze 说收入或支出情况,Coze 会自动记账并计算账户余额,且不会丢失记账记录。 如果您想了解更多关于 Coze 的内容,可参考以下文章:
2025-02-07
如何用免费的小程序文字生成视频
以下为免费的小程序文字生成视频的相关内容: Runway: 1. 网页:https://runwayml.com/ 2. 注册:右上角 Sign Up 注册,输入邮箱与基础信息,完成邮箱验证。 3. 免费模式:新注册用户有 125 个积分进行免费创作(约 100s 的基础 AI)。 4. 生成视频步骤: 选择左侧工具栏“生成视频”。 选择“文字/图片生成视频”。 将图片拖入框内。 选择一个动画系数。 点击生成 4 秒视频。 下载视频。 Pika: 1. 生成视频频道在 Discord 上,点击邀请链接加入频道:https://discord.gg/pika 。 2. 生成视频的步骤: 选择一个作画的频道。 输入“/”+指令,如/create 为文字生成视频指令,/animate 为图片生成视频指令,/encrypt_image 为图片+文字生成视频指令。 选择/create 文字生成视频,输入想要的内容描述。 选择/animate 图片生成视频,输入想要的图片(不能添加其他文字要求描述)或在 message 处输入想要的图片,并在 prompt 处添加描述。 3. 常用指令参数: gs xx:引导比例,较高的值使其与文本更相关(推荐范围为 8 24)。 neg xxx:负面提示(指定在视频中不希望出现的内容)。 ar xx:xx:宽高比(例如 16:9、9:16、1:1、4:5)。 seed xxx:生成过程中增加一致性的种子数。 motion xx:所需运动强度(仅支持 0/1/2)。 fps xx:视频的帧率。 此外,文字生成视频的 AI 产品还有: 1. SVD:熟悉 Stable Diffusion 可直接安装最新插件,在图片基础上直接生成视频,由 Stability AI 开源的 video model。 2. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 3. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 4. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-07
如何用文字生成视频
以下是关于文字生成视频的相关内容: 文字生成视频通常指使用人工智能技术将文本内容转换成视频的服务。一些国内外提供此类功能的产品有: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑,目前内测免费,生成服务托管在 discord 中。 功能:直接发送指令或上传图片生成 3 秒动态视频。 加入方式:在浏览器中打开链接 https://discord.gg/dmtmQVKEgt 加入邀请。在“generate”子区生成,输入/create 并在弹出的 prompt 文本框内输入描述,按 Enter 发送出去就能生成视频。本地图片生成则输入/create,在弹出的 prompt 文本框内输入描述,点击“增加”上传本地图片。 常用指令参数:gs xx(引导比例)、neg xxx(负面提示)、ar xx:xx(宽高比)、seed xxx(种子数)、motion xx(运动强度)、fps xx(帧率)。 2. SVD:熟悉 Stable Diffusion 可安装此最新插件,在图片基础上直接生成视频,由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。内容由 AI 大模型生成,请仔细甄别。
2025-02-07
生成图片
以下是关于生成图片的相关内容: ComfyUI Flux 与 runway 制作绘画视频: 提示词告诉 flux 生成一张技术草图,如 CAD。 在 runway 里面,使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧。 使用 flux 的 controlNet 为草图上色,depth 固定,Union 版本不建议权重调太高和结束时间太长。 分享了一个好玩的 how2draw Flux lora 展示绘画过程。 tune 风格(调音)修改器·语雀: 复制风格调谐器生成的代码,可使用 Parameter 添加到提示中。 回到不和谐,使用 /imagine 命令并将复制的提示和参数粘贴到 prompt 字段中生成图像。 可使用其他 Midjourney 工具如 Upscale、Pan、ZoomOut、Remix 或 VaryRegion 进一步增强图像。 SD 入门教程: 单张或几张调试参数时建议选择前面几种预览图设置,可看到生成过程中图片效果,感觉不对直接中断生成。 批量几百张生成时建议选最后那种速度最快的设置,因为不需要看预览图。 右键可进入无限跑图模式,有插件可解决无限跑图参数无法修改的痛点,如 https://github.com/ArtVentureX/sdwebuiagentscheduler ,方便上班族设置多组参数。
2025-02-07