Navigate to WaytoAGI Wiki →
Home/All Questions
我想配置一台可以跑SD的电脑 我该怎么选择?
如果您想配置一台可以跑 SD(Stable Diffusion)的电脑,以下是一些选择建议: 1. 系统要求:系统需为 Win10 或 Win11。查看电脑系统的方法是在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格。 2. 配置查看: 查看电脑运行内存: 打开任务管理器(同时按下 ctrl+shift+esc)。 查看电脑运行内存,8GB 运行内存可以勉强运行 SD,推荐 16GB 以上运行内存。 查看电脑显卡内存(显存): 鼠标右击桌面底部任务栏,点击“任务管理器”。 查看“GPU”,首先先看右上角显卡的名字或者型号,必须确认是 NVIDIA(俗称 N 卡)。 接着看到下面划线的专用 GPU 内存,4GB 显存可运行 SD,推荐 8GB 以上显存。 3. 配置达标情况: 电脑运行内存 8GB 以上。 是英伟达(NVIDA)的显卡。 显卡内存 4GB 以上。 4. 配置不够的选择:如果配置不够,可选择云端部署(Mac 也推荐云端部署)。 Win 系统 SD 安装教程:https://qa3dhma45mc.feishu.cn/wiki/D5nawAs1fivF4ykx88ucRIYwn1d SD 云端部署教程:https://qa3dhma45mc.feishu.cn/wiki/A6WYw1Nm0ikGplkuO9Ecwomqnnd 5. 备选:如果觉得 SD 太难,可先试试简单的无界 AI:
2024-12-02
在线ai换脸
以下是关于在线 AI 换脸的相关内容: 使用 FaceFusion 进行 AI 换脸的步骤: 1. 打开快捷工具中的 JupyterLab。 2. 点击顶部的“+”号选项卡,新打开一个终端窗口。 3. 在终端区域启动终端选项卡。 4. 在终端窗口中输入以下命令: 输入“ls”并按回车,查看文件列表。 输入“cd facefusion”并按回车,进入 facefusion 目录。 输入“python./run.py executionproviders cuda cpu”启动程序。(注意:后面的参数“executionproviders cuda cpu”非常重要,如果不加 cuda,则默认不使用 GPU 能力,推理将非常慢。) 5. 当出现提示信息时,说明启动成功。 6. 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,会打开新的浏览器窗口,通过 web 浏览器访问 facefusion 提供的 UI 界面。 7. 在 facefusion 软件界面上传准备好的图片、视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。 8. 执行完成后,在输出位置会出现处理后的视频,输出窗口右上角有下载按钮,可导出变量后的视频到本地。 相关辅助工具: 1. FaceFusion:一款面部交换和面部增强的开源软件,可以在本地运行。不仅能将源图像中的面部与目标图像或视频中的面部进行交换,还提供多种面部和帧处理器以改进或定制面部特征。1.1.0 版本更新增加了摄像头功能,可以进行实时换脸和面部改造。有多种选项和参数允许用户定制,内置检查机制防止用于不道德或非法用途。开源地址:https://github.com/facefusion/facefusion 。 2. Xpression Camera:实时 AI 换脸应用,适用于视频聊天和直播流。只需一张照片就可以立即转变成任何人或任何有面部的事物。 实现方式: 1. 本机解决方案:此软件需要 python 环境及安装视频解码器等多个依赖软件,有一定编程知识要求。且 facefusion 的运行推理计算速度依赖 GPU,本地计算机若无 GPU 或 GPU 显存较小,执行速度会很慢。 2. 云服务解决方案:可利用云厂商如阿里云的 PAI 和 AutoDL 已提供的大模型运行环境和计算能力,但会产生一定费用。以 AutoDL 为例,注册完成后在算力市场中选择能接受价格的算力服务器,建议选取 GPU 配置更高的算力设备。在算法社区查找 facefusion 镜像,使用已制作好包含所需环境软件安装的镜像,点击创建实例按钮启动实例。
2024-12-02
AGI怎么实现?
AGI 的实现是一个复杂且尚未有明确路径的过程,以下是一些相关的观点和进展: 在生成式 AI 的下一个阶段,推理研发成果将深入渗透到应用层,自主应用程序的复杂性和稳健性会提升。但在特定领域,获取真实世界数据并构建特定认知架构仍是巨大挑战,“最后一公里”的应用提供商可能更具优势。多代理系统可能成为建模推理和社会学习过程的主流方式,当 AI 能够执行工作,将能组建团队完成更多任务。期待生成式 AI 出现类似 AlphaGo 出人意料的表现,这或许就是 AGI,但它是技术发展的阶段而非单一奇迹。 扎克伯格宣布 Meta 致力于实现 AGI,为此将两大 AI 研究团队合并,并投入超 90 亿美元采购英伟达显卡。但对于通用人工智能的定义和实现时间,扎克伯格没有明确答案。Meta 正在开发 Llama 3 大语言模型以提升代码生成和逻辑推理能力,且扎克伯格推动开源的通用人工智能开发方式。 Deepmind 研究团队提出 AGI 定义的六个原则,其中重要的是“关注能力,而非过程”,AGI 系统不需要像人类一样思考或理解,其定义应包括多个级别,每个级别有明确度量标准和基准。一个常见且合理的定义是:AGI 是在大多数具有经济价值的工作中超越人类能力的自主系统,Andrej Karpathy 曾在博客中以自动化交通服务类比 AGI 及其经济价值。
2024-12-02
WaytoAGI是干啥的
WaytoAGI 是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。它于 2023 年 4 月 26 日诞生,在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量。这里是很多 AI 爱好者知识的源头,社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。WaytoAGI 就是通往 AGI 之路,打开“waytoagi.com”就可以找到社群,欢迎大家来玩。它不仅是一个知识库,还是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。
2024-12-02
搭建ai agent需要几步
搭建 AI Agent 一般可分为以下 3 个步骤: 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 例如在使用扣子 Coze 平台创建时,还可以通过简单 3 步创建智能体:首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像即可。
2024-12-02
找一个国内可以文生视频的ai工具 免费的
以下是一些国内可以文生视频且免费的 AI 工具: Hidreamai:https://hidreamai.com//AiVideo ,支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA:https://etna.7volcanoes.com/ ,由七火山科技开发,能根据用户简短的文本描述生成相应的视频内容,生成的视频长度在 8~15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina:https://jimeng.jianying.com/aitool/video/generate ,处于国内内测,有免费额度,支持文生视频、图生视频、视频生视频,提示词使用中文、英文都可以,文生视频支持多种控制和尺寸选择,默认生成 3s 的视频。 可灵:https://klingai.kuaishou.com/ ,支持文生视频、图生视频,提示词可使用中文,文生视频支持多种控制和尺寸选择,默认生成 5s 的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-02
我需要一份提示词给sd使用,希望生成的内容达到要求展现自然美景,如山脉、海洋、森林等,用视 觉作品捕捉大自然的壮丽与宁静,体现人与自然的和谐共处
以下是为您提供的用于 Stable Diffusion 生成自然美景(如山脉、海洋、森林等),体现人与自然和谐共处的提示词示例及相关技巧: 提示词示例: masterpiece, best quality, ultradetailed, illustration, closeup, straight on, face focus, natural beauty, mountains, ocean, forest, serenity, harmony between human and nature, sunlight, clear sky, greenery, wildflowers, people enjoying the scenery 提示词技巧: 1. 一般而言,概念性的、大范围的、风格化的关键词写在前面,如“masterpiece”“best quality”“ultradetailed”“illustration”。 2. 叙述画面主题内容的关键词其次,如“natural beauty”“mountains”“ocean”“forest”。 3. 描述细节的关键词放在后面,如“sunlight”“clear sky”“greenery”“wildflowers”。 4. 可以使用括号人工修改提示词的权重,例如“将权重减少为原先的 25%”。 5. 关键词最好具有特异性,措辞越不抽象越好,尽可能避免留下解释空间的措辞。 在生成图像时,您还需要注意以下设置: 1. 选择合适的模型,例如 anythingV5 这个专门用于二次元绘画的大模型。 2. 采样迭代步数通常控制在 20 40 之间,步数越高绘画越清晰,但绘画速度也会越慢。 3. 选择常用的采样方法,如 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++ SDE Karras、DDIM。 4. 将比例设置为 800:400,注意尺寸并非越大越好,模型的练图基本按照 512x512 的框架去画,高宽比尽量在这个数值附近。如果想要高清的图,可以同时点选高清修复来放大图像倍率。 您还可以使用自动写提示词脚本 One Button Prompt 来获取更多灵感,在主菜单中设定主题为“风景”,正向提示词给一个“房子”,然后点击“生成一些提示词”,对生成的提示词进行修改调整。
2024-12-02
如何做到精通ai技术
要精通 AI 技术,您可以从以下几个方面入手: 1. 掌握基础理论: 了解人工智能、机器学习、深度学习的定义及其之间的关系。 简要回顾 AI 的发展历程和重要里程碑。 2. 夯实数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等基本概念。 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 3. 熟悉算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:了解其基本概念。 4. 学会评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习使用网格搜索等技术优化模型参数。 5. 深入神经网络基础: 网络结构:理解包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等基本结构。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,若您偏向技术研究方向,还需掌握: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 若您偏向应用方向,则需要: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-12-02
近期典型的企业大模型应用案例有什么
以下是近期典型的企业大模型应用案例: 彭博发布了金融领域的大模型 BloombergGPT,应用于其所在的垂直领域。 医联发布了内首款医疗大语言模型 MedGPT,可在真实医疗场景中发挥实际诊疗价值。 在解决大模型落地难的问题方面: 提高内容可信:如周伯文认为应做具备通用能力的大模型,并通过商业交付、反馈和评测来解决;中国科学院院士张钹指出 ChatGPT 没有自我学习能力,需用更多数据优化以解决实际应用问题;旷视科技物流业务事业部的负责人徐庆才提到大模型走向垂直化以提高内容精准度。 解决算力成本高、训练重复和资源紧缺的问题:一家 AI 算力公司联合创始人张新提到以 GPT3 模型为例,训练成本高昂,且全行业训练卡涨价,目前仍无法用商业化的国产芯片进行大模型训练。 此外,2024 年 7 月 12 日的《》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用,案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场,AI 智能体和知识库成为提升大模型落地实效的关键手段。 相关报告还有: 《》 《》 《》
2024-12-02
想用ai分析长视频,把视频内容作总结,且能提取视频文字
如果您想用 AI 分析长视频并提取视频文字、总结视频内容,可以按照以下步骤进行: 1. 对于有字幕的 B 站视频: 确认视频栏下有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。 安装油猴脚本: 。 安装后刷新浏览器,点击字幕会出现“下载”按钮,可选择多种字幕格式,带时间或不带时间的。 将下载的字幕文字内容全选复制发送给 GPTs 进行总结。 2. 对于 MMVid 这类集成的视频理解系统: 由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能处理和理解长视频和复杂任务。 能够自动识别和解释视频中的元素,如人物行为、情感表达、场景变化和对话内容,从而实现对视频故事线的理解。 其核心功能是将视频中的多模态信息(如视觉图像、音频信号和语言对话)转录成详细的文本脚本,以便大语言模型理解视频内容。 需要注意的是,目前大部分用 AI 总结视频的工具/插件/应用都是通过获取视频字幕来实现的。总结完视频内容之后您还可以继续向 AI 提问更多细节内容或者与它探讨视频内容。
2024-12-02