Navigate to WaytoAGI Wiki →
Home/All Questions
文字生成图片
以下是关于文字生成图片的相关信息: 文生图工具是利用人工智能技术通过分析输入的文本描述,使用深度学习算法生成相应图片的工具。目前市场上一些受欢迎的文生图工具包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 AIGC(人工智能生成内容)是利用人工智能技术生成各种类型内容的应用方式,在内容创作、广告、媒体等领域广泛应用。在图像生成方面,包括使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 图片 API 提供了三种与图片交互的方法: 1. 根据文本提示从头开始创建图像。 2. 根据新文本提示创建现有图像的编辑。 3. 创建现有图像的变体。 本指南涵盖了使用这三个 API 端点的基础知识以及有用的代码示例。要查看实际效果,可查看。随着对使用和容量要求的更多了解,默认速率限制将提高。
2024-08-19
如何本地部署AI
以下是本地部署 AI 的两种方法: 方法一:张梦飞的【保姆级】一步一图,手把手教你把 AI 接入微信的部署步骤 1. 点击菜单中的“终端”,开始粘贴代码。每次只需要粘贴一行,然后点击一次回车。只有最左边显示中括号时,才是上一个命令执行完毕。若粘贴不进去,可试试 shift+ctrl+v 粘贴。 第一步:cd /root || exit 1 第二步:下方两行粘贴进入,然后点击回车,等待下载完成。若有卡点,可能是服务器网络问题,可复制网址手动下载到电脑,进入文件夹找到 root 文件夹上传文件。 第三步:rm f Anaconda32021.05Linuxx86_64.sh 第四步:/root/anaconda/bin/conda create y name AI python=3.8 第五步:依次粘贴并回车以下代码 第六步:执行完成后,刷新重新进入终端,若最左侧出现(AI)字符则成功。 第七步:继续依次粘贴并回车:cd /root 第八步:git clone https://github.com/zhayujie/chatgptonwechat ,注意一定要粘贴完整。 第九步:若出现相应样子则成功,失败或没反应可刷新重试。 第十步:继续依次输入:cd chatgptonwechat/ 、pip install r requirements.txt 、pip install r requirementsoptional.txt 、pip3 install zhipuai 第十一步:到“文件”菜单中,点击文件找到 root,进入 root 文件夹,找到 chatgptonwechat 文件夹并进入。 第十二步:点击文件夹上方功能栏中的【终端】(不是左侧一级菜单里的终端),粘贴并回车:cp configtemplate.json config.json ,点击后关闭弹窗。 第十三步:刷新页面,在当前目录下找到 config.json 文件,修改红框标注的地方。 方法二:适用于 JavaScript 的 AI 堆栈入门的部署 使用 Fly.io 进行部署,因为它是多区域的、易于管理,并提供一个非常通用的计算环境(任何可以在容器中运行的东西)。随着时间的推移,许多 AI 项目最终会使用多种编程语言和/或在后端具有非平凡的功能,因此 Fly.io 是在 JavaScript 本地托管环境(如 Vercel 或 Netlify)和传统云之间的一个很好的折衷选择。话虽如此,如果您希望选择其他托管环境,该代码也很容易支持。Fly.io 很快还将提供 GPU,用于需要托管自己的模型的情况。
2024-08-19
人工智能分类
人工智能主要分为以下几类: 1. 按照智能程度划分: ANI(Artificial Narrow Intelligence,弱人工智能):只能完成特定的一项任务,例如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。 AGI(Artificial General Intelligence,通用人工智能):能够完成任何人类可以做的事情,但目前还未取得巨大进展。 2. 在 Generative AI 的开发工具和基础设施方面: Orchestration(编排):涉及如 DUST、FIAVIE、LangChain 等公司,提供帮助开发人员管理和协调各部分及任务的工具,确保系统流畅运行。 Deployment, Scalability, & PreTraining(部署、可扩展性和预训练):包括 UWA mosaicm、NMAREL、anyscale 等公司,提供部署模型、保证可扩展性及预训练的工具。 Context & Embeddings(上下文和嵌入):有 TRUDO、Llamalndex、BerriAI 等公司,提供处理和理解语言上下文及词语和句子转化为计算机可理解形式的工具。 QA & Observability(质量保证和可观察性):例如 Pinecone、drant、Vald 等公司,提供确保模型表现和监控模型性能及状态的工具。 3. 关键词接龙中的分类: 主体描述:Monkey, kpop monkey, thinker, Millennials, kpop girl, Buddha 环境与构图:cliff, Temple, post apocalyptic 背景:zen art, Art deco, vaporwave, pink moon, International version of the film effect, steampunk 光线:ethereal pink, pink moon 视角:Twist fantasy, Double Exposure 构图:levitating, jouy print 风格:Hiroshi Sugimoto, Edward Hopper, V for Vendetta, Vaporwave, Celadon green 艺术家:Hiroshi Sugimoto, Edward Hopper
2024-08-19
ai的发展史
AI 的发展历程大致如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论等。 2. 知识驱动时期(1970s 1980s):以专家系统、知识表示、自动推理为主要特点。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术得到广泛应用。 人工智能作为一个领域始于二十世纪中叶,最初符号推理流行并带来重要进展,如专家系统。但因从专家提取知识并转化为计算机可读形式复杂且成本高,20 世纪 70 年代出现“人工智能寒冬”。随着计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年“人工智能”常被用作“神经网络”的同义词。 此外,还有关于 AI 进化史的相关内容,如前神经网络时代、Machine Learning 的跃迁、开启潘多拉的魔盒;软件 2.0 的崛起,包括软件范式的转移和演化、Software 2.0 与 Bug 2.0;面向智能的架构,如 Infrastructure 3.0、如何组装智能、智能架构的先锋;一统江湖的模型,如 Transformer 的诞生、基础模型、AI 江湖的新机会;现实世界的 AI,如自动驾驶新前沿、机器人与智能代理;AI 进化的未来,如透视神经网络、千脑理论、人工智能何时能通用等。
2024-08-19
Agents协作的系统架构图应该怎么画
以下是关于绘制 Agents 协作的系统架构图的一些参考信息: 首先,了解 Agent 的基本框架,即“Agent = LLM + 规划 + 记忆 + 工具使用”。其中大模型 LLM 扮演了 Agent 的“大脑”。 规划方面,主要包括子目标分解、反思与改进。子目标分解能将大型任务分解为较小可管理的子目标来处理复杂任务,反思和改进则可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。 记忆分为短期记忆和长期记忆。短期记忆是将所有的上下文学习看成利用模型的短期记忆来学习;长期记忆提供了长期存储和召回信息的能力,通常通过利用外部的向量存储和快速检索来实现。 工具方面,不同的任务和场景需要选择合适的工具。 在生成式 AI 的人机协同中,分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,人与 AI 的协作流程有所差异。在 Agents 模式下,AI 完成大多数工作。 可以通过 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如,作为产品经理角色,可将产品功能设计需求通过 Agents 拆解成多个独立的任务,然后遵循不同的工作流,最后生成一份大致符合期望的输出结果,再进行修改完善。 此外,还可以参考一些实例探究,如提示 LLM 提供 100 个最新观察结果,并根据这些观测/陈述生成 3 个最重要的高层次问题,然后让 LLM 回答这些问题。规划和反应时要考虑主体之间的关系以及一个主体对另一个主体的观察,环境信息以树形结构呈现。
2024-08-18
大模型和知识库如何结合?
大模型和知识库的结合是一个关键问题。目前,大模型在通用知识方面表现出色,但对专业领域知识了解有限,这阻碍了其更广泛的应用。 运行几百亿个参数的大模型,存算一体的架构是较好的选择,能避免数据搬运。 把大模型和私域知识结合有以下 5 种方法,按对模型改造的侵入性从左到右依次为: 1. 重新训练:使用私域数据重新训练大模型。 2. 微调:用私有数据对大模型进行 finetuning。 3. RAG:将知识库里的知识搜索后送进大模型。 4. 关键词工程:写好提示词。 5. 加长 Context:当 Context 能无限长时,理论上可将相关知识和记忆都 prefill 到 Context 里。
2024-08-18
推荐几个任务管理形式的AI工具
以下为您推荐几个任务管理形式的 AI 工具: 1. Jira 和 Trello:这两款项目管理软件已开始集成 AI 功能,可辅助项目经理制定计划、分配任务、跟踪进度等。 2. 微软 Copilot:能集成到 Office 套件中,为项目文档撰写、编辑等提供 AI 助手功能。一些云存储服务如 Google Drive 也开始提供 AI 驱动的文档管理和协作功能。 3. 一些专门的风险管理和决策支持工具:可以帮助项目经理识别和分析项目风险,并提供决策建议。 4. 沟通和协作方面的 AI 助手:可辅助项目经理进行团队沟通协调、客户关系维护等。 5. 创意生成工具:如文心一格、Vega AI 等,可以帮助项目经理快速生成创意图像素材。 6. Taskheat:提供了直观且视觉化的任务管理方式,AI 助手功能和跨平台兼容性为用户带来便利和效率,但目前仅适用于 macOS、iPadOS 和 iOS 设备。 7. Dart:是一款擅长智能化处理任务管理的项目管理工具,功能包括路线图、日历视图以及文档处理等。其用户友好界面、AI 功能(如自动填充特性和子任务自动生成)以及高度自定义布局受到用户喜爱,还集成了生成性 AI(如 ChatGPT),在规划和任务创建方面为用户节约大量时间和精力。
2024-08-18
我想使用一个AI工具,来应对日常工作中的表格单据的统计和分析
以下是一些可用于应对日常工作中表格单据统计和分析的 Excel 相关 AI 工具: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,能让用户直接在 Excel 中利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:由微软推出,整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件。用户通过聊天形式告知需求,如数据分析或格式创建,Copilot 会自动完成任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户能通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 这些工具通过 AI 技术提升了 Excel 的数据处理能力,使用户能更高效地进行数据分析和决策。随着技术不断发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-08-18
midjouney 使用方法
Midjourney 的使用方法包括以下方面: 1. 模型个性化: 官方说明:每次写提示时,很多信息是“隐含的”,MJ 算法会用自身“偏好”填补空白,而模型个性化会学习您的喜好来填补。 要求:目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要约 200 个成对排名/喜欢才能生效。可在排名页面查看评分数量,或在 Discord 上输入/info。 使用方法:只需在提示后输入p,或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加“代码”,可分享让他人使用相应个性化效果。还可以使用s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。请注意,个性化目前不是稳定功能,会随更多成对排名而变化,且可能会有算法更新。 2. 生成卡通头像: 背景:之前有从零开始使用 Midjourney 并通过简单提示词生成图片的教程,现在教利用以图绘图功能生成迪斯尼卡通风格头像。 步骤:先选满意图片,在 Discord 社区的 Midjourney 服务器聊天栏点击+,上传文件选取图片并发送(记得点击回车或发送按钮)。然后点击图片在浏览器中打开,复制图片链接。使用链接加 prompt 提示词发送给 Midjourney 进行以图绘图。 3. 角色一致性功能: 使用方法:在提示后输入`cref URL`并附上一个人物图像的 URL,注意要在提示词后面,否则会报错。可以使用`cw`来修改参考“强度”从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。
2024-08-18
scref 使用指南
以下是关于 sref 的使用指南: 风格一致: 指南:垫图链接(可选择)+关键词+“sref” +图片链接+风格化参数+“v 6.0” 指令:url +关键词+“sref” + url +“sw” +“v 6.0” sw 风格化参数:用于控制整体的风格强度,默认为 100,数值范围为 参考多张图像风格:url 间使用空格隔开,权重代表不同参考风格的权重,如 sref url A::2 url B::3 url C::5 适用模型:V6 和 Niji V6 常见问题: 您可以在使用 Vary Region 期间使用 sref 来增强美学匹配/混合。 以下是如何在使用 Vary Region 时使用sref 图像来帮助加强风格的方法: 确保 remix 已打开。放大 点击。 保留提示中确定画布总体构图的部分。尽量保留尽可能多的部分,但不要耗尽内存。如果您的细节没有显示出来,那可能是内存问题。编辑提示以删除一些不必要的细节,以腾出空间添加新的细节。 将您的细节添加到提示中。 记得用一些详细的描述(至少 5 7 个词)描述它。 现在,您可以通过将基本图像用作 sref 来加强您的添加部分的风格(视觉美学)。右键单击放大后的图像中心,从下拉菜单中选择复制链接。将该链接添加为您的sref。 详细步骤: sref 参数允许我们使用通过 URL(地址链接)提供的现有图像或图像的大致视觉特征、美学和氛围创建新图像。 官方详细步骤地址:https://discord.com/channels/662267976984297473/1204491188539883571 请参阅以下的 1 2 3 步骤教程,以帮助您开始使用风格参考图像。 图像地址链接:whatnostop_A_textured_impasto_expressive_oil_painting_depicting_d63d1644 49b4 4831 95b1 486d05452313.png
2024-08-18