「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
卷积神经网络
卷积神经网络,也称卷积网络(术语“神经”具有误导性),使用卷积层来过滤输入以获取有用信息。卷积层具有学习的参数,能自动调整滤波器以提取对应任务的最有用信息,例如在一般目标识别中过滤对象形状信息,在鸟类识别中提取颜色信息。通常多个卷积层用于在每一层之后过滤图像以获得越来越多的抽象信息。 卷积网络通常也使用池层,以获得有限的平移和旋转不变性,还能减少内存消耗,从而允许使用更多的卷积层。 最近的卷积网络使用初始模块,它使用 1×1 卷积核来进一步减少内存消耗,同时加快计算速度。 1998 年,Yann LeCun 和他的合作者开发了 LeNet 的手写数字识别器,后来正式命名为卷积神经网络。它在前馈网中使用反向传播,被用于读取北美地区约 10%的支票。卷积神经网络可用于从手写数字到 3D 物体的与物体识别有关的所有工作。 在 ImageNet 2012 年的 ILSVRC 竞赛中,来自多个机构的先进计算机视觉小组将已有的最好计算机视觉方法应用于包含约 120 万张高分辨率训练图像的数据集。
2025-03-02
AI小白应该如何开始入门AI
对于 AI 小白入门 AI,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 参考「」,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库分享实践后的作品和文章。 5. 体验 AI 产品: 与如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验。 此外,您还可以参考《雪梅 May 的 AI 学习日记》,其中提到: 1. 适合纯 AI 小白,可先看目录,作者从一开始的到处看到走在学习轨道上。 2. 学习模式是输入→模仿→自发创造,如果对费曼学习法没自信,可尝试这种模式。 3. 学习内容因 AI 节奏快可能不适用,可去 waytoAGI 社区发现自己感兴趣的领域,学习最新内容。 4. 学习时间不是每天依次进行,有空时学习即可。 5. 保持好的学习状态,能学多少算多少。 6. 学习资源免费开源。 另外,有人的 AI 之旅开始于 prompt,3.5 刚出来时,写好 prompt 能提高问问题和解决问题的效率,虽然将 prompt 规范、抽象用以让 AI 拟人较难,但参加相关活动和学习也有收获。
2025-03-02
自学AI路径
以下是新手自学 AI 的路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-02
多模态是什么
多模态是指多数据类型交互,能够提供更接近人类感知的场景。大模型对应的模态包括文本、图像、音频、视频等。 随着生成式 AI 和大模型的发展,我们逐渐进入多模态灵活转换的新时代,即利用 AI 实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换,这一变革依靠一系列革新性的算法。 在感知不同模态数据时,AI 不再局限于传统的单一模态处理方式,而是借助高维向量空间来理解数据,将图像或文字“压缩”成能够捕捉深层关系的抽象向量。 Gemini 模型本身就是多模态的,展示了无缝结合跨模态的能力,在识别输入细节、聚合上下文以及在不同模态上应用等方面表现出强大性能。
2025-03-02
用ai做PPT的网站
以下是一些用 AI 做 PPT 的网站: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单文本描述生成专业 PPT 设计,网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成等功能,网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 《》 《》 另外还有以下几款 PPT 生成工具(网站): http://Mindshow.fun 支持 Markdown 导入 http://kimi.ai 选 PPT 助手暂时免费效果好 http://Tome.app AI 配图效果好 http://Chatppt.com 自动化程度高 https://wenku.baidu.com 付费效果好
2025-03-02
现在AI应用都有哪些代表性的工具,请用表格展示出来
|序号|已有产品|主题|使用技术|市场规模|一句话介绍|项目功能| |||||||| |81|下厨房口味调整功能|AI 菜谱口味调整工具|自然语言处理、数据分析|数亿美元|根据用户反馈调整菜谱口味|下厨房的口味调整功能可根据用户对菜谱的评价,利用 AI 分析后给出口味调整建议,如增加甜度、减少辣味等| |82|英语流利说纠错功能|AI 语言学习纠错平台|自然语言处理、机器学习|数十亿美元|帮助语言学习者纠正错误|英语流利说通过 AI 技术识别用户在语言学习中的发音、语法等错误,并提供纠正建议和练习| |83|豆瓣电影剧情分析工具|AI 电影剧情分析系统|数据分析、自然语言处理|数亿美元|分析电影剧情,提供深度解读|豆瓣电影的剧情分析工具利用 AI 对电影剧情进行分析,为用户提供剧情解析、主题探讨等内容| |84|腾讯文档分类功能|AI 办公文件分类系统|数据分析、机器学习|数亿美元|自动分类办公文件,方便管理|腾讯文档利用 AI 对用户上传的文件进行分类,如合同、报告、方案等,提高文件管理效率| |85|美丽修行定制方案功能|AI 美容护肤方案定制平台|图像识别、数据分析|数亿美元|根据用户肤质定制护肤方案|美丽修行根据用户上传的照片和肤质信息,利用 AI 定制个性化的护肤方案,包括产品推荐和使用顺序| |91|游戏内商城推荐功能|AI 游戏道具推荐系统|数据分析、机器学习|数亿美元|根据玩家需求推荐游戏道具|在一些游戏中,利用 AI 分析玩家的游戏风格和进度,为玩家推荐合适的游戏道具,如武器、装备等| |92|彩云天气分时预报|AI 天气预报分时服务|数据分析、机器学习|数亿美元|提供精准的分时天气预报|彩云天气利用 AI 提供每小时的天气预报,帮助用户更好地安排出行和活动| |93|医渡云病历分析系统|AI 医疗病历分析平台|数据分析、自然语言处理|数十亿美元|分析医疗病历,辅助诊断|医渡云利用 AI 分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议| |94|讯飞听见会议总结功能|AI 会议发言总结工具|自然语言处理、机器学习|数亿美元|自动总结会议发言内容|讯飞听见在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理| |95|书法临摹软件|AI 书法作品临摹辅助工具|图像识别、数据分析|数亿美元|帮助书法爱好者进行临摹|书法临摹软件利用 AI 识别书法作品的笔画和结构,为用户提供临摹指导和评价| |7|AI 简历优化工具|超级简历优化助手|自然语言处理|数亿美元|帮助用户优化简历提高求职成功率|超级简历优化助手分析简历内容并提供优化建议| |8|酷家乐|AI 室内设计方案生成|图像生成、机器学习|数十亿美元|快速生成个性化室内设计方案|酷家乐允许用户上传户型图,通过 AI 生成多种设计方案| |9|Amper Music|AI 音乐创作辅助工具|机器学习、音频处理|数亿美元|协助音乐创作者进行创作|Amper Music 根据用户需求生成旋律和编曲| |10|松果倾诉智能助手|AI 情感咨询助手|自然语言处理、情感分析|数亿美元|提供情感支持和建议|松果倾诉智能助手通过文字或语音交流为用户提供情感咨询| |11|小佩宠物智能设备|AI 宠物健康监测设备|传感器数据处理、机器学习|数十亿美元|实时监测宠物健康状况|小佩宠物智能设备可监测宠物活动、饮食等,提供健康预警| |12|马蜂窝智能行程规划|AI 旅游行程规划器|数据分析、自然语言处理|数十亿美元|根据用户需求生成个性化旅游行程|马蜂窝智能行程规划根据目的地、时间等因素为用户定制旅游路线|
2025-03-02
实用至上:智能体 / Agent 是什么
智能体(Agent)在人工智能和计算机科学领域是一个非常重要的概念,指的是一种能够感知环境并采取行动以实现特定目标的实体,可以是软件程序,也可以是硬件设备。 智能体可以根据其复杂性和功能分为以下几种类型: 1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务;反思和完善,Agents 可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。 2. 记忆:短期记忆,所有的上下文学习都是利用模型的短期记忆来学习;长期记忆,这为 Agents 提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。 3. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。 随着 LLM 在几个关键能力上的成熟——理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。在执行过程中,智能体需要在每个步骤从环境中获取“基准事实”(如工具调用结果或代码执行情况)以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件(如最大迭代次数)以保持控制。 智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。LLM 可能需要运行多个回合,您必须对其决策能力有一定信任。智能体的自主性使其非常适合在可信环境中扩展任务,但智能体的自主性也意味着更高的成本和潜在的错误累积。我们建议在沙盒环境中进行广泛测试,并设置适当的防护措施。 以下是一些实用案例: 1. 用于解决 SWEbench 任务的编码智能体,根据任务描述对多个文件进行编辑:https://www.anthropic.com/research/swebenchsonnet 2. 我们的“计算机使用”参考实现,让 Claude 使用计算机完成任务:https://github.com/anthropics/anthropicquickstarts/tree/main/computerusedemo
2025-03-02
dify
Dify 是一个开源的大模型应用开发平台,具有以下特点和功能: 构建知识库的具体步骤: 准备数据:收集文本数据,包括文档、表格等格式,进行清洗、分段等预处理以确保数据质量。 创建数据集:在 Dify 中创建新数据集,上传准备好的文档,并编写良好的描述。 配置索引方式:提供三种索引方式(高质量模式、经济模式和 Q&A 分段模式),根据实际需求选择,如追求更高准确度可选高质量模式。 集成至应用:将数据集集成到 Dify 的对话型应用中,在应用设置中配置数据集的使用方式。 持续优化:收集用户反馈,对知识库内容和索引方式持续优化和迭代,定期更新知识库。 平台特点: 结合后端即服务和 LLMOps 理念,提供直观界面快速构建和部署生产级别的生成式 AI 应用。 具备强大的工作流构建工具,支持广泛的模型集成。 提供功能丰富的提示词 IDE 和全面的 RAG Pipeline 用于文档处理和检索。 允许用户定义 Agent 智能体,并通过 LLMOps 功能对应用程序性能进行持续监控和优化。 提供云服务和本地部署选项,满足不同用户需求。 开源特性确保对数据的完全控制和快速的产品迭代。 设计理念注重简单性、克制和快速迭代,为创业团队构建 MVP、企业集成 LLM 等提供支持和工具。 Dify 官方手册:https://docs.dify.ai/v/zhhans 。一般来说,如果是个人研究,推荐单独使用 Dify,如果是企业级落地项目,推荐使用多种框架结合,效果更好。
2025-03-02
网站生成器
以下是为您推荐的一些网站生成器工具: 1. 即时设计:https://js.design/ 这是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 以下是另外一些制作网站的 AI 工具: 1. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议;提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象;包含 SEO 和营销工具,帮助提升网站可见性和流量。 2. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可以自动生成网站布局和设计;提供一键迁移功能,将现有网站迁移到 10Web 平台;集成的 AI 驱动 SEO 分析和优化工具。 3. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题来定制网站;提供自动生成的内容和图像,帮助快速启动网站;包含电子商务功能,适合小型企业和在线商店。 4. Site123 网址:https://www.site123.com/ 特点:简单易用的 AI 网站构建工具,适合初学者;提供多种设计模板和布局,用户可以快速创建专业网站;包括内置的 SEO 和分析工具,帮助优化网站表现。 此外,还有一些图像类 Prompt 网站: 1. AIart 魔法生成器 网址:https://www.aiart.com.cn/?prompter/ 中文版的艺术作品 Prompt 生成器 2. IMI Prompt 网址:https://www.imiprompt.com/ 支持多种风格和形式的详细的 MJ 关键词生成器 3. MidJourney Prompt Tool 网址:https://prompt.noonshot.com/ 类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分 4. Prompt Hero 网址:https://prompthero.com/ 好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney 5. img2prompt 网址:https://replicate.com/methexisinc/img2prompt 根据图片提取 Prompt 6. PromptBase 网址:https://promptbase.com/ Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板 7. promptoMANIA 网址:https://promptomania.com/genericpromptbuilder/ AI 艺术提示词生成器 8. pictionAIry 网址:https://pictionairy.com/ 玩游戏也能练习 Prompt 书写 9. NovelAI tag 生成器 网址:https://wolfchen.top/tag/ 设计类 Prompt 提词生成器 10. 魔咒百科词典 网址:https://aitag.top/ 魔法导论必备工具,简单易用的 AI 绘画 tag 生成器 11. KREA 网址:https://search.krea.ai/ 设计 AI 的 Prompt 集合站,create better prompts 内容由 AI 大模型生成,请仔细甄别。
2025-03-02
LoRA训练
LoRA 训练主要包括以下步骤: 1. 创建数据集: 进入厚德云模型训练数据集,点击右上角创建数据集。 输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片后续使用自动打标功能,或者一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,预览数据集的图片以及对应的标签。 2. Lora 训练: 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 触发词可有可无,取决于数据集是否有触发词,模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 此外,郑敏轩提到的 Flux 的 Lora 训练还需要: 1. 下载相关模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 2. 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 3. 安装虚拟环境:下载完解压,在文件中找到 installcnqinglong.ps1 这个文件,右键选择“使用 PowerShell 运行”,新手点击“Y”,然后等待 1 2 小时的漫长下载过程,下好后最后会提示是否下载 hunyuan 模型,选择 n 不用下载。 在 AI 梦一丹一世界(下)2025 年 2 月 8 日副本中提到,参加相关比赛须用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。作图分三步,一是明确创作主题即锚点,根据 Lora 风格确定创作方向;二是确定主体,联想主体的角色设定;三是增加叙事感,让画面有一到两个及以上角色,制造反差和联想。好看的图片的构成因素包括构图、色彩以及光影,构图包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面),构图要素有主体、陪体、前景、背景、点线面,构图方式有点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。
2025-03-02