直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
AI的终极形态
AI 的终极形态可能是人形机器人。以下是一些原因: 1. 具身智能的本体多样,包括机器人、汽车、无人机、玩具等,但在目前的 ANI 阶段只能执行单一任务。随着 AI 发展到 AGI 阶段,人形机器人有望成为最终形态。 2. 人形机器人具有诸多优点: 遵循自然的高效设计,如直立行走解放双手,还能弥补人类身体缺憾,使用多种光学传感器。 适应人类环境,因其构造可自然适配人类设计的环境和工具。 人机交互更自然,具有相似外观和行为模式,易被用户接受,降低用户习惯培养成本,使用户更注意言行减少硬件损坏。 数据可获得性高,其身体结构与人类相似,大量人类运动视频经标注可成为训练数据。 此外,鉴于人工智能的神经网络基础,专家 AI 可能通过元学习更快获得知识并促进人类进步。AI 行业的终极目标是实现 AGI,期望仅靠简单指令就能以媲美或超越人类的智力执行任何任务,但当前大模型处理多步骤复杂任务存在局限,如在“数据分析图表、剧情游戏”等任务中,即便先进的模型仅靠单一 Prompt 指令也难以稳定执行,现阶段的 AI Agent 更像缺乏独立解决问题能力的职场新人。
2024-12-02
如何做自己的大模型
要做自己的大模型,以下是一些关键步骤和要点: 一、理解大模型 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU更合适,只有购买得起大量GPU的才有资本训练。 2. 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 3. 找老师:选择合适的算法让大模型更好理解Token之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:完成就业指导后,进行如翻译、问答等工作,在大模型里称为推导(infer)。 Token被视为模型处理和生成的文本单位,可代表单个字符、单词、子单词等,在将输入进行分词时,会对其进行数字化,形成词汇表。 二、部署和训练自己的大模型的主要步骤 1. 选择合适的部署方式 本地环境部署 云计算平台部署 分布式部署 模型压缩和量化 公共云服务商部署 根据自身的资源、安全和性能需求选择。 2. 准备训练所需的数据和计算资源 确保有足够的训练数据覆盖目标应用场景。 准备足够的计算资源,如GPU服务器或云计算资源。 3. 选择合适的预训练模型作为基础 可以使用开源的预训练模型如BERT、GPT等。 也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练 根据具体应用场景对预训练模型进行微调训练。 优化模型结构和训练过程以提高性能。 5. 部署和调试模型 将训练好的模型部署到生产环境。 对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护 大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 三、Lora 生图 在 Lora 生图中,点击预览模型中间的生图会自动跳转到相关页面。模型上的数字代表模型强度,可在 0.6 1.0 之间调节,默认为 0.8。也可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。VAE 不需要替换,正向提示词输入所写的提示词,可以选择基于这个提示词一次性生成几张图,选择生成图片的尺寸(横板、竖版、正方形)。采样器和调度器新手小白可以默认,迭代步数在 20 30 之间调整,CFG 在 3.5 7.5 之间调整,随机种子 1 代表随机生成图。 如果有满意的生成结果,想要微调或高分辨率修复,可以复制随机种子,粘贴到相应位置,下次生成的图会近似。如果确认了合适的种子和参数,想要高清放大,可点开高清修复,选择放大倍数,新手小白可默认算法,迭代步数建议在 20 30 之间,重回幅度在 0.3 0.7 之间调整。 今日作业 按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd
2024-12-01
给我能够帮助阅读的AI
以下是一些能够帮助阅读的 AI 相关内容: 小七姐提到,若想让 AI 像“樊登读书”或“得到”那样讲书,可设计一个“书籍阅读助手”的 Prompt,将通用读书方法论复刻其中,并根据不同类型书籍测试优化迭代。若想让 AI 在“选书”和“督促读书”环节起作用,可做一个“催我读书”的 Prompt,重点研究选书和激励效果。若侧重读完书后的知识内化,要研究读书效率和信息转化,注重结构化信息能力及有效记忆存储和调取。 一泽 Eze 推荐按照教程给自己定制一个稍后读 AI 智能体来自动管理阅读计划。他在学习 AI 时,因新内容多来不及看,起初将文章丢进微信文件传输助手,但出现分不清阅读状态和遗忘收藏原因等问题。调研常见稍后读解决方案后,发现它们存在与个人知识管理体系不合或步骤复杂等不足,于是想到定制 AI 稍后读助手来摆脱归纳工作,自动整理阅读清单并按个人兴趣推荐阅读计划。
2024-12-01
pytorch跟cuda之间的关系
PyTorch 与 CUDA 之间存在密切的关系。在 AI 相关的应用中,如果使用 GPU 来处理数据以提高运算速度,通常会用到 CUDA 技术。而 PyTorch 要想利用 CUDA 进行加速运算,必须对应 CUDA 支持的版本,否则程序无法正确运行。 例如,目前 CUDA 官网最新的版本是 12.4,需要找到配套的 PyTorch 版本。对于 CUDA 12.1,实测可以匹配 CUDA 12.4。如果没有 N 卡,也可以用 CPU 代替 CUDA 进行运算处理,但速度会相对较慢,并且在代码中需要做相应调整。
2024-12-01
AI遇冷
AI 领域曾经历多次起伏,例如出现过“AI 冬天”的情况。“AI 冬天”指的是 AI 领域长时间获得有限资金支持,且不被严肃研究者过多关注的时期,曾发生在 70 年代和 80 年代,以及从 80 年代中期至大约 2000 年代末。OpenAI 的 Sam Altman 认为可能会有新的“AI 冬天”,但短期内不太可能,因为当前范式的经济价值及还能推动的程度能在未来多年支持发展。他似乎非常确信互联网上有足够数据训练 AGI 系统,甚至可能已构建或接近构建 AGI 系统,且 AGI 不再是目标。此外,OpenAI 正在使用新的缩放范式如基于“Chinchilla 缩放法则”来弥补模型的差距,Chinchilla 是 DeepMind 在 2022 年初公布的模型,其研究表明更多计算资源和数据能大幅提升性能,无需增加参数。
2024-12-01
AI提示词
以下是关于 AI 提示词的相关内容: 在舞蹈音乐方面,有 108 个用于生成 AI 舞曲的提示词,例如“Punchy 4/4 beats,electro bass,catchy synths,pop vocals,bright pads,clubready mixes,energetic drops”。其中,Punchy 4/4 beats 指节奏感强的四四拍鼓点;Electro bass 指电子低音;Catchy synths 指易于记住的合成器旋律或音效;Pop vocals 指流行音乐风格的主唱;Bright pads 指明亮的和弦音效;Clubready mixes 指适合在夜店播放的混音;Energetic drops 指高潮部分。每个提示词精心制作,以封装各种舞蹈音乐流派的特点和大气质量,并适应不同的聆听环境。 对于 SD 新手入门的提示词,有以下相关资源: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru:
2024-12-01
AI agent和Bots有什么区别
AI agent 和 Bots 的区别主要体现在以下几个方面: 1. 能力和自主性: Bots(聊天机器人)具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 Agent(智能体)不仅具备推理能力,还能执行全自动化业务,具有更强的独立性和执行复杂任务的能力。 2. 核心功能: Copilot(类似于副驾驶、助手)更多地依赖于人类的指导和提示来完成任务,功能很大程度上局限于在给定框架内工作。 Agent 像一个主驾驶,具有更高的自主性和决策能力,能够根据目标自主规划整个处理流程,并根据外部反馈进行自我迭代和调整。 3. 流程决策: Bots 往往依赖于人类确定的静态流程,参与更多是在局部环节。 Agent 解决问题的流程是由 AI 自主确定的动态流程,不仅可以自行规划任务的各个步骤,还能够根据执行过程中的反馈动态调整流程。 4. 应用范围: Bots 主要用于处理一些简单的、特定的任务,更多是作为一个工具或者助手存在,需要人类的引导和监督。 Agent 能够处理复杂的、大型的任务,并在 LLM 薄弱的阶段使用工具或者 API 等进行增强。 5. 开发重点: Copilot 主要依赖于 LLM 的性能,开发重点在于 Prompt Engineering。 Agent 同样依赖于 LLM 的性能,但开发重点在于 Flow Engineering,即在假定 LLM 足够强大的基础上,把外围的流程和框架系统化。
2024-12-01
AI agent和Bots有什么区别
AI agent 和 Bots 的区别主要体现在以下几个方面: 1. 功能和能力: Bots(聊天机器人)具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 AI agent(智能体)不仅具备推理能力,还能执行全自动化业务,具有更强的独立性和执行复杂任务的能力。 2. 核心功能: Bots 更像是辅助驾驶员,更多地依赖于人类的指导和提示来完成任务,功能很大程度上局限于在给定框架内工作。 AI agent 像一个主驾驶,具有更高的自主性和决策能力,能够根据目标自主规划整个处理流程,并根据外部反馈进行自我迭代和调整。 3. 流程决策: Bots 在处理流程方面,往往依赖于人类确定的静态流程,参与更多是在局部环节,而不是整个流程的设计和执行。 AI agent 解决问题的流程是由其自主确定的动态流程,不仅可以自行规划任务的各个步骤,还能够根据执行过程中的反馈动态调整流程。 4. 应用范围: Bots 主要用于处理一些简单的、特定的任务,更多是作为一个工具或者助手存在,需要人类的引导和监督。 AI agent 能够处理复杂的、大型的任务,并在大语言模型薄弱的阶段使用工具或者 API 等进行增强。 5. 开发重点: Bots 的开发重点在于 Prompt Engineering。 AI agent 的开发重点在于 Flow Engineering,即在假定大语言模型足够强大的基础上,把外围的流程和框架系统化。
2024-12-01
你是一名医疗器械销售,就职于一家跨国医疗企业。公司目前就“我们是否应该立刻全面拥抱人工智能技术”组织了一场辩论赛,你持反方论点,即“我们不应该立刻全面拥抱人工智能技术”。 请你结合社会时事热点,设计5个以上刁钻问题给对方,要求举出实例。 此次辩论赛的听众中有公司高层和全体同事,请注意避免不友好及不利于公司形象的言论。
以下是为您设计的一些刁钻问题: 1. 目前人工智能在医疗领域的误诊案例时有发生,比如某些智能诊断系统对复杂病症的判断失误,导致患者延误治疗,这难道还能让我们立刻全面拥抱它吗? 2. 人工智能技术在医疗数据安全方面存在诸多隐患,像近期发生的多起医疗数据泄露事件,给患者带来极大困扰,在这种情况下,怎么能立刻全面拥抱? 3. 人工智能在医疗器械的研发中,由于算法偏见,可能会导致某些特定人群无法受益,例如某些心脏起搏器的智能调控系统对特定体质患者效果不佳,这能说明应该立刻全面拥抱吗? 4. 当下人工智能技术的高昂成本使得许多医疗机构望而却步,比如一些小型医院根本无力承担智能医疗设备的购置和维护费用,这难道不影响全面拥抱的可行性吗? 5. 人工智能在医疗领域的法规和监管还不完善,比如某些智能手术机器人的操作规范尚未明确,一旦出现问题,责任难以界定,这样能立刻全面拥抱吗? 6. 虽然人工智能在某些方面提高了医疗效率,但也导致了部分医疗人员的失业,引发社会就业问题,这难道不是我们需要谨慎对待、不能立刻全面拥抱的原因吗?
2024-12-01
你是一名医疗器械销售,就职于一家跨国医疗企业。公司目前就“我们是否应该立刻全面拥抱人工智能技术”组织了一场辩论赛,你持反方论点,即“我们不应该立刻全面拥抱人工智能技术”。 请你结合社会时事热点,设计5个以上刁钻问题给对方。 此次辩论赛的听众中有公司高层和全体同事,请注意避免不友好及不利于公司形象的言论。
以下是为您设计的一些刁钻问题: 1. 当下人工智能技术在医疗领域的应用仍存在诸多伦理和法律争议,比如医疗数据的隐私保护问题尚未得到妥善解决,在这种情况下,如何能立刻全面拥抱? 2. 人工智能技术在医疗器械的诊断中可能会出现误判,而医疗事故往往关乎生命,如何确保在立刻全面拥抱的情况下避免这些严重后果? 3. 目前人工智能技术的发展还不够稳定,时常面临技术更新和升级的问题,这会导致医疗器械的频繁变动和成本增加,这一现实如何应对? 4. 社会时事热点中不乏人工智能技术被滥用的案例,比如虚假医疗信息的传播,如何保证在立刻全面拥抱人工智能技术时不出现此类问题? 5. 人工智能技术的广泛应用可能会导致部分医疗工作者失业,引发社会就业结构的不稳定,这一风险如何化解? 6. 近期有报道指出人工智能技术存在被黑客攻击的风险,从而威胁患者的医疗信息安全,在这种情况下立刻全面拥抱是否明智? 7. 人工智能技术在医疗器械中的应用需要大量的资金投入,而目前公司的财务状况是否能够支撑立刻全面的投入和应用? 8. 社会时事热点中,一些人工智能技术的应用缺乏人性化关怀,在医疗这种关乎人性和情感的领域,立刻全面拥抱是否合适?
2024-12-01