与知识库对话 - WayToAGI

直达「通往AGI之路」飞书知识库 →

首页/全部问答

RAG（RetrievalAugmented Generation，检索增强生成）是一种结合检索和生成能力的自然语言处理架构。通用语言模型通过微调可完成常见任务，而更复杂和知识密集型任务可基于语言模型构建系统，访问外部知识源来实现。Meta AI 引入 RAG 来完成这类任务，它把信息检索组件和文本生成模型结合，可微调且内部知识修改高效，无需重新训练整个模型。 RAG 接受输入并检索相关/支撑文档，给出来源（如维基百科），这些文档作为上下文和原始提示词组合给文本生成器得到最终输出，能适应事实随时间变化，让语言模型获取最新信息并生成可靠输出。大语言模型（LLM）存在一些缺点，如无法记住所有知识（尤其是长尾知识）、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有以下优点：数据库对数据的存储和更新稳定，无学习风险；数据更新敏捷，可解释且不影响原有知识；降低大模型输出出错可能；便于管控用户隐私数据；降低大模型训练成本。在 RAG 系统开发中存在 12 大痛点及相应解决方案，包括原论文中的 7 个和额外发现的 5 个。

数字人是运用数字技术创造出来的人，目前业界还没有一个关于数字人的准确定义，但一般可根据技术栈的不同分为两类，一类是由真人驱动的数字人，另一类是由算法驱动的数字人。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情，主要应用于影视行业以及现下很火热的直播带货，其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关，不过随着视觉算法的不断进步，现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息，从而做到不错的效果。制作数字人的工具主要有： 1. HeyGen：是一个 AI 驱动的平台，可以创建逼真的数字人脸和角色。使用深度学习算法生成高质量的肖像和角色模型，适用于游戏、电影和虚拟现实等应用。 2. Synthesia：是一个 AI 视频制作平台，允许用户创建虚拟角色并进行语音和口型同步。支持多种语言，并可用于教育视频、营销内容和虚拟助手等场景。 3. DID：是一家提供 AI 拟真人视频产品服务和开发的公司，只需上传人像照片和输入要说的内容，平台提供的 AI 语音机器人将自动转换成语音，然后就能合成一段非常逼真的会开口说话的视频。更多数字人工具请访问网站查看：https://www.waytoagi.com/category/42 。请注意，这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时，请确保遵守相关的使用条款和隐私政策，并注意保持对生成内容的版权和伦理责任。每个人都可以用 10 分钟轻松制作 AI 换脸、AI 数字人视频，具体步骤如下：在显示区域，拖动背景图的一个角，将图片放大到适合的尺寸，比如覆盖视频窗口。并将数字人拖动到合适的位置。增加字幕，点击文本智能字幕识别字幕，点击开始识别，软件会自动将文字智能分段并形成字幕。至此，数字人视频就完成了。点击右上角的“导出”按钮，导出视频以作备用。如果希望数字人换成自己希望的面孔，就需要用另一个工具来进行换脸。

以下为您推荐的 AI 绘画课程：【野菩萨】课程：预习周课程：包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。基础操作课：涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影穿越的大门等内容。核心范式课程：涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程：包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程：有 ChatGPT 基础、核心文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程：包含部署和基本概念、基础工作流搭建、动画工作流搭建等。应对 SORA 的视听语言课程：涉及通识欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。免费课程机会：参与 video battle，获胜者可获得课程奖励，包括冠军 4980 课程一份、亚军 3980 课程一份、季军 1980 课程一份，入围奖励 598 野神殿门票一张。扫码添加菩萨老师助理，了解更多课程信息。【Stable Diffusion 零基础入门宝典】课程：作者从事平面设计行业，基于对 Stable Diffusion 的学习和研究，开发了这套课程。课程初衷是为刚入门或想了解 SD 的小伙伴做全面梳理，因为新人面对众多内容往往不知所措。课程特色暂未提及。 SD 新手视频教程：章节教学视频：第一节课：AI 绘画原理与基础界面第二节课：20 分钟搞懂 Prompt 与参数设置，你的 AI 绘画“咒语”学明白了吗？第三节课：打破次元壁！用 AI“重绘”照片和 CG 第四节课：AI 绘画模型，“画风”自由切换第五节课：提高 AI 绘画分辨率的方式第六节课：LoRa|Hypernetwork 概念简析第七节课：定向修手修脸，手把手教你玩转局部重绘！第八节课：提示词补全翻译反推，“终极”放大脚本与细节优化插件第九节课：LoRA 从原理到实践第十节课：零基础掌握 ControlNet！

WaytoAGI,是干什么的，如何应用他。

WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。目前知识库的内容覆盖 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块，包含赛事和活动促进大家动手实践，有 1000 万的访问量。 WaytoAGI 里有个离谱村，这是由 WaytoAGI 孵化的千人共创项目，让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层，一起脑洞和创意，都可以通过 AI 工具快速简单地创作出各种各样的作品。在飞书 5000 人大群里，内置了一个智能机器人「waytoAGI 知识库智能问答」，它是基于飞书 aily 搭建的。使用方法如下： 1. 您可以在 WaytoAGI 飞书知识库首页找到加入飞书群的链接（最新二维码请在查找），然后点击加入，直接@机器人即可。 2. 可以在 WaytoAGI.com 的网站首页，直接输入您的问题，即可得到回答。 3. 在飞书群里发起话题时候即可，它会根据 waytoAGI 知识库的内容进行总结和回答。其功能包括： 1. 自动问答：自动回答用户关于 AGI 知识库内涉及的问题，可以对多文档进行总结、提炼。 2. 知识搜索：在内置的「waytoAGI」知识库中搜索特定的信息和数据，快速返回相关内容。 3. 文档引用：提供与用户查询相关的文档部分或引用，帮助用户获取更深入的理解。 4. 互动教学：通过互动式的问答，帮助群成员学习和理解 AI 相关的复杂概念。 5. 最新动态更新：分享有关 AGI 领域的最新研究成果、新闻和趋势。 6. 社区互动：促进群内讨论，提问和回答，增强社区的互动性和参与度。 7. 资源共享：提供访问和下载 AI 相关研究论文、书籍、课程和其他资源的链接。 8. 多语言支持：支持多语言问答，满足不同背景用户的需求。

AI相关的舆情分析或信息订阅产品

以下是一些与 AI 相关的舆情分析或信息订阅产品：腾讯研究院开发的系列产品： AI 每日速递：高度凝练的日报产品，帮助读者在 35 分钟内快速掌握 AI 领域当日十大关键进展。 AI 每周 50 关键词：周报产品，基于 AI 速递内容构建，通过梳理一周热点关键词并制作可交互索引，为研究者提供便捷的“检索增强”工具。科技九宫格：以 35 分钟视频形式解读科技热点与关键技术原理的短视频栏目，通过可视化呈现促进读者对前沿技术的理解与讨论。此外，团队还开展了 AGI 专题分析、AGI 线上圆桌、AI&Society 高端研讨会与 AI&Society 百人百问等系列研究探讨。个人订阅的 AI 信息源：包括公众号、Telegram、微博、即刻等平台。推荐的 Telegram 频道：黑洞资源笔记、科技新闻投稿、AI 探索指南、ChatGPT 新闻聚合、ChatGPT 精选、极客分享、开源社区、深度技术资源、AI News、AI Copilot、GIthub 仓库推荐等。公众号“卡尔的 AI 沃茨”也会有一些 AIGC 周报等。一种通过文章链接订阅公众号，定时推送情报消息，并实现情报 CoT 问答的方式：利用 wewerss，建议使用 Docker。浏览器打开 http://127.0.0.1:4000 或 http://wewerss 服务的 IP:端口（为上面设置的外部端口）。点开后输入 Dash 管理页面密码，先点帐号管理，然后点“添加读书帐号”（即使用微信读书来实现公众号订阅），扫码添加帐号。然后在公众号源上，点添加，将想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章，但建议不要短时间订阅太多公众号（最好不超 40 个）。在本地 data/目录会生成一个 SQLite 数据库文件 wewerss.db。

我该怎么学习ai？帮我组织一个流程，能很好的利用你的资源。

以下是为您组织的学习 AI 的流程：一、了解 AI 基本概念建议阅读「」部分，熟悉 AI 的术语和基础概念，包括人工智能的定义、主要分支（如机器学习、深度学习、自然语言处理等）以及它们之间的联系。同时，浏览入门文章，了解 AI 的历史、当前的应用和未来的发展趋势。二、开始 AI 学习之旅在「」中，您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台（如 Coursera、edX、Udacity）上的课程，按照自己的节奏学习，并有机会获得证书。三、选择感兴趣的模块深入学习 AI 领域广泛，涵盖图像、音乐、视频等方面。您可以根据自己的兴趣选择特定的模块进行深入学习，同时一定要掌握提示词的技巧，它上手容易且很有用。四、实践和尝试理论学习之后，实践是巩固知识的关键。尝试使用各种产品做出您的作品，在知识库中也有很多大家实践后的作品、文章分享，欢迎您实践后也进行分享。五、体验 AI 产品与现有的 AI 产品进行互动，如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人，了解它们的工作原理和交互方式，获得对 AI 在实际应用中表现的第一手体验，并激发您对 AI 潜力的认识。另外，费曼学习法也是一种有效的学习方式。它强调通过教授他人来深化个人理解和知识的掌握，基本步骤包括选择一个概念、教给他人、回顾和简化、组织和比较。其应用场景包括个人学习、教学和培训、知识分享等。 WaytoAGI（通往 AGI 之路）是一个致力于人工智能学习的中文知识库和社区平台，汇集了上千个人工智能网站和工具，提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯，还有丰富的学习资源、实践活动，并倡导开放共享的知识体系。在没有任何推广的情况下，WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量，目前合作过众多公司和产品。

以下是关于人力 AI 产品的相关信息： AI Native 硬件： AI Pin：由 Humane 公司开发的可穿戴设备，通过激光投影技术在手掌显示信息，由高通 Snapdragon 芯片驱动，运行 OpenAI 的 GPT4 语言模型，集成麦克风、摄像头和传感器，能语音通话、上网和回答问题，注重隐私保护，配备“信任灯”功能，但价格高昂且面临市场竞争。 TAB AI：挂在脖子上的小冰盘，本质是麦克风和电池，使用蓝牙传输音频到手机和云端，ChatGPT 在云端转录对话，各种人工智能模型提取见解，是人工智能伴侣。 OpenAI 和 Lovefrom 在软银 10 亿美元融资开发的备受期待的“人工智能 iPhone”。 AI 面试官相关产品：用友大易 AI 面试产品：具有强大技术底座、高度场景贴合度、招聘全环节集成解决方案、先进防作弊技术和严密数据安全保障，能完成面试、初筛和自动发送面试邀约。海纳 AI 面试：通过在线方式自动面试、评估，精准度高达 98%，面试效率提升 5 倍以上，候选人到面率提升。 InterviewAI：在线平台，提供面试问题和 AI 生成的推荐答案，候选人用麦克风回答，每个问题最多回答三次，会收到评估、建议和得分。 AIPM 技能树：传统软件/互联网 PM 面对 AI 产品时，AI PM 作为更专业化角色逐渐形成，需具备跨学科知识背景，在技术和业务间有效沟通和决策。掌握算法知识的必要性：理解产品核心技术，做出更合理产品决策。与技术团队有效沟通，减少信息不对称误解。评估技术可行性，在产品规划阶段做出更准确判断。把握产品发展方向，了解算法前沿。提升产品竞争力，发现独特优势，提出创新特性。提升数据分析能力，很多 AI 算法涉及数据处理和分析。

我怎样用低代码工具去构建我的AI智能体？LLM应用？

以下是关于如何用低代码工具构建 AI 智能体和 LLM 应用的一些建议：在构建基于 LLM 的应用时，Anthropic 建议先寻找最简单的解决方案，只在必要时增加复杂度。智能系统通常会以延迟和成本为代价来换取更好的任务表现，开发者需要考虑这种权衡是否合理。当需要更复杂的解决方案时，工作流适合需要可预测性和一致性的明确任务，而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过，对于许多应用来说，优化单个 LLM 调用（配合检索和上下文示例）通常就足够了。目前有许多框架可以简化智能系统的实现，例如： 1. LangChain 的 LangGraph。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet（一个拖放式 GUI 的 LLM 工作流构建器）。 4. Vellum（另一个用于构建和测试复杂工作流的 GUI 工具）。这些框架通过简化标准的底层任务（如调用 LLM、定义和解析工具、链接调用等）使入门变得容易，但它们往往会创建额外的抽象层，可能会使底层提示词和响应变得难以调试，也可能诱使开发者在简单设置就足够的情况下增加不必要的复杂性。建议开发者先直接使用 LLM API，许多模式只需要几行代码就能实现。如果确实要使用框架，请确保理解底层代码。此外，还有以下相关工具和应用： 1. VectorShift：能在几分钟内构建和部署生成式人工智能应用程序，利用大型语言模型（例如 ChatGPT）构建聊天机器人、文档搜索引擎和文档创建工作流程，无需编码。 2. Unriddle：帮助更快阅读、写作和学习的工具，能简化复杂的主题，找到信息，提问并立即获得答案。工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步，为现代人工智能栈增加了一个新的层。一些流行的原语如网页浏览（Browserbase、Tiny Fish）、代码解释（E2B）和授权+认证（Anon）已经出现，它们使 LLM 能够导航网络、与外部软件（如 CRM、ERP）交互并运行自定义代码。Omni 的计算 AI 功能体现了这种方法，它利用 LLM 直接输出适当的 Excel 函数到电子表格中，然后执行计算并自动生成复杂查询供用户使用。详细示例请参考：https://github.com/anthropics/anthropiccookbook/tree/main/patterns/agents

通往AGI之路的介绍

“通往 AGI 之路”（WaytoAGI）是一个致力于人工智能（AI）学习的中文知识库和社区平台。社区由开发者、学者和 AI 爱好者共同参与建设，提供丰富的学习资源，包括文章、教程、工具推荐以及最新的 AI 行业资讯等。品牌 VI 方面，融合了独特的设计元素，以彩虹色彰显多元性和创新，以鹿的形象象征智慧与优雅，通过非衬线字体展现现代感和清晰性。为学习者提供系统全面的 AI 学习路径，涵盖从基础概念到实际应用的各个方面。汇集了上千个人工智能网站和工具，拥有丰富多样的技术活动、学习资源和大量的社区成员。在没有任何推广的情况下，一年时间已有超过 100 万用户和超千万次的访问量。社区定期组织活动，如视频挑战赛、模型创作大赛等，鼓励成员在实践中学习，促进交流与合作。引领并推广开放共享的知识体系，倡导共学共创等形式，孵化了 AI 春晚、离谱村等大型共创项目。目标是让每个人的学习过程少走弯路，让更多的人因 AI 而强大。目前合作过众多公司/产品，如阿里云、通义千问、淘宝、智谱、支付宝等。如果您对 AI 学习感兴趣，加入“通往 AGI 之路”社区将是一个不错的选择。在这里，您可以获取最新的 AI 知识，参与实践活动，与志同道合的学习者共同成长。

数字员工如何实现？

数字员工的实现方式主要包括以下步骤： 1. 声音克隆：先剪出音频，使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits（GPTSoVITS 实现声音克隆）克隆声音，做出文案的音频。 2. 视频整合：使用 wav2lip 整合包，导入视频和音频，对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。产品可参考 https://synclabs.so/ 。从学习路径的角度来看，结合“一人公司”的愿景，需要大量的智能体（数字员工）替我们打工。未来的 AI 数字员工会以大语言模型为大脑，串联所有已有的工具和新造的 AI 工具。数字员工（agent）=学历（大模型）+察言观色（观察）+逻辑思维（推理）+执行（SOP）。创造者的学习也依照这个方向，用大语言模型和 Agent 模式把工具串起来，着重关注在创造能落地 AI 的 agent 应用。 Agent 工程（基础版）如同传统的软件工程学，有一个迭代的范式： 1. 梳理流程：梳理工作流程 SOP，并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化：自动化每一个「任务」，形成一系列的小工具，让机器能完成每一个单一任务。 3. 建立规划：串联工具，基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化：不停迭代优化「任务」工具和「任务执行流程」规划，造就能应对实际场景的 Agent。在摊位信息方面，有摊位主题为“AI 数字员工”的展示，内容为为企业和个人提供数字劳动力，解决重复性、创意性工作难题。体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。