Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

小白不懂MCP,请搜索waytoAGI中与智能体相关的内容(特别是视频形式的)让我来学习

Answer

以下是为您整理的关于 MCP 的相关内容:

一、什么是 MCP

MCP(Model Context Protocol)是一种通用的方式,向各类大语言模型提供数据源和工具。它是一个开放协议,用于标准化应用程序向大语言模型提供上下文的方式。可以将 MCP 想象成 AI 应用程序的 USB-C 接口,为 AI 模型连接不同的数据源和工具提供了标准化方式。

二、相关文章的写作目的和探讨内容

  1. 作者因在 WaytoAGI 社区阅读了他人优秀文章,决定逼自己做输出,对自我学习进行总结。
  2. 文章从作者自身疑问出发,通过动手实践的方式探索:利用自然语言交互,大模型为什么会调用 MCP 工具;大模型调用 MCP 工具,从客户端到服务端发生了什么;安装了类似 MCP 工具,大模型如何选择用哪一个。

三、MCP 和 AI 工具的未来

自 OpenAI 发布函数调用以来,思考解锁智能体和工具使用生态系统所需条件。MCP 于 2024 年 11 月推出,在开发者和 AI 社区中已获广泛关注,被视为潜在解决方案。探讨了其如何改变 AI 与工具的交互方式、开发人员的使用情况及仍需解决的挑战。

四、MCP 小白图文使用教程

MCP 服务器有三大核心功能:

  1. 资源:是服务器提供给 AI 的数据内容,如文件、数据库结构或特定信息,每个资源通过唯一 URI 标识。
  2. 工具:允许 AI 模型执行特定操作,如查询数据库、调用 API 或执行计算,每个工具由名称和描述其模式的元数据唯一标识。
  3. 提示:提供结构化消息和指令,用于与语言模型交互,客户端可以发现可用提示、检索其内容并提供参数进行自定义。

希望以上内容对您有所帮助。

Content generated by AI large model, please carefully verify (powered by aily)

References

Lark:扒下MCP的外衣 -- 揭秘它被大模型xx的全过程

Write by Lark from Little Shock--智能不应喧嚣,只需温柔贴合日常[heading1]什么是MCP?[content]manus的火爆突然也带火了Anthropic去年11月发布的MCP(Model Context Protocol)模型上下文协议(虽然manus明确表示没有用MCP),按照我自己的理解用一句话概括就是:MCP是一种通用的方式,向各类大语言模型提供数据源和工具。官网解释:MCP是一个开放协议,用于标准化应用程序向大语言模型提供上下文的方式。可以将MCP想象成AI应用程序的USB-C接口。就像USB-C为设备连接各种外设和配件提供了标准化方式一样,MCP为AI模型连接不同的数据源和工具提供了标准化方式。(https://docs.anthropic.com/zh-CN/docs/agents-and-tools/mcp)[heading1]为什么写这篇文章,这篇文章讲什么?[content]我是一个不太喜欢写文章而偏好埋头开发的人,但在WaytoAGI社区中阅读了太多他人优秀的文章,应该试着逼自己做一点点输出,也是对自我学习的总结。在各种MCP相关文章充斥公众号的今天,如果再写一篇讲MCP原理的文章,就显得浪费彼此的时间,所以,这篇文章从我自己的疑问出发,通过动手实践的方式,和大家一起探索:利用自然语言交互,大模型为什么会调用MCP工具?大模型调用MCP工具,从客户端(Client)到服务端(Server)发生了什么?我安装了类似的MCP工具,大模型如何选择用哪一个?接下来,我决定采用做实验的方式,来一一验证和解答我自己的这几个疑问,也可以加深对MCP的理解。

深入探讨 MCP 和 AI 工具的未来

自从OpenAI在2023年发布函数调用以来,我一直在思考解锁智能体和工具使用生态系统所需的条件。随着基础模型变得越来越智能,智能体与外部工具、数据和API的交互能力变得越来越分散:开发人员需要为智能体实现特殊的业务逻辑,以适应智能体操作和集成的每一个系统。很明显,需要有一个标准的执行、数据获取和工具调用接口。API是互联网最早的统一语言——为软件通信创造了共同语言,但人工智能模型缺乏同等的东西。模型上下文协议(MCP),于2024年11月推出,在开发者和AI社区中已经获得了广泛关注,被视为一种潜在的解决方案。在本文中,我们将探讨什么是MCP,它如何改变AI与工具的交互方式,开发人员已经使用它构建了什么,以及仍需解决的挑战。让我们开始吧。[heading2]什么是MCP?[content]MCP是一种开放协议,允许系统以跨集成的泛化方式为AI模型提供上下文。该协议定义了AI模型如何调用外部工具、获取数据和与服务交互。作为一个具体的例子,下面是Resend MCP服务器如何与多个MCP客户端协作。这个想法并不新鲜;MCP从LSP(语言服务器协议)中获取灵感。在LSP中,当用户在编辑器中输入时,客户端查询语言服务器以自动完成建议或诊断。在MCP超越LSP的地方在于其以智能体为中心的执行模型:LSP主要是被动的(响应来自IDE的请求,基于用户输入),而MCP是专门为支持自主的AI工作流而设计的。根据上下文,AI智能体可以决定使用哪些工具、按什么顺序以及如何将它们串在一起来完成任务。MCP还引入了人工参与的功能,允许人类提供额外的数据并批准执行。

MCP小白图文使用教程:让AI连接你的数据和工具

MCP服务器可以提供三种主要类型的功能:![MCP核心功能](https://norahsakal.com/assets/images/mcp_overview-641a298352ff835488af36be3d8eee52.png)[MCP核心功能展示](https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained/)[heading3]1.资源(Resources)[content]资源是服务器提供给AI的数据内容,如文件、数据库结构或特定信息。每个资源通过唯一URI标识。例如:文件系统的文件内容数据库中的表结构应用特定的信息资源由应用程序驱动,应用决定如何基于需要合并上下文。[heading3]2.工具(Tools)[content]工具允许AI模型执行特定操作,如查询数据库、调用API或执行计算。每个工具由名称和描述其模式的元数据唯一标识。例如:搜索数据库工具发送邮件工具执行计算工具工具由模型控制,意味着AI模型可以基于上下文理解和用户提示自动发现和调用工具。[heading3]3.提示(Prompts)[content]提示提供结构化消息和指令,用于与语言模型交互。客户端可以发现可用提示、检索其内容并提供参数进行自定义。例如:特定格式的报告生成模板分析代码的指令模板提示由用户控制,旨在由用户明确选择使用。

Others are asking
MCP是什么
模型上下文协议(Model Context Protocol,简称 MCP)是一种全新的开放协议,主要用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。 它就像 AI 领域的“USBC 接口”,能让不同的 AI 模型与外部工具和数据源轻松连接。其具有以下特点和优势: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 MCP 最早由 Anthropic 公司开发,现已成为一个开放协议,越来越多的企业和开发者开始采用。 与传统 API 相比,通常 AI 系统连接外部工具时,需要单独整合多个不同的 API,每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。而 MCP 提供了更简单的集成方式。 但如果应用场景需要精准且严格受控的交互方式,传统 API 可能更合适,比如在需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性等场景。 若要开始使用 MCP,可参考以下快速集成步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 MCP 是一个典型的客户端服务端架构,对于有编程基础的同学来说较容易理解。通过简单案例,如让 AI 根据输入自动规划并调用 MCP 服务端,给本地电脑创建文件并写入一句话,可对其有初步且正确的认知。
2025-04-18
MCP是什么
模型上下文协议(Model Context Protocol,简称 MCP)是一种全新的开放协议,专门用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。 它就像为 AI 模型量身定制的“USBC 接口”,能让不同的 AI 模型与外部工具和数据源轻松连接。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 MCP 最早由 Anthropic 公司开发,现在已成为一个开放协议,越来越多的企业和开发者开始采用。 MCP 是一个典型的客户端服务端架构,对于有编程基础的同学来说容易理解,就像开发中常见的 MySQL 一样。 与传统 API 相比,通常 AI 系统连接外部工具时,需要单独整合多个不同的 API,每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。而 MCP 能简化这一过程。 在某些情况下,传统 API 更适合,比如应用场景需要精准且严格受控的交互方式,如需要细粒度控制、功能严格限制;更偏好紧耦合以提升性能;希望最大化交互的可预测性。 要开始使用 MCP,可按以下步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 总之,MCP 让 AI 与外部数据、工具的连接变得更加标准化和高效。
2025-04-14
如何使用MCP?提供教程
以下是关于如何使用 MCP 的详细教程: 前置准备工作: 任选一个客户端软件进行配置,大致分为四步: 1. 填入大模型 API 密钥。 2. 找到 MCP 配置界面。 3. 填入 MCP Server 对应的 json 脚本。 4. 使用 MCP。 不同客户端软件的配置方法: 1. Cherry Studio(推荐): 版本:2025 年 4 月发布的 1.1.17。 配置大模型 API:填入之前准备好的 AiHubMix 的 API 密钥。 配置 MCP:例如,图中填写的就是 Playwright 的 MCP Server 和百度地图的 MCP Server。 使用 MCP。 2. Cursor(推荐): 配置大模型 API:如果 Cursor Pro 在免费试用期,这一步可以不做;如果不在免费试用期,最好的办法是氪金,也可以试试填入之前准备好的 AiHubMix 的 API 密钥。 配置 MCP Server:填入 MCP Server 的 json,保存。 回到 Cursor 的 MCP 配置页面,等待几秒钟,多点几次蓝色框里的按钮,直到绿灯亮起,并显示出所有 MCP 工具。 使用 MCP:Ctrl+Shift+L 新建对话,将模式设置为 Agent。 3. Claude Desktop: 配置 MCP Server:用文本编辑器(VSCode、Sublime Text 等)打开 claude_desktop_config.json 文件,填入 MCP Server 对应的 json 文件,保存。 重启 Claude Desktop。 查看 MCP Server 连接状态。 使用 MCP。 MCP 的好处: 1. 简化开发:一次整合,多次复用,不再重复开发。 2. 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 3. 实时互动:长连接保证数据实时更新。 4. 安全可靠:内置标准化安全和权限控制。 5. 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 传统 API 更适合的场景: 1. 需要细粒度控制、功能严格限制。 2. 更偏好紧耦合以提升性能。 3. 希望最大化交互的可预测性。 快速集成 MCP 的步骤: 1. 定义能力:明确您的 MCP 服务器提供哪些功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接您的数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 MCP 与 API 的比较: MCP 与传统 API 之间的主要区别在于: 1. 单一协议:MCP 充当标准化的“连接器”,因此集成一个 MCP 意味着可能访问多个工具和服务,而不仅仅是一个。 2. 动态发现:MCP 允许 AI 模型动态发现可用工具并与之交互,而无需对每个集成进行硬编码知识。 3. 双向通信:MCP 支持持久的实时双向通信 类似于 WebSockets。AI 模型既可以检索信息,也可以动态触发操作。 以 Cursor 驱动 blender 自动化建模的 MCP 项目为例: 首先,在 github 上找到项目说明(https://github.com/ahujasid/blendermcp)。以 Mac 安装为例,首先要安装一个 uv 包(如果不懂,就直接新建一个项目文件夹后,将相关需求丢给 AI)。显示 uv 安装完毕后(初次使用可能需要安装一系列的环境,只要一路让 AI 安装就可以了),还是找到点击界面右上角的小齿轮图标。找到 MCP 模块 Add new global MCP server,将相关内容粘贴进去。退回 MCP 界面时,就会发现已经连接上了这个 blender 服务器,并且增加了很多具体功能。
2025-04-13
如何开发MCP
MCP(模型上下文协议)是由 Anthropic 在 2024 年 11 月推出并开源的一项创新标准。它就像一个“转接头”或“通用插座”,其核心作用是统一不同的外部服务(如 Google Drive、GitHub、Slack、本地文件系统等),通过标准化接口与 AI 模型对接。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 与传统 API 相比,MCP 更适合需要上下文理解的场景,而传统 API 更适合需要精准且严格受控的交互方式,如需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性的场景。 开发 MCP 的步骤如下: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 MCP 是一个典型的 CS 架构,对于有编程基础的同学来说容易理解。开发 MCP 前需要进行环境安装,包括下载并安装 Python(官网:https://www.python.org/),安装 uv(借助 uv 进行虚拟环境创建和依赖管理,它是一个 Python 依赖管理工具,采用 Rust 编写,兼有创建虚拟环境和包管理工具的功能,可以平替 pip,venv)。
2025-04-12
我想找与高德地图MCP相关的教程
以下是为您整理的与高德地图 MCP 相关的教程内容: 1. 在 2025 年 4 月 3 日的智能纪要中,演示了通过 Figma 样式生成网页及整合新闻信息的操作过程,包括读取 Figma 样式、存储为公共样式、自动完成任务大闭环等,还计划打通多点连贯性,新建 news RSS 以整合信息。 2. 演示了 MCP 服务下的网页渲染生成及配置应用,提到模型 API 配置一次可反复调用,选择合适供应商和工具并填入密钥,展示了生成火星新闻页面的效果,探讨了交互问题,如添加网址跳转,还介绍了按需求文档开发页面的方式,最后打算尝试小程序开发,提及接入高德地图 API。 3. 新起项目相关安排及高德地图 API key 获取步骤,银海提议新建项目,创建新编辑页,建一个名为 PRD 点 MD 的需求文档,告知相关页面。还提到需要高德地图的 MCP 服务,因当前无高德,打算从豆哥市场获取。讨论了调用需 API key,介绍了获取 API key 的步骤,包括登录高德控制台,创建新应用并添加 key 等。 4. 银海关于获取 API key、连接高德 MCP 及后续开发需求说明,先是拿到高德 API key 并尝试在豆哥的高的 MCP 连接、测试,运行输入杭州未返回信息,先不管运行结果进行配置添加,添加成功后默认高德服务可行。之后要求阅读 PRD、NT 文档,按需求实现所有页面,如需用高德地图直接调用工具,部分文档内容可写进 PRD。 5. 观察其获取页面数据及实现 iOS 地图应用过程,先是等待程序读取页面信息,期间发现勾选后仍需重复 approve疑似有小 bug。之后程序获取到 5 个页面数据,准备实现 iOS 地图应用。提到实现 iOS 应用可用 switch 等编程语言,但希望写成 html 结构,不想用需 x code 运行的 switch,只需等待其实现即可。 6. 应用自动写页面与代码的过程及相关讨论,银海介绍应用开发进度,称可解放双手等待页面生成,目前 5 个页面框架已做好,样式在编写。还提到高德地图密钥未给,探讨地图渲染方式。指出代码无 rules 易截断,分享 cursor decore 网站,其中有诸多代码规范,建议配置 rules 提升代码可读性。 7. 黄叔用 AI 解决约会地点选择难题,使用 Windsurf+高德 MCP+32kw.com,只花了 20 分钟就完成了需求验证,并做出了相关网页,您可以通过 https://www.32kw.com/view/b109136 查看。
2025-04-11
MCP是什么?未来的发展趋势如何?
MCP(模型上下文协议)是一种于 2024 年 11 月推出的开放协议,允许系统以跨集成的泛化方式为 AI 模型提供上下文。该协议定义了 AI 模型如何调用外部工具、获取数据和与服务交互。 MCP 已经在重塑 AI 智能体和代理的生态系统。其未来的发展趋势取决于如何应对基础性挑战,如果处理得当,可能成为 AI 与工具交互的默认接口,并开启新一代自主、多模态、深度集成的 AI 体验。如果被广泛采用,它可能代表工具构建、消费和货币化方式的转变。 今年将是关键的一年,可能会面临一些关键问题,比如是否会看到一个统一的 MCP 市场崛起,AI 代理的认证是否会变得无缝,多步执行能否被正式纳入协议等。 MCP 从 LSP(语言服务器协议)中获取灵感,超越 LSP 的地方在于其以智能体为中心的执行模型,LSP 主要是被动响应,而 MCP 专门为支持自主的 AI 工作流而设计,根据上下文,AI 智能体可以决定使用哪些工具、按什么顺序以及如何将它们串在一起来完成任务。MCP 还引入了人工参与的功能,允许人类提供额外的数据并批准执行。
2025-04-10
我想将常用的AI入口手机放在一张网页上,该如何设置waytoAGI页面
以下是关于将常用的 AI 入口放在一张网页上设置 WaytoAGI 页面的方法: 1. 点开链接就能看:不用注册,不用花钱,直接点击。 2. 想看啥就看啥:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 3. 有问题还能问:如果看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。 另外,关于使用 Cursor 制作您的第一个主页: 1. 在搞定一个非常简单的小游戏之后,可以做一个自己的个人介绍网站。可以先看看官网,比如 allinagi.com.cn、sboat.cn。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先会有一个初步简单的项目介绍,比如 WaytoMars 是一个制造、运营全 AI 自动驾驶的火星登陆飞船公司品牌,有着领先全球的技术实力、人才优势,预计在 2030 年推出可承载上千人,五星豪华级的全 AI 自动驾驶的火星登陆飞船。有了项目介绍后,让 AI 帮助生成一个具有前端大师级审美、极富科幻感的网站首页。首先,新建一个 waytomars 文件夹并打开,在 AI 对话框中输入上述的话,一路等待 AI 制作以及加入您的修改意见即可。 2. 如何让别人看到您的作品预览:通过将项目文件夹整体上传,就可以生成一个临时浏览链接,在不需要域名和服务器的情况下让外部也能够看到您的作品。注意:如果发现 cursor 有所卡顿,注意是不是 AI 让您在终端区或者对话区确认重要操作,左下角将 ask every time 修改为 auto run 就可以全自动化了。 WaytoAGI 就是一个帮您快速入门 AI、学会用 AI 搞事情的“武器库”。不管您是完全不懂 AI 的小白,还是想用 AI 赚钱的普通人,它都能帮到您。AI 是未来的趋势,现在学一点都不晚,如果您想了解 AI、用 AI、甚至靠 AI 搞钱,WaytoAGI 就是您最该看的“AI 宝典”。
2025-04-14
身份是小学语文老师,如何自学waytoAGI
以下是为您整理的相关内容: 1. 10 月 9 日小作业中提到:熟悉 waytoagi 知识库,并找到 Prompt 提示词框架文章,给出两个提示词框架和生成结果。框架一是“CRISPE 框架”,处理小学六年级同学丢钱引发的同桌纠纷,给出三种解决方式,包括调查真相、教育双方,全班寻找失物、避免误解,引导调解与反思。生成结果为详细的解决步骤。同时提到人工智能时代的三个基石是数据、算法、算力,数据和算法可在开源数据库等找到,算力可在云计算平台如 AWS、Google Cloud、Microsoft Azure 找到。 2. 6 月 11 日 AI 秒学团队中,有人分享了搭建聊天功能工作流的经历,提到在实践中不断迭代、调整和优化。一位纯社科背景的高校老师感谢 way to AGI 带文科生进入 agent 的“坑”,并提到小团队给予的帮助。 3. 问卷中,刘翔宇表示自己是国内一线互联网 AI 产品经理,愿意共同维护 WaytoAGI 开源社区,学习目标是了解 Comfy 基础理论等多方面,所在城市为北京。
2025-04-12
waytoAGI和deepseek有什么区别
WaytoAGI 和 deepseek 的区别如下: WaytoAGI: 可以了解最新的 AI 技术,其开源免费,能让人学到实用技能。 提供线上共学,手把手教用户应用 AI 技术,适合不同基础的用户找到学习路径。 是一个能找到志同道合队友的平台,便于创业、做副业或一起搞事情。 其线下活动能让人了解最新的 AI 落地应用现状,结识有趣、有想法的人,让人意识到要多与人交流和体验真实生活才能成长。 deepseek: 关于 deepseek 的具体特点未在提供的内容中有明确阐述,但可以通过相关学习材料,如“详解:DeepSeek 深度推理+联网搜索目前断档第一”“收集全网最好玩 Deepseek 案例”“集合·DeepSeek 提示词方法论”等,对其进行快速了解。在 AI 领域爆火工具出现时,WaytoAGI 上会有很多 deepseek 相关的内容,通过快速阅读这些开源资料能获得对 deepseek 的基础认识。
2025-03-28
如何用waytoAGI
以下是关于如何使用 WaytoAGI 的详细介绍: 1. 加入飞书群:您可以在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(最新二维码请在获取),然后点击加入,直接@机器人即可。 2. 在网站首页提问:您可以在 WaytoAGI.com 的网站首页,直接输入您的问题,即可得到回答。 3. 点开链接查看:不用注册,不用花钱,直接点就能看。 4. 按需求选择内容:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 5. 从特定板块开始:以 Agent 板块为例,您可以从下往上看,一个一个点进去查看相关视频。比如链接:。 如果您看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。WaytoAGI 是一个帮助您快速入门 AI、学会用 AI 搞事情的“武器库”,无论您是小白还是想靠 AI 赚钱,都能从中受益。
2025-03-05
waytoAGI解决的核心场景是什么,有哪些应用案例
WaytoAGI 是一个 AI 开源社区,其核心场景包括: 1. 提供 AI 领域的最新进展、教程、工具和一线实战案例,引领并推广开放共享的知识体系。 2. 倡导共学共创等形式,孵化了如 AI 春晚、离谱村等大型共创项目。 3. 作为思想交流平台,汇聚行业顶尖创作者和 KOL。 应用案例方面: 1. 在上海国际 AIGC 大赛中,如《嘉定汇龙》项目中,利用多种 AI 技术如 stable diffusion 艺术字生成、comfyui 转绘、steerablemotion、runway 文生视频、图生视频等,并通过合成剪辑完成作品。 2. 社区内有像三思这样的高手分享具体教程。
2025-02-21
waytoAGI知识库智能问答机器人是如何实现的
waytoAGI 知识库智能问答机器人的实现方式如下: 基于 Aily 和云雀大模型。Aily 是飞书团队旗下的企业级 AI 应用开发平台,提供简单、安全且高效的环境,帮助企业构建和发布 AI 应用。云雀是字节跳动研发的语言模型,能通过自然语言交互高效完成互动对话等任务。 在飞书 5000 人大群里内置,根据通往 AGI 之路的文档及知识进行回答。使用方法为在飞书群里发起话题时,它会根据 waytoAGI 知识库的内容进行总结和回答。 其具备多种功能,如自动问答、知识搜索、文档引用、互动教学、最新动态更新、社区互动、资源共享、多语言支持等。 搭建过程包括介绍 WaytoAGI 社区的成立愿景和目标、利用 AI 技术帮助用户检索知识库内容、引入 RAG 技术、介绍基于飞书的知识库智能问答技术的应用场景和实现方法、使用飞书的智能伙伴功能搭建 FAQ 机器人以及智能助理的原理和使用方法等。
2025-02-12
作为AI小白,需要一些AI常用专业术语的名词解释
以下是一些 AI 常用专业术语的名词解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。 Gradient Descent(梯度下降):在机器学习中,是一种优化方法,根据模型损失函数的最大改进方向逐渐调整模型的参数。 Hallucinate,Hallucination(幻觉):在人工智能的背景下,指模型生成的内容不是基于实际数据或与现实明显不同的现象。 Hidden Layer(隐藏层):神经网络中不直接连接到输入或输出的人工神经元层。 Hyperparameter Tuning(超参数调优):为机器学习模型的超参数(不是从数据中学习的参数)选择适当值的过程。 Inference(推理):使用经过训练的机器学习模型进行预测的过程。 Instruction Tuning(指令调优):机器学习中的一种技术,其中模型根据数据集中给出的特定指令进行微调。 Latent Space(潜在空间):在机器学习中,指模型创建的数据的压缩表示形式。类似的数据点在潜在空间中更接近。 Compute(计算):用于训练或运行 AI 模型的计算资源(如 CPU 或 GPU 时间)。 CNN(卷积神经网络):一种深度学习模型,通过应用一系列过滤器来处理具有网格状拓扑(例如图像)的数据。通常用于图像识别任务。 Data Augmentation(数据增强):通过添加现有数据的略微修改的副本来增加用于训练模型的数据量和多样性的过程。 Double Descent(双降):机器学习中的一种现象,其中模型性能随着复杂性的增加而提高,然后变差,然后再次提高。 EndtoEnd Learning(端到端学习):一种不需要手动设计功能的机器学习模型。该模型只是提供原始数据,并期望从这些输入中学习。 Expert Systems(专家系统):人工智能技术的应用,为特定领域的复杂问题提供解决方案。 XAI(可解释的人工智能):Explainable AI,人工智能的一个子领域专注于创建透明的模型,为其决策提供清晰易懂的解释。
2025-04-18
作为一个想要使用AI工具提升工作效率的AI小白,我已经学习了怎么编写prompt,接下来我应该学习什么
如果您已经学习了如何编写 prompt ,接下来可以学习以下内容: 1. 理解 Token 限制:形成“当前消耗了多少 Token”的自然体感,把握有效记忆长度,避免在超过限制时得到失忆的回答。同时,编写 Prompt 时要珍惜 Token ,秉承奥卡姆剃刀原理,精简表达,尤其是在连续多轮对话中。 熟练使用中英文切换,若 Prompt 太长可用英文设定并要求中文输出,节省 Token 用于更多对话。 了解自带方法论的英文短语或句子,如“Chain of thought”。 2. 学习精准控制生成式人工智能:重点学习提示词技术,编写更清晰、精确的指令,引导 AI 工具产生所需结果。 探索构建智能体(AI Agents),将工作单元切割开,赋予其特定角色和任务,协同工作提高效率。 在实际应用中遵循准则,如彻底变“懒人”、能动嘴不动手、能让 AI 做的就不自己动手、构建自己的智能体、根据结果反馈调整智能体、定期审视工作流程看哪些部分可用更多 AI 。 3. 若想进一步提升: 学习搭建专业知识库、构建系统知识体系,用于驱动工作和个人爱好创作。 注重个人能力提升,尤其是学习能力和创造能力。 您还可以结合自身生活或工作场景,想一个能简单自动化的场景,如自动给班级孩子起昵称、排版运营文案、安排减脂餐、列学习计划、设计调研问卷等。选一个好上手的提示词框架开启第一次有效编写,比如从基础的“情境:”开始。
2025-04-15
ai小白学习课程
对于 AI 小白的学习课程,建议如下: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库有很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 另外,如果让我推荐一门 AI 课,比如【野菩萨】的课程: 1. 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 2. 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 3. 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 4. SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 5. ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 6. ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 7. 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。 冠军奖励:4980 课程一份 亚军奖励:3980 课程一份 季军奖励:1980 课程一份 入围奖励:598 野神殿门票一张 扫码添加菩萨老师助理,了解更多课程信息。 对于纯小白,还可以参考以下: |分类|标题|文章链接|视频链接|适用人群|简要说明| ||||||| |通识篇|现有常见 AI 工具小白扫盲|(1 小时 32 分开始)|对 AI 都没太多概念的纯纯小白|给与 AI 之间有道墙、还在墙外的人简单介绍当前各种 AI 工具、0 成本最快速感受当下 AI 工具的力量| |通识篇|AI 常见名词、缩写解释|结合食用|
2025-04-15
ai小白学习课程
对于 AI 小白的学习课程,建议如下: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库有很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 另外,如果让我推荐一门 AI 课,比如【野菩萨】的课程: 1. 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 2. 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 3. 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 4. SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 5. ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 6. ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 7. 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。 冠军奖励:4980 课程一份 亚军奖励:3980 课程一份 季军奖励:1980 课程一份 入围奖励:598 野神殿门票一张 扫码添加菩萨老师助理,了解更多课程信息。 对于纯小白,还可以参考以下: |分类|标题|文章链接|视频链接|适用人群|简要说明| ||||||| |通识篇|现有常见 AI 工具小白扫盲|(1 小时 32 分开始)|对 AI 都没太多概念的纯纯小白|给与 AI 之间有道墙、还在墙外的人简单介绍当前各种 AI 工具、0 成本最快速感受当下 AI 工具的力量| |通识篇|AI 常见名词、缩写解释|结合食用|
2025-04-15
作为一个小白,如何开始ai编程
以下是小白开始 AI 编程的步骤和相关建议: 直接上手: AI 编程就像一场 PUA 和提问大赛。 要分辨 Chat 和 Composer 两个模式。Chat 模式可与大模型对话,但常用的是 Composer 模式,它能即时反馈,直接创建文件、填写代码并询问您是否满意。 例如,在 Composer 模式下输入“给我创建一个 2048 的网页游戏吧”,1 2 分钟后会生成相关文件。 生成文件后,可打开文件夹找到 index.html 双击查看本地运行效果。若环境报错双击打不开,可截图在 Composer 对话框询问解决方法。 思想准备: 对于小白来说,因为无知会充满勇气和忧虑。能从心理上面对“我或许能行”这件事,可能就解决了 AI 编程问题的一半。 后续探索: 作者将继续探索并更新相关文章,包括: 第一弹,一点小小的震撼——cursor 黑客松。 第二弹,文案工作者的福音——cursor 批量写 prompt、写文章。 第三弹,上一辈的崛起——cursor 的“向上”,给爹妈一场安利。 如果想要交流或了解更多,欢迎戳这里:
2025-04-14
如果是小白新手,理论应用到实践中最重要的是什么
对于小白新手,将理论应用到实践中,以下几点最为重要: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,可找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,知识库中有很多实践后的作品和文章分享,欢迎分享自己的实践成果。 5. 体验 AI 产品:与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验,激发对 AI 潜力的认识。 此外,就像有人认为“只要知道它的原理和历史,自然而然就会知道它的底线和顶点在哪里”,但实践中的体验和尝试同样不可或缺。
2025-04-13
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14