Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

那个AI可以爬公众号内容

Answer

以下是关于 AI 与公众号相关的内容:

  • 关于通过搜狗搜索公众号内容实现信息获取的方案,代码更新停留在 2 周前,且会触发搜狗和微信公众号反爬 robots.txt,此方案不可行。可行的免费方案是通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。具体操作如使用 Docker,浏览器打开相关链接,输入管理页面密码,添加读书帐号,在公众号源上添加想订阅的公众号的一篇文章链接等,但建议不要短时间订阅太多公众号(最好不超 40 个)。
  • 利用 AI 打造爆款公众号文章,可在搜索框输入具体 Prompt 定位相关资讯,通过 AI 工具如 Perplexity.AI、微软的 Bing 搜索引擎搜集资料,使用 Kimi 这个 AI 会话助手整理资料,分批次提供资料确保其有效读取理解。选定紧跟时事且关注度高的主题,收集相关资讯,反复修改优化文章,添加多媒体元素如精心挑选相关的图片、视频或图表来丰富内容。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI实战:搭建信息情报官Agent

建议使用Docker(假设已经装上)浏览器打开:http://127.0.0.1:4000也可以http://wewe-rss服务的IP:端口为上面设置的外部端口/点开输入Dash管理页面密码:先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号然后在公众号源上,点添加然后将你想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。譬如:我们收集AI相关信息的公众号。但是建议不要太过贪心短时间订阅太多公众号,并且不要订阅太多公众号(经测试最好不要超40个)。然后在本地data/目录就会生成一个SQLite数据库文件wewe-rss.db

如何利用 AI 30分钟不到打造爆款公众号文章.pdf

在搜索框中,我们可以输⼊具体的Prompt,例如:“查找关于OpenAI对⻢斯克⾔论回应的博客⽂章”。这样的搜索指令将帮助我们快速定位到相关的资讯。我们通过AI⼯具如Perplexity.AI获取到搜索结果后,结果中包含了⼤量引⽤和来源链接,我们可以点击回答内容下⽅的拷⻉按钮。这样能一并获取到相关的引⽤⽹站链接。同理,其他具备联⽹搜索功能的AI⼯具,⽐如微软的Bing搜索引擎,也提供了类似的功能。通过这些⼯具,我们可以快速地搜集到⼤量的相关资料。我们可以更加⾼效地进⾏信息搜集和整理,从⽽提升⽂章的专业度和说服⼒。整理资料收集完资料后,紧接着的任务是对这些资料进⾏整理。我通常会使⽤⽉之暗⾯开发的Kimi这个AI会话助⼿。Kimi具备读取⽹⻚内容的能⼒,并且能够在此基础上⽣成一定的内容。当Kimi读取完毕时,会显⽰绿⾊标点作为提⽰。需要注意的是,Kimi的阅读能⼒有一定的限制,它可能⽆法一次性处理⼤量的资讯,或者某些⽹站的内容可能⽆法被读取。为了克服这些限制,我们可以分批次地将资料提供给Kimi,确保它能有效地读取并理解所有可⽤的⽹站内容。

如何利用 AI 30分钟不到打造爆款公众号文章.pdf

以我⾃⼰为例,我通过Perplexity.AI的Discover功能,挖掘了近期的热点资讯,并最终选定了我们⽂章的主题:OpenAI对⻢斯克⾔论的回应。这个主题不仅紧跟时事,⽽且具有较⾼的关注度。收集相关资料明确了⽂章的主题之后,接下来的步骤是收集相关的资讯。这一过程也是可以借助AI来⾼效完成。以如果在阅读过程中发现任何问题,可以指导AI进⾏相应的修改。这个过程可能需要反复⼏次,直到⽂章达到满意的标准。记住,⾼质量的内容是吸引和保持读者关注的关键。通过细致的校对和不断的优化,你的⽂章将更加值得信赖,从⽽在竞争激烈的资讯领域中脱颖⽽出。添加多媒体元素现在⽂章内容已经完善,接下来的关键步骤是为其增添视觉魅⼒,让图⽂相得益彰。我们可以通过精⼼挑选相关的图⽚、视频或图表,来丰富⽂章内容,提升其吸引⼒和专业度。这一过程可能需要投⼊一些时间,尤其是对于资讯类⽂章,所选⽤的图⽚和视频必须⾼度相关且精确,以确保信息的准确性和权威性。⽽对于其他类型的⽂章,或许可以考虑使⽤AI⽣成的图像或⽹络上的免费图⽚资源,这取决于⽂章的性质和⽬标受众。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
有没有可以抓取公众号文章的 agent
以下是一些可以抓取公众号文章的方法和相关信息: 1. 可以通过读 SQLiteDB 或者获取 RSS XML 页面(http://127.0.0.1:4000/feeds/all.atom)来获取更新的公众号。个人选择在公众号订阅不太多时,建议使用分析 XML 页面,比较简单。可以写个程序获得公众号的更新文章,由于本地部署,无法直接将文章同步到 Coze,所以选择使用多维表格(当在线数据库,事实飞书多维表格后台也是使用类似 redis 或 TiDB 这样的数据库实现的)及飞书机器人 API 的方式来实现中间数据的传递。只要在多维表格中设置一个状态转换,就可以知道文章是否已经被解读和推送。 2. 可以通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。例如使用 Docker 浏览器打开:http://127.0.0.1:4000 也可以 http://wewerss 服务的 IP:端口为上面设置的外部端口。先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号。然后在公众号源上,点添加。然后将想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(经测试最好不要超 40 个)。 3. 瓦斯阅读平台可以抓取公众号的内容,但平台上公众号不太全。 4. GitHub 上的 WeWe RSS 工具可以通过微信读书的方式订阅公众号。
2025-04-05
AI公众号排版
以下是关于 AI 公众号排版的相关内容: 公众号排版是提升阅读体验的关键因素之一。以下是一些建议: 1. 观察知名公众号的排版风格,获取灵感。 2. 若有能力和时间,可尝试创造美观且具个性的排版设计。 3. 倾向于保持简洁风格,突出内容,便于读者浏览和吸收信息。 4. 若对设计有独到见解,可多花心思让公众号脱颖而出。 关于配图: 1. 利用 AI 给出配图建议。 2. 点击链接跳转到免费图库搜索页面。 3. 在免费图库中快速找到合适且无版权风险的配图。 总结来说,用 AI 提效公众号配图的流程是:让 AI 分析文章内容,给出配图建议和关键词,然后据此在免费图库中寻找合适图片。 此外,还包括 SEO 优化和发布推广方面: SEO 优化:Kimi 会提供精选关键词用于文章优化,提升搜索引擎可见度。若对现有关键词不满意,可向 Kimi 要求生成更多精准选项。 发布和推广:选择合适平台发布文章,如个人博客、新闻聚合平台等;利用社交媒体等工具推广文章,扩大传播范围。对于推广策略的深入学习,建议自行查阅相关资料。
2025-03-28
如何写好 AI 公众号 IP 文章
要写好 AI 公众号 IP 文章,关键在于以下几点: 1. 提供清晰且具有指导性的提示词(prompt):这是 AI 生产文章的关键。基本提示词能生成基础文章,更详细、具创意的提示词能让 AI 更好地捕捉文章的语气、风格和重点。例如,“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词能为 AI 提供明确指导和文章基本结构、内容要求,生成结构完整、内容丰富、观点鲜明的文章,但最终产出的内容可能需要微调以符合预期和公众号风格。 2. 注意文章的结构和要求:对于律师相关的公众号文章,如普法文章,需要对案例进行脱敏处理,替换具体人物姓名、时间和地点。写作时要注意每部分的字数,如第一部分一百字左右,第二部分三百字左右等。同时,要按照特定的指令和要求进行,如初始化时的欢迎语、牢记要求并执行等。写作前先请求用户提供案例洞察报告作为基础材料,并询问文章面向的目标群体,然后输出纲要和写作方案。
2025-03-22
如何实现公众号用智能体+工作流,每天自动发《头条新闻》
要实现公众号用智能体+工作流每天自动发《头条新闻》,可以参考以下步骤: 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流 工作流程详解 第一步:内容获取 1. 只需输入新闻链接,系统就能自动提取核心内容。开始节点,入参包括新闻链接和视频合成插件 api_key。 2. 添加网页图片链接提取插件,承接开始节点的新闻链接。 3. 获取网页里的图片,以 1ai.net 的资讯为例,输入新闻后提取出很多链接,其中第一条链接通常是新闻主图,其他内容多为不重要的 icon。 4. 添加图片链接提取节点,若为节省写代码时间,可直接用大模型节点提取,只拿提取的链接集合的第一条,即可搞定新闻的主要图片。 5. 接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片(因为 url 节点在画板中是 string 的格式,所以必须转为 img 格式)。 6. 对于文字部分,使用链接读取节点将文字内容提取出来。 7. 在提取链接后面接上一个大模型节点,用来重写新闻成为口播稿子,可使用最强的 DeepseekR1 模型生成有吸引力的口播内容。小 tips,如果想要加上自己的特征,可以在提示词里写:“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。PS:这里的 deepseekR1 基础版本是限额使用,我们可以在专业版手动接入 DeepseekR1 手动接入推理模型。 第二步:画面生成 思路是做成一帧一帧的主图+台词,配合语音合成,保证音屏同步。 1. 用批量化节点,做成一帧一帧的画面,用画板节点完成。批量处理节点输入的是格式变化后的 json 格式的文案。 2. 画面生成的重点是:在批处理中,先把一些固定内容在画板节点安排好,比如背景图片。然后引入变量元素,比如新闻图片(已经提取并转换为 img 属性)、新闻标题(来自链接读取)、口播台词(已经提取并二创)。小 tips:想要找好看的背景图推荐去可画,挑选一个好看的视频模板然后,保存为【图片】格式,然后放在画板节点,当作底图。 第三步:语音合成 使用声音合成的官方插件,引用批处理的一句一句的新闻文案内容,可调节语速和语气,多种播音风格可选。在画板和语音合成的节点后面加入图片音频合成插件。PS:这个插件需要收费,登录 https://ts.fyshark.com//userInfo,【钱包】充值获取 token,【个人中心】获取 token,放入这个节点中,不过充值 10 元可以做好久了,这个插件适合小白同学,也有不收费的插件,但是比较吃操作,如果感兴趣也可以关注后续出相关教程。这个插件的 img_audio_video 的功能是把图片+视频合成,这样就实现了一段一段的口播新闻内容。 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 三、搭建工作流 13、循环将推送内容插入数据库 将本轮推送给用户的内容,写入数据库,下次从 rss 列表中如果再抓取到相同内容,直接跳过,避免重复推送。使用「循环」节点,输入项为第 8 步代码输出的 content_urls,这里有完整的文章内容信息。循环体设置:使用「数据库」节点,输入项为本循环节点 item 中的 url 和 suid,SQL 也是用 AI 生成的。设置循环节点的输出项:output,参数随便选,后边也用不到了。 14、结束节点 选择第 11 步输出的内容,可以在 bot 中也查看到推送的内容。 15、试运行 工作流终于搭建完了,点击右上角的试运行,选择绑定的 bot,输入数据测试。Key:输入你的 server 酱的 sendkey。rss_list:如果你没有现成的数据,可以白嫖我这个,复制下方这两条数据测试使用。试运行结果:如果工作流设置的没有问题,你会在工作流中看到这样的结果。同时,微信上也会收到这条推送,可以查看总结内容,点击链接可以查看公众号原文。点击右上角发布。
2025-03-16
公众号文章写手,智能体人设提示词
以下是为您整合的关于公众号文章写手智能体人设提示词的相关内容: 在提示词母体系列(2)中,介绍了模拟江南皮革厂销售的拟人化提示词模板,并将其应用于国内的豆包角色扮演模型,生成吸引人的广告词。若与语音技术结合用于宣传,能创造出有趣有效的销售助手。文章最后提到可通过关注微信领取拟人化提示词母体。 在夙愿:AI 工作流,赋能我的十倍增长中,提到 AI 辅助写作的几种思路,特别是注入个人特色方面。要结合 AI 输出的结果进行决策,删掉无关信息,如短视频、专家访谈、要点列表等不符合需求的内容。然后根据建议,如结合人设、自身经历、补充新信息新观点、使用语言风格、调整结构等来排列组合,得到文章选题。 在方案扩写助手中,参考 Claude 3.5 的官方提示词写法,主要能力包括对专业类方案按格式和风格扩写、拆解技术细节、提示扩写方法。智能体采用对话模式的 Prompt 设计,提示词要求专家深入思考文档需求并编写成文字,分析示例文档进行扩写,采用特定方法充实内容,保持格式、专业准确、语言自然流畅及整体连贯性可读性。
2025-03-11
做一个每日收集兴趣信息的工具,如收集agent,从微信公众号上收集,应该怎么做
以下是一种通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答的方式来做每日收集兴趣信息的工具: 1. 安装 Docker(假设已经装上) 浏览器打开:http://127.0.0.1:4000 或 http://wewerss 服务的 IP:端口(为上面设置的外部端口) 点开后,输入 Dash 管理页面密码 先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号 然后在公众号源上,点添加 将您想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(最好不超 40 个),然后在本地 data/目录会生成一个 SQLite 数据库文件 wewerss.db 2. 关于 Coze 工作流和 Bot 因为前面需要对多维表格操作,所以要先在 http://open.feishu.cn 上建一个飞书机器人,并添加知识库或多维表格编辑权限,具体可参考飞书文档。得到机器人的 app_id 和 app_secret 即可获得租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 工作流一:通过微信文章链接进行文章解读成摘要报告。通过 LLM 能力,开源提示词如下。由于 Coze 使用 LLM 和批量执行任务延时的约束,建议不要同时处理太多文章(如 6 篇左右)。这样执行后,将多维表格的文章状态转换成“已通知”并生成简报。 消息情报官 Bot:最后可以通过 Coze,建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,即可变成一个消息情报官的 Agent,我们即可以获得想要的领域或行业情报,也可以深入挖掘相关情报的信息。然后发布到想要的平台,如:Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等,即可使用。可以构建多个分身,就能收集整理不同领域和行业的情报信息。 如感兴趣欢迎联系交流合作。
2025-03-08
我是一个实体店家,我怎么能利用AI产生内容进而帮助我在流量平台拓客
以下是一些利用 AI 为实体店在流量平台拓客的方法和思路: 1. 借助抖音平台:利用抖音对实体商家的流量扶持,购买 AI 抖音发广告的软件。这需要懂软件开发的技术人员,并且熟悉抖音。 2. 利用 AI 私域做客户培育/用户旅程:通过 AI 软件自动跟进和培育客户,需求是懂软件开发的技术人员且熟悉微信。 3. 打造特定领域的 AI 工具:比如针对法律、健康、财务、教育、销售、HR 等领域,开发如“AI 合同助手”“AI 健康管家”“AI 课程生成器”“AI 销售助理”等垂类工具。 4. 作为引流者:把 AI 工具做成“公众号插件”“小程序入口”或“微信机器人”进行推广,获取分成。 5. 参考优秀作品:如商业综合体 AI 伴侣、客流诊断师、跨境商品不求人、公私域全流程内容规划师、公众号 10W+爆文工厂、营销内容文案合规检查、提示词定制神器、Nicole 咖啡门店分析师、3C 软文文案撰写、网购评论助手、万能 AI 营销助手、贴心平替推荐精灵、产品一键生成一篇高质量的知乎种草文、One thing AI 目标达成教练、润物等,从中获取灵感和思路。
2025-04-15
如何识别网页内容
识别网页内容通常可以通过以下步骤实现: 1. 内容识别:使用智能算法分析网页的 HTML 结构,确定网页的主要内容区域。 2. 文本提取:在识别出内容区域后,提取这些区域的文本内容,包括从 HTML 标签中获取可见文本,同时忽略脚本、样式和其他无需翻译的代码。 3. 预处理:对提取出的文本进行处理,清除不必要的空格、特殊字符和格式信息,进行标准化。 4. 翻译调用:将预处理后的文本拼接到 Prompt 模板中请求相关模型的 API 进行翻译。 5. 结果整合:翻译完成后,将原文和译文对照整合回网页、字幕中,常见的展示形式有原文保持不变,译文以悬浮框、下划线注释或平行文本呈现。 6. 用户界面交互:用户可通过鼠标悬停、点击等操作控制翻译的显示与否,工具会根据用户操作实时显示或隐藏译文。 另外,在获取网页内容时,初版提示词实验中对大模型对话产品的外链解析能力依赖较大,但这种方式易受平台反爬机制制裁。转换思路,通过用户浏览器以浏览器插件形式本地提取网页内容是一种稳定且经济的解决方案。开发时,可拿着初版提示词询问 AI 来确定需要插件获取哪些网页元素。例如 SeeAct 能力可以在多种不同网站上识别网页上的各种元素,执行不同任务。
2025-04-15
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
mcp 的内容
MCP(模型上下文协议)是一种创新的开放协议,由 Anthropic 公司在 2024 年 11 月推出并开源。 其主要特点和功能包括: 统一了交互标准,是链接所有 AI 应用与工具的桥梁,兼容所有 AI 应用。 具有三大功能:工具(Tools),底层使用 Function call 实现,与 OpenAI 格式兼容;资源(Resources),为 AI 提供参考信息;提示词(Prompts),预设对话模板。 主要接口路径包括获取工具列表、调用工具、获取资源列表、读取资源内容、获取提示词列表、获取提示词内容等。 转换步骤包括客户端向 MCP 服务器请求工具列表,将 MCP 工具定义转换为 Function call 格式,发送 Function Call 定义给 LLM,接收 LLM 生成的 Function call,将 Function call 转为 MCP 工具调用,发送工具调用结果给 LLM。 MCP 就像一个“转接头”或“通用插座”,其核心作用是统一不同外部服务,通过标准化接口与 AI 模型对接。它与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 MCP 最早由 Anthropic 公司开发,目的是帮助 AI 模型(如 Claude)更容易地连接工具和数据源,现在已成为一个开放协议,被越来越多的企业和开发者采用,逐渐成为 AI 与工具互动的新标准。 官方文档:https://modelcontextprotocol.io/
2025-04-13
知识库中的LangChain和LangGraph的内容有哪些 ?
以下是关于 LangChain 和 LangGraph 的相关内容: LangChain: LangChain 是一个由 Harrison Chase 开发的开源 Python 库,旨在支持使用大型语言模型(LLM)和外部资源(如数据源或语言处理系统)开发应用程序。 它提供了标准的接口,与其他工具集成,并为常见应用程序提供端到端链。 设计主张集中在模块化组件上,这些组件提供用于使用 LLM 的行为抽象,并为每个抽象提供实现的集合,从而允许开发人员构造新链或实现现成的链。 LangChain 和 RAG 的关系: LangChain 是一个用于构建高级语言模型应用程序的框架,提供了实现 RAG 所必需的工具和组件。 RAG 即检索增强生成,是一种结合了检索(检索外部知识库中相关信息)和生成(利用 LLM 生成文本)的技术。 LangChain 作为框架,与 RAG 的关系包括:是框架与技术的关系,允许通过模块化组件构建 RAG 应用程序,简化开发过程,提高性能,支持构建复杂的 RAG 应用。 关于大模型 RAG 应用中的 LangChain: 有从产品视角出发的分享,包括项目背景、初步体验和评测结果等。 预计会分成 3 篇分享,分别是 LangChain 框架初体验、调优思路分享、如何测评。
2025-04-12