Navigate to WaytoAGI Wiki →

知识库精选- 4 月 17 日

·2024-04-17·#知识库精选
知识库精选- 4 月 17 日

更多精彩博客:Diffuseum 播客-生成式模型研究Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录关注的一线开发者的故事

https://assets.waytoagi.com/usercontent/1280_X128022_40c138e3d2.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_50_49_6e9f5d0e9d.png

  • Agent调研--19类Agent框架对比》作者骁骑,开源的Agent应用可以说是百花齐放,文章也是挑选了热度和讨论度较高的19类Agent,基本能覆盖主流的Agent框架,每个类型都做了一个简单的summary、作为一个参考供大家学习。

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_15_41_35cd81a44f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_12_18_b73fb8844f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_12_22_43_f295739c3c.png


?Xiaohu.AI日报「4月17日」 ✨✨✨✨✨✨✨✨ 1⃣️ ? Stable Diffusion 3 API 发布 Stability AI 宣布支持 Stable Diffusion 3 及其 Turbo 版本。 SD3 在文字到图像生成领域性能优越,特别是在字体和提示遵循方面。 Stability AI 暗示未来可能收费但未定发布日期。

https://x.com/imxiaohu/status/1780604711743402066

2⃣️ ? 波士顿动力发布全新电动Atlas机器人 停止开发液压动力版本,转向全电动。 新电动Atlas设计轻巧,动作平滑,适用于复杂狭窄空间。 特点包括180度头部旋转,自我恢复能力,紧凑转弯能力。

https://x.com/imxiaohu/status/1780599667824513480

3⃣️ ?️ FireCrawl开源爬虫工具 无需站点地图,可抓取任何网站的所有可访问子页面。 抓取内容可转换为Markdown格式,支持JavaScript动态内容。 提供易用API,简化内容爬取和转换。

https://x.com/imxiaohu/status/1780592067586269465

4⃣️ ? InstantMesh: 10秒快速生成3D模型 腾讯开发,结合多视图扩散模型和LRM。 在10秒内创建高精度3D模型。 可在线体验该技术。

https://x.com/imxiaohu/status/1780586192385483106

5⃣️ ?️ Spline推出AI 3D Generation工具 支持文本生成3D模型,一次生成4种变体。 2D图像转3D图像,混合素材生成3D变体。 生成的3D内容可集成到网站和应用中。

https://x.com/imxiaohu/status/1780496970064552132

6⃣️ ? ZeST单一图像材质迁移技术 无需先前训练,可进行单一或多重材质编辑。 快速处理,不依赖云计算或服务器。 牛津大学、Stability AI 和 MIT CSAIL共同研发。

https://x.com/imxiaohu/status/1780487355696378210

7⃣️ ? 苹果iOS 18人工智能功能 首批AI功能将完全在设备上运行,保障隐私。 苹果正在开发大语言模型 "Ajax"。 苹果可能会在6月的WWDC大会上公布更多AI计划。

https://appleinsider.com/articles/24/04/15/apples-...

8⃣️ ? Reka Core: 强大的多模态语言模型 处理文本、图像、音频和视频的能力可与GPT-4V相媲美。 提供不同规模模型以满足业务需求。 Reka AI团队成员遍布全球,采用远程优先工作模式。

https://x.com/imxiaohu/status/1780428801908134319

9⃣️ ? CTRL-F-VIDEO: 视频中搜索特定词汇 通过Chrome扩展在YouTube视频中搜索关键词。 使用Whisper模型将音频转换为文本实现搜索。

https://x.com/imxiaohu/status/1780223867782578306

知识库精选
相关推荐
知识库精选-2026年3月18日
知识库精选-2026年3月18日
《MiniMax M2.7: 开启模型的自我进化》 《OpenClaw🦞养虾基建系列[1]:yt-dlp 可下载1700个网站视频的瑞士军刀》 《深度|OpenAI对话OpenClaw:AI 正在重新定义开发者,以一种玩乐的心态去面对AI》 《每个ADK开发者都应该了解的5种 Agent Skill 设计模式》 《构建 Claude Code 的经验:我们如何使用 Skills》
知识库精选
知识库精选-2026年3月17日
知识库精选-2026年3月17日
《一文讲透:OpenClaw多agent模式下Skills的分层调用机制》 《Harness Engineering 深度解读:AI Agent 时代的工程范式革命》 《花 2000 多块买了台 MacBook Neo 养龙虾,结果把它拆了个底朝天!(亲测!!)》 《黄仁勋2小时都发布了什么:英伟达 GTC 2026 “AI春晚” 全部重磅,一文看完》
知识库精选
知识库精选-2026年3月15日
知识库精选-2026年3月15日
《第3课:数据中枢——小龙虾协同多维表格》 《保姆级OpenClaw+Claude Code术语全攻略(万字长文)》 《从底层机制一文讲透:OpenClaw🦞如何运行多Agents》 《AI 记忆系统的核心公式:召回 = 存储 + 检索(一点小感悟)》 《OpenClaw 记忆系统演进系列(二)——构建主被动记忆的防线》 《为什么视频营销仍被低估?为什么公司没有“传统”PM?》 《大白话读懂AI的27 个大语言模型核心概念》
知识库精选
知识库精选-2026年3月14日
知识库精选-2026年3月14日
《OpenClaw 命令行手册》 《彬子:拯救金鱼记忆,OpenClaw 记忆系统演进系列(一)——搭建记忆结构的底座》 《AI 学习系统搭建指南:手把手教你打造属于你的AI私教》 《2026年了,你的拖延症,连AI都看不下去了》 《未来软件的用户将不是人...》 《深度|Anthropic CEO:AI行业的盈利本质上源于对市场需求的低估,而亏损则因为高估了需求,2030年AI行业营收将跃迁至万亿美元级》 《最全整理:有关 OpenClaw 的限制条令汇总》
知识库精选
知识库精选-2026年3月13日
知识库精选-2026年3月13日
《秒懂大模型API,教你免费体验OpenClaw》 《实测3款主流开源OCR模型:DeepSeek、PaddleOCR、GLM》 《智能体工程的 8 个等级》 《三分钟大白话:什么是SubAgent?它凭什么让OpenClaw、Claude Code、Codex中都有它的影子》 《你不知道的 Claude Code:架构、治理与工程实践》 《Uber 如何用 AI 做开发:内部实况揭秘》
知识库精选
知识库精选-2026年3月12日
知识库精选-2026年3月12日
《全链路追踪:扒开 OpenClaw 最核心的架构设计图纸》 《《OpenClaw 从入门到精通指南》正式发布,开源免费!》 《Mango:斯坦福CS146S:分布式追踪,你的系统出了问题,你为什么找不到?》 《a16z:Agent 表现不好,可能是缺乏正确的数据上下文》 《「文科生友好」手把手教你部署Claude Code,顺便聊聊OpenClaw》 《为什么当今企业都在招GTM工程师了?》 《李宏毅用 OpenClaw 讲透 AI Agent 运作原理》
知识库精选
知识库精选-2026年3月11日
知识库精选-2026年3月11日
《Gemini Embedding 2:原生多模态 embedding 模型》 《编程 Agent 如何重塑工程、产品和设计》 《【虾说】我如何带领人类同事在一个月内实现翻倍增长》 《为什么 100 万 token 窗口也救不了你的 Agent? 》 《第1课:认知破局——认识OpenClaw小龙虾》 《麻省理工研究生利用AI 将一个学期的学习压缩到 48 小时内学完》
知识库精选
知识库精选-2026年3月10日
知识库精选-2026年3月10日
《OpenClaw橙皮书-从入门到精通.pdf》 《🤖用最简单的比喻,让你秒懂OpenClaw工作原理》 《我用Claude code开发了一个微信小程序:实测78个skills,这5个组合最香》 《OpenClaw Skill下载榜 2026年3月10日》 《AI 新手扫盲 —— 一文带你了解 LLM、Chatbot、Agent》 《VPS 到手后的第一个小时:从裸机到安全可用的完整初始化指南(让你的OpenClaw更安全)》 《不写代码也能驯服 Claude Code》
知识库精选