Navigate to WaytoAGI Wiki →

知识库精选- 4 月 17 日

·2024-04-17·#知识库精选
知识库精选- 4 月 17 日

更多精彩博客:Diffuseum 播客-生成式模型研究Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录关注的一线开发者的故事

https://assets.waytoagi.com/usercontent/1280_X128022_40c138e3d2.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_50_49_6e9f5d0e9d.png

  • Agent调研--19类Agent框架对比》作者骁骑,开源的Agent应用可以说是百花齐放,文章也是挑选了热度和讨论度较高的19类Agent,基本能覆盖主流的Agent框架,每个类型都做了一个简单的summary、作为一个参考供大家学习。

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_15_41_35cd81a44f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_12_18_b73fb8844f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_12_22_43_f295739c3c.png


?Xiaohu.AI日报「4月17日」 ✨✨✨✨✨✨✨✨ 1⃣️ ? Stable Diffusion 3 API 发布 Stability AI 宣布支持 Stable Diffusion 3 及其 Turbo 版本。 SD3 在文字到图像生成领域性能优越,特别是在字体和提示遵循方面。 Stability AI 暗示未来可能收费但未定发布日期。

https://x.com/imxiaohu/status/1780604711743402066

2⃣️ ? 波士顿动力发布全新电动Atlas机器人 停止开发液压动力版本,转向全电动。 新电动Atlas设计轻巧,动作平滑,适用于复杂狭窄空间。 特点包括180度头部旋转,自我恢复能力,紧凑转弯能力。

https://x.com/imxiaohu/status/1780599667824513480

3⃣️ ?️ FireCrawl开源爬虫工具 无需站点地图,可抓取任何网站的所有可访问子页面。 抓取内容可转换为Markdown格式,支持JavaScript动态内容。 提供易用API,简化内容爬取和转换。

https://x.com/imxiaohu/status/1780592067586269465

4⃣️ ? InstantMesh: 10秒快速生成3D模型 腾讯开发,结合多视图扩散模型和LRM。 在10秒内创建高精度3D模型。 可在线体验该技术。

https://x.com/imxiaohu/status/1780586192385483106

5⃣️ ?️ Spline推出AI 3D Generation工具 支持文本生成3D模型,一次生成4种变体。 2D图像转3D图像,混合素材生成3D变体。 生成的3D内容可集成到网站和应用中。

https://x.com/imxiaohu/status/1780496970064552132

6⃣️ ? ZeST单一图像材质迁移技术 无需先前训练,可进行单一或多重材质编辑。 快速处理,不依赖云计算或服务器。 牛津大学、Stability AI 和 MIT CSAIL共同研发。

https://x.com/imxiaohu/status/1780487355696378210

7⃣️ ? 苹果iOS 18人工智能功能 首批AI功能将完全在设备上运行,保障隐私。 苹果正在开发大语言模型 "Ajax"。 苹果可能会在6月的WWDC大会上公布更多AI计划。

https://appleinsider.com/articles/24/04/15/apples-...

8⃣️ ? Reka Core: 强大的多模态语言模型 处理文本、图像、音频和视频的能力可与GPT-4V相媲美。 提供不同规模模型以满足业务需求。 Reka AI团队成员遍布全球,采用远程优先工作模式。

https://x.com/imxiaohu/status/1780428801908134319

9⃣️ ? CTRL-F-VIDEO: 视频中搜索特定词汇 通过Chrome扩展在YouTube视频中搜索关键词。 使用Whisper模型将音频转换为文本实现搜索。

https://x.com/imxiaohu/status/1780223867782578306

知识库精选
相关推荐
知识库精选-2026年6月24日
知识库精选-2026年6月24日
- 《Agent Memory 架构全景:从规则文件、会话检索到反思与技能沉淀》Agent Memory 其实已经从“存聊天记录”分化成了一整套架构。规则、画像、历史、证据、反思和技能沉淀,各有各的存储方式、加载时机和治理难题。这篇文章想完整讲清楚的,就是截至 2026 年中,这套架构到底长什么样。
知识库精选
知识库精选-2026年6月23日
知识库精选-2026年6月23日
-《小歪:我把火山发布会重点整理完了:Seedance 2.5、图片、音频、Agent 一篇看懂》火山引擎Force原动力大会发布了全系列多模态模型,覆盖文本、视频、图像、语音四大赛道,还上线了官方IP二创版权平台。Doubao-Seed-2.1 Pro实现生产级能力,支持超长视频解析、五百级多智能体协同,调用成本远低于海外大模型;Seedance 2.5支持30秒长叙事、3D白模预演与多语言局部改片;Seedream 5.0 Pro自带分层拆解、复杂图文排版能力,图像视频模型可联动创作。
知识库精选
知识库精选-2026年6月22日
知识库精选-2026年6月22日
- 《Claude Code 主创复盘疯狂的一年|对话 Boris & Cat》Claude Code 上线满一年,Boris Cherny 和 Cat Wu 以主创身份复盘了团队内部的真实工作流。他们谈论的不是某个具体功能,而是人和agent到底该怎么分工。 让我们来一起探究一下!
知识库精选
知识库精选-2026年6月21日
知识库精选-2026年6月21日
- 《Anthropic 负责人:最 AI 化的产品团队如何工作丨Lenny's Podcast》Fiona Fung 现在带着 Anthropic里Claude Code和Cowork背后的工程、产品团队,也就是Boris Cherny和Cat Wu所在的组织。她能同时看到工程师、PM、设计师、数据科学家和小企业用户怎么被AI改变。让我们一同看看最AI化的产品团队是如何工作的?
知识库精选
知识库精选-2026年6月20日
知识库精选-2026年6月20日
- 《深入理解 Claude Code:从 CLAUDE.md 到 Hooks、Skills、Subagents..》大聪明这篇文章拆解了Claude Code 七类上下文注入方案,带你清晰区分 CLAUDE.md、Rules、Skills、Subagents、Hooks 等适用场景,理清技能与隔离子Agent的分工差异。除此之外还拆解了事件驱动 Hooks 如何实现无偏差自动化,以及Dynamic Workflows的新能力。
知识库精选
知识库精选-2026年6月19日
知识库精选-2026年6月19日
- 《斯坦福 STORM 方法:如何让 Claude 在几分钟内像博士一样做研究》很多人只把Claude当成问答工具,白白浪费了它深度梳理知识的核心能力。斯坦福研发的STORM系统能产出逻辑更完整的长文,仅凭四句提示词就能在 Claude 复刻同等效果。全程无需下载软件、拉取代码、调试配置,复制粘贴就能直接使用。短短五分钟就能完成对某个主题的深度调研,梳理出的知识框架也条理清晰。快来试试!
知识库精选
知识库精选-2026年6月18日
知识库精选-2026年6月18日
- 《Anthropic CEO 深度访谈:Claude、AI公司与未来工作丨Bloomberg》Anthropic CEO Dario Amodei的深度访谈横跨他离开 OpenAI、Claude 的企业路线、SaaS 冲击、白领岗位、国防合作和 AI 治理。这场访谈最有价值的地方在于把AI 的真实影响放回组织现场:商业模式、客户流程、岗位迁移、政府边界都会一起变化。让我们一起来看看!
知识库精选
知识库精选-2026年6月17日
知识库精选-2026年6月17日
- 《基于Claude 的Agent Harness工程:从单一智能体到自迭代系统的 14 步路线图》大家都在聊循环。几乎没人认真讨论循环到底跑在什么之上。10 个开发者里有 9 个直接用 Claude Code 的默认harness:没有规则,没有子智能体,没有钩子,也没有记忆。本篇文章是一条 14 步路线图,讲的是如何搭好这层harness,从一个智能体,走到一个能自我改进的系统。
知识库精选