Navigate to WaytoAGI Wiki →

知识库精选- 4 月 17 日

·2024-04-17·#知识库精选
知识库精选- 4 月 17 日

更多精彩博客:Diffuseum 播客-生成式模型研究Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录关注的一线开发者的故事

https://assets.waytoagi.com/usercontent/1280_X128022_40c138e3d2.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_50_49_6e9f5d0e9d.png

  • Agent调研--19类Agent框架对比》作者骁骑,开源的Agent应用可以说是百花齐放,文章也是挑选了热度和讨论度较高的19类Agent,基本能覆盖主流的Agent框架,每个类型都做了一个简单的summary、作为一个参考供大家学习。

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_15_41_35cd81a44f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_13_12_18_b73fb8844f.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_04_17_12_22_43_f295739c3c.png


?Xiaohu.AI日报「4月17日」 ✨✨✨✨✨✨✨✨ 1⃣️ ? Stable Diffusion 3 API 发布 Stability AI 宣布支持 Stable Diffusion 3 及其 Turbo 版本。 SD3 在文字到图像生成领域性能优越,特别是在字体和提示遵循方面。 Stability AI 暗示未来可能收费但未定发布日期。

https://x.com/imxiaohu/status/1780604711743402066

2⃣️ ? 波士顿动力发布全新电动Atlas机器人 停止开发液压动力版本,转向全电动。 新电动Atlas设计轻巧,动作平滑,适用于复杂狭窄空间。 特点包括180度头部旋转,自我恢复能力,紧凑转弯能力。

https://x.com/imxiaohu/status/1780599667824513480

3⃣️ ?️ FireCrawl开源爬虫工具 无需站点地图,可抓取任何网站的所有可访问子页面。 抓取内容可转换为Markdown格式,支持JavaScript动态内容。 提供易用API,简化内容爬取和转换。

https://x.com/imxiaohu/status/1780592067586269465

4⃣️ ? InstantMesh: 10秒快速生成3D模型 腾讯开发,结合多视图扩散模型和LRM。 在10秒内创建高精度3D模型。 可在线体验该技术。

https://x.com/imxiaohu/status/1780586192385483106

5⃣️ ?️ Spline推出AI 3D Generation工具 支持文本生成3D模型,一次生成4种变体。 2D图像转3D图像,混合素材生成3D变体。 生成的3D内容可集成到网站和应用中。

https://x.com/imxiaohu/status/1780496970064552132

6⃣️ ? ZeST单一图像材质迁移技术 无需先前训练,可进行单一或多重材质编辑。 快速处理,不依赖云计算或服务器。 牛津大学、Stability AI 和 MIT CSAIL共同研发。

https://x.com/imxiaohu/status/1780487355696378210

7⃣️ ? 苹果iOS 18人工智能功能 首批AI功能将完全在设备上运行,保障隐私。 苹果正在开发大语言模型 "Ajax"。 苹果可能会在6月的WWDC大会上公布更多AI计划。

https://appleinsider.com/articles/24/04/15/apples-...

8⃣️ ? Reka Core: 强大的多模态语言模型 处理文本、图像、音频和视频的能力可与GPT-4V相媲美。 提供不同规模模型以满足业务需求。 Reka AI团队成员遍布全球,采用远程优先工作模式。

https://x.com/imxiaohu/status/1780428801908134319

9⃣️ ? CTRL-F-VIDEO: 视频中搜索特定词汇 通过Chrome扩展在YouTube视频中搜索关键词。 使用Whisper模型将音频转换为文本实现搜索。

https://x.com/imxiaohu/status/1780223867782578306

知识库精选
相关推荐
知识库精选-2025年12月3日
知识库精选-2025年12月3日
《进化版卡通动漫英语单词卡,提示词模板安排上了。》 《浩宇:「从信息焦虑到第二大脑」—— AI 智能体训练营二期 1–8 课实战复盘》 《岩风:告别“小爱同学”:我开发了一款本地化 AI 手势控制插件,毫秒级响应》
知识库精选
知识库精选-2025年12月4日
知识库精选-2025年12月4日
《Claude Opus 4.5 的灵魂文档被人逆向提取!》 《独家丨视频生成产品 Pollo AI 获 1400 万美元融资,一个没有大厂与海外背景的 “草根” 创始人》 《赛博禅心:大模型如何「在思考中使用工具」|Interleaved Thinking》 《白苏:飞书AI效率先锋总决赛:为什么赢的都是"业务人"?》 《大圣:6000 字保姆级教程,大圣带你全面掌握谷歌 AI Studio》 《豆包 Seedream 4.5 使用指南》
知识库精选
知识库精选-2025年12月2日
知识库精选-2025年12月2日
《李幸:Siri的Agent智能体COZE实战训练营1-8全课程笔记》 《视频进入可编辑时代:藏师傅教你视频版 Banana 可灵 O1》 《电商详情图别再外包了!n8n+Nano Banana Pro,低成本搞定商用级出图,一套流程自动保存本地》 《Gemini Prompt:小红书变现达人-流量的尽头是变现》
知识库精选
知识库精选-2025年12月1日
知识库精选-2025年12月1日
《AI音乐周刊 W.A 004》 《DeepSeek-V3.2|技术报告解读》 《Claude Code保姆级入门:不会命令行也能用,我把5个必学技巧全整理好了》 《Gemini Prompt: 陷入困局?我做了一个谋圣鬼谷子AI分身,专治各种“想不通”》
知识库精选
知识库精选-2025年11月30日
知识库精选-2025年11月30日
《11月开源模型汇总,是被闭源打自闭的一个月》 《飞书多维表格保姆级教程来了,字段类型选不对,再牛的自动化也跑不通》 《AI 时代,你的孩子要学会这些》 《Gemini Prompt:我把耶鲁心理学博士“装”进了手机,给焦虑的自己留了一个逃生口》
知识库精选
知识库精选-2025年11月29日
知识库精选-2025年11月29日
《Nano-Banana Pro: 官方提示指南与策略| Prompting Guide & Strategies 》 《歸藏:🍌 渐变拟物玻璃卡片风格 PPT 提示词|Nano Banana Pro》 《【小红书神器】把视频教程自动转成漫画图文,植入自己的角色,还可以用来发小红书》 《Gemini Prompt: 我把“产品之神”的灵魂注入了AI,给产品设计做精准外科手术》
知识库精选
知识库精选-2025年11月28日
知识库精选-2025年11月28日
《📒6个邪修字效|让文字会讲故事》 《n8n官方杀入MCP战场,第三方方案要凉?》 《大模型边际效应下降,小模型正在悄悄逆袭》 《Black Friday 2025 优惠汇总》
知识库精选
知识库精选-2025年11月26日
知识库精选-2025年11月26日
《品味,就是生产力|Taste is all you need》 《Nano Banana Pro杀疯了!45组实测对比即梦4.0,谁才是真正的中文生图之王?》 《成峰:Claude Skills 写作指南:从0到1看完就会,不会来找我》 《Lovart+Nano Banana Pro超多用法合集,这次真的对PS贴脸开大了》
知识库精选