Navigate to WaytoAGI Wiki →

知识库精选- 5 月 30 日

·2024-05-30·#知识库精选

知识库精选- 5 月 30 日

《a16z 发布 AI 语音 Agent 图谱：重塑通话的时机到了》a16z 发布的 AI 语音 Agent 图谱指出，现在是重新定义电话的时代。人工智能技术让语音通话更高效，节省成本，提升用户体验。对企业来说，可以提高收入、降低风险；对消费者来说，提供免费高质量服务。AI 语音助手的发展机遇在于构建效率、垂直专业化、实际业务范围。技术架构包括多模态模型、全栈解决方案和自定义组装。B2B 语音助手演变从 IVR 到 AI 2.0，重点在特定行业、法规和集成。未来趋势是向更自然、更人性化的 AI 语音助手发展。

《纽约大学 Alex Sheng：AI 程序员 Devin 的自我迭代之路 | Agent Insights》介绍了纽约大学的 AI 程序员 Alex Sheng 开发的 Self-Improving Computer Agent，能够自我进步迭代。他在研究中受到 Jurgen Schmidhuber 的启发，通过在计算机 OS 系统中生成和执行代码，实现 Agent 的自我增强与完善。虽然目前仍有一些限制，但这种技术有望应用于计算机任务的自动化执行，具有较强的可编辑性和创造性。

《OpenAI联创：RLHF是超级智能的秘密武器》本文是关于 OpenAI 联合创始人 John Schulman 的访谈，他认为模型的 post-training 和处理连续任务能力将是未来超级智能的关键。在未来，模型将能够执行更复杂和深度的任务，如编程项目完成、纠错能力增强等。模型的泛化能力将帮助其在出现问题时迅速自我调整。随着模型能力的提升，未来将会面临更高的训练成本，但也可能出现阶段性转变，使模型具备处理连续任务的能力。然而，尽管模型会变得与人类一样聪明，仍需解决一些小缺陷和挑战，才能达到人类水平或更高水平的智能。

《如何让自己的歌曲发布时更“好听”》本文介绍了如何通过在线 AI Mastering 网站让自己的歌曲在发布时更加 “好听”。推荐了几个提供 AI Mastering 服务的网站，并详细介绍了使用免费网站的步骤，包括上传文件、选择处理模式、配置参数等。通过这些步骤，可以让歌曲的质量得到提升，更符合发布标准。
《RAG提示工程系列（3）| 迈向工程化应用》作者：蓝衣剑客、云中江树，本文介绍了在 AI 领域中如何进行工程化应用，重点讨论了 RAG 框架的选择、业务流设计和提示词编写等步骤。通过实践经验分享，提出了在落地大模型解决方案时需优先考虑解决方案、重视应用层面，以及根据特定需求设定模型功能的重要性。文章强调了工程化在 AI 落地应用中的关键作用。

《OpenAI：GPTs 向全部用户开放，使用 GPT-4o》OpenAI 宣布对所有客户免费开放了网络搜索、视觉、数据分析和文件上传功能，甚至 GPTs 开放给所有用户使用，使用最新的 GPT-4o 模型。建议开发者测试和审查他们的 GPT，确保其表现如预期。

《从美国软件企业的统计数据看AI的发展情况》来自五源资本的翻译文章，根据美国软件企业的统计数据，2023 年软件企业的 ARR 增长率下降，融资困难加剧，60% 的企业使用 GenAI 技术，面临盈利挑战。部分企业采用 GenAI 功能后，研发投入增加，净收入留存率提高。GenAI 原生类企业获得更多投资。

?Xiaohu.AI 日报「5 月 30 日」 ✨✨✨✨✨✨✨✨ 1⃣️ ?️山寨版阿里AnimateAnyone开源：

利用图像和视频中的人物姿势来合成动画。
Novita AI开源并提供API支持。
提供照片和视频，即可自动生成动画。 ? GitHub：https://github.com/novitalabs/AnimateAnyone ? API：https://novita.ai/playground#animate-anyone ? https://x.com/imxiaohu/status/1796191458052944072

2⃣️ ?ViViD视频虚拟试穿技术：

阿里巴巴开发，可以替换视频中人物的衣服。
生成真实自然的视频，支持多种服装类型。
在视觉质量、时间一致性和细节保留方面表现优异。 ? https://x.com/imxiaohu/status/1796019244678906340

3⃣️ ?udio-130音乐生成模型：

Udio新推出，生成2分钟的音频，提升曲目连贯性和结构。
新增高级控制功能：随机种子、剪辑时间、提示词或歌词强度调节。 ? 详细：https://xiaohu.ai/p/8738 ? https://x.com/imxiaohu/status/1795999902830629249

4⃣️ ?Codestral代码生成模型：

Mistral AI推出，支持80多种编程语言，包括Python、Java、C等。
自动完成代码、编写测试，并能填补未完成的代码部分。
拥有32k上下文窗口，在多项基准测试中表现出色。 ? 详细：https://mistral.ai/news/codestral/ ? https://x.com/imxiaohu/status/1795987350713192937

5⃣️ ?Suno音乐演示：

新视频展示从任何声音创作歌曲。
VOL-2：古典钢琴加法国手风琴，由钢琴家兼工程师Anessa表演。 ? https://x.com/imxiaohu/status/1795976717905043467

知识库精选

相关推荐

知识库精选-2026年6月24日

知识库精选-2026年6月24日

- 《Agent Memory 架构全景：从规则文件、会话检索到反思与技能沉淀》Agent Memory 其实已经从“存聊天记录”分化成了一整套架构。规则、画像、历史、证据、反思和技能沉淀，各有各的存储方式、加载时机和治理难题。这篇文章想完整讲清楚的，就是截至 2026 年中，这套架构到底长什么样。

知识库精选

知识库精选-2026年6月23日

知识库精选-2026年6月23日

-《小歪：我把火山发布会重点整理完了：Seedance 2.5、图片、音频、Agent 一篇看懂》火山引擎Force原动力大会发布了全系列多模态模型，覆盖文本、视频、图像、语音四大赛道，还上线了官方IP二创版权平台。Doubao-Seed-2.1 Pro实现生产级能力，支持超长视频解析、五百级多智能体协同，调用成本远低于海外大模型；Seedance 2.5支持30秒长叙事、3D白模预演与多语言局部改片；Seedream 5.0 Pro自带分层拆解、复杂图文排版能力，图像视频模型可联动创作。

知识库精选

知识库精选-2026年6月22日

知识库精选-2026年6月22日

- 《Claude Code 主创复盘疯狂的一年｜对话 Boris & Cat》Claude Code 上线满一年，Boris Cherny 和 Cat Wu 以主创身份复盘了团队内部的真实工作流。他们谈论的不是某个具体功能，而是人和agent到底该怎么分工。让我们来一起探究一下！

知识库精选

知识库精选-2026年6月21日

知识库精选-2026年6月21日

- 《Anthropic 负责人：最 AI 化的产品团队如何工作丨Lenny's Podcast》Fiona Fung 现在带着 Anthropic里Claude Code和Cowork背后的工程、产品团队，也就是Boris Cherny和Cat Wu所在的组织。她能同时看到工程师、PM、设计师、数据科学家和小企业用户怎么被AI改变。让我们一同看看最AI化的产品团队是如何工作的？

知识库精选

知识库精选-2026年6月20日

知识库精选-2026年6月20日

- 《深入理解 Claude Code：从 CLAUDE.md 到 Hooks、Skills、Subagents..》大聪明这篇文章拆解了Claude Code 七类上下文注入方案，带你清晰区分 CLAUDE.md、Rules、Skills、Subagents、Hooks 等适用场景，理清技能与隔离子Agent的分工差异。除此之外还拆解了事件驱动 Hooks 如何实现无偏差自动化，以及Dynamic Workflows的新能力。

知识库精选

知识库精选-2026年6月19日

知识库精选-2026年6月19日

- 《斯坦福 STORM 方法：如何让 Claude 在几分钟内像博士一样做研究》很多人只把Claude当成问答工具，白白浪费了它深度梳理知识的核心能力。斯坦福研发的STORM系统能产出逻辑更完整的长文，仅凭四句提示词就能在 Claude 复刻同等效果。全程无需下载软件、拉取代码、调试配置，复制粘贴就能直接使用。短短五分钟就能完成对某个主题的深度调研，梳理出的知识框架也条理清晰。快来试试！

知识库精选

知识库精选-2026年6月18日

知识库精选-2026年6月18日

- 《Anthropic CEO 深度访谈：Claude、AI公司与未来工作丨Bloomberg》Anthropic CEO Dario Amodei的深度访谈横跨他离开 OpenAI、Claude 的企业路线、SaaS 冲击、白领岗位、国防合作和 AI 治理。这场访谈最有价值的地方在于把AI 的真实影响放回组织现场：商业模式、客户流程、岗位迁移、政府边界都会一起变化。让我们一起来看看！

知识库精选

知识库精选-2026年6月17日

知识库精选-2026年6月17日

- 《基于Claude 的Agent Harness工程：从单一智能体到自迭代系统的 14 步路线图》大家都在聊循环。几乎没人认真讨论循环到底跑在什么之上。10 个开发者里有 9 个直接用 Claude Code 的默认harness：没有规则，没有子智能体，没有钩子，也没有记忆。本篇文章是一条 14 步路线图，讲的是如何搭好这层harness，从一个智能体，走到一个能自我改进的系统。

知识库精选