Navigate to WaytoAGI Wiki →

知识库精选- 5 月 7 日

·2024-05-07·#知识库精选
知识库精选- 5 月 7 日
  • 我如何夺冠新加坡首届 GPT-4 提示工程大赛-翻译自宝玉》上个月,张席拉(Sheila Teo)非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。提示工程是一门将艺术与科学巧妙融合的学科 — 它不仅关乎技术的理解,更涉及创造力和战略思考。这里分享的是我在实践中学到的一些提示工程策略,这些策略能够精准地驱动任何大语言模型为你服务,甚至做得更多!

https://assets.waytoagi.com/usercontent/91f289f5_03e4_42f5_a152_a222193abf92_2e3f9a9038.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_14_42_53_c8fcbbdc87.png

  • AI似乎在向着奇怪的方向飞奔》作者 JioNLP 从 AI 发展方向争论谈起:杨植麟支持技术创新,朱啸虎提倡跟随 OpenAI。互联网寒冬下,AI 火爆,但找需求仍困难。AI 大模型虽进步,但仍替代不了大部分人类工作。找 AI 落地点急切,但需求匮乏,盲目探索无果。

  • 大模型月度回顾 · 2024年4月》 作者ADFeed,这是我看到非常全面详细的大模型月度回顾文章,非常清晰直观展示了上个月的大模型进展。包括不限于:

    • 谷歌在 Google Cloud Next 2024 上发布一系列生成式 AI 产品和服务,包括优化 AI 基础设施、Gemini 1.5 Pro、Vertex AI 等。
    • OpenAI 发布了 GPT-4 Turbo 模型,并开源评估框架 simple-evals,取得在 Chatbot Arena 中的首位。
    • xAI 发布了首个多模态模型 Grok-1.5V 的预览版,在多模态理解和物理世界理解方面取得显著进展。
    • 微软 WizardLM 团队发布 WizardLM-2,首次在 MT-Bench 上超越 GPT-4,但随后紧急撤回进行毒性测试。
    • Mistral AI 开源了 Mistral 8x22B 模型,具有多语言能力、数学和编程能力、成本效率等优势。
    • Meta 发布拥有 4000 亿参数的开源大模型 Llama 3,提升了性能并分为不同规模版本。

    https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_57_35_07c515f602.png

  • 波士顿咨询公司 (BCG) 发布的全球最具创新能力的50家公司「the 50 Most Innovative Companies」,自 2003 年开始每年发布最具创新力公司的报告,评选全球创新领域中最受赞誉的 50 家公司。这些年来,创新领域发生了巨大变化,许多公司在榜单中持续获得认可。创新已成为企业建立韧性和在不确定时期表现出色的核心要素。通过浏览过去的报告,可以了解宏观趋势如何塑造了公司的创新方式。

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_19_22_454c878dcd.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_28_56_b7eb97e830.png


?Xiaohu.AI 日报「5 月 7日」 ✨✨✨✨✨✨✨✨ 1️⃣

? 新款 iPad Pro 配备 M4 芯片:

  • 拥有更快的神经处理单元 (NPU) 来增强 AI 能力。
  • 支持每秒 38 万亿次运算。
  • 宣称其 AI 功能比现今的 AI PC 更加强大。
  • 更像电脑的设计风格,重点在于 M4 芯片发布,预示下月 WWDC 发布会对 AI 的全面拥抱。 ? https://x.com/imxiaohu/status/1787853964190552373

2️⃣

? STRUCTCHEM:提升大模型解决复杂化学问题能力

  • 新的提示策略,分三阶段进行:生成公式、逐步推理、复查与优化。
  • 显著提升 GPT-4 在化学推理方面的表现,可达 30 个百分点的提升。
  • 数据集覆盖量子化学、物理化学等领域。 ? 详细:https://xiaohu.ai/p/1595

3️⃣

? GPT-2 聊天机器人重回竞技场:

4️⃣

? 4 摄像头视角与 3D 骨骼姿势全息角色传送:

5️⃣

? DeepSeek 发布 2360 亿参数的 DeepSeek-V2:

  • 60 位专家混合开源模型,数学、编码和推理表现出色。
  • 236B 参数,21B 在生成过程中被激活。
  • 在 MT-Bench 上表现优异,中文能力强且性价比高。 ? 详细介绍:https://xiaohu.ai/p/7468

6️⃣

? Google Gemini 网络安全产品:

  • 检测并防御网络钓鱼攻击。
  • 结合广泛的用户和网络监控发现威胁。
  • 利用 AI 分析功能生成情报报告。 ? 详细:https://xiaohu.ai/p/7460

7️⃣

? Wayve 获超 10 亿美元 C 轮融资:

  • 开发“驾驶 GPT” 基础模型,实现具身体智能自动驾驶。
  • 使车辆在各种环境中操作,几乎无需人为干预。
  • 使车辆与人类互动、学习并理解人类行为。 ? 详细内容:https://xiaohu.ai/p/7453

8️⃣

? CURE 模型预测治疗结果:

  • 利用 300 万患者数据进行预训练并针对特定健康状况微调。
  • 效果堪比随机临床试验,能帮助理解治疗对患者健康的具体影响。
  • 学习患者数据的模式,预测不同治疗方式可能的效果。 ? 详细介绍:https://xiaohu.ai/p/7321

9️⃣

? Logo Diffusion:快速创建 Logo 标志

?

? 微软推出 MAI-1 大模型:

  • 由 Inflection CEO Mustafa Suleyman 负责。
  • 模型规模超过 5000 亿参数,远超微软之前的开源模型。
  • 使用 Inflection 技术和数据,但独立于原有项目 Pi。 ? 来源:https://t.co/aba77GFcnD
知识库精选
相关推荐
知识库精选-2026年6月24日
知识库精选-2026年6月24日
- 《Agent Memory 架构全景:从规则文件、会话检索到反思与技能沉淀》Agent Memory 其实已经从“存聊天记录”分化成了一整套架构。规则、画像、历史、证据、反思和技能沉淀,各有各的存储方式、加载时机和治理难题。这篇文章想完整讲清楚的,就是截至 2026 年中,这套架构到底长什么样。
知识库精选
知识库精选-2026年6月23日
知识库精选-2026年6月23日
-《小歪:我把火山发布会重点整理完了:Seedance 2.5、图片、音频、Agent 一篇看懂》火山引擎Force原动力大会发布了全系列多模态模型,覆盖文本、视频、图像、语音四大赛道,还上线了官方IP二创版权平台。Doubao-Seed-2.1 Pro实现生产级能力,支持超长视频解析、五百级多智能体协同,调用成本远低于海外大模型;Seedance 2.5支持30秒长叙事、3D白模预演与多语言局部改片;Seedream 5.0 Pro自带分层拆解、复杂图文排版能力,图像视频模型可联动创作。
知识库精选
知识库精选-2026年6月22日
知识库精选-2026年6月22日
- 《Claude Code 主创复盘疯狂的一年|对话 Boris & Cat》Claude Code 上线满一年,Boris Cherny 和 Cat Wu 以主创身份复盘了团队内部的真实工作流。他们谈论的不是某个具体功能,而是人和agent到底该怎么分工。 让我们来一起探究一下!
知识库精选
知识库精选-2026年6月21日
知识库精选-2026年6月21日
- 《Anthropic 负责人:最 AI 化的产品团队如何工作丨Lenny's Podcast》Fiona Fung 现在带着 Anthropic里Claude Code和Cowork背后的工程、产品团队,也就是Boris Cherny和Cat Wu所在的组织。她能同时看到工程师、PM、设计师、数据科学家和小企业用户怎么被AI改变。让我们一同看看最AI化的产品团队是如何工作的?
知识库精选
知识库精选-2026年6月20日
知识库精选-2026年6月20日
- 《深入理解 Claude Code:从 CLAUDE.md 到 Hooks、Skills、Subagents..》大聪明这篇文章拆解了Claude Code 七类上下文注入方案,带你清晰区分 CLAUDE.md、Rules、Skills、Subagents、Hooks 等适用场景,理清技能与隔离子Agent的分工差异。除此之外还拆解了事件驱动 Hooks 如何实现无偏差自动化,以及Dynamic Workflows的新能力。
知识库精选
知识库精选-2026年6月19日
知识库精选-2026年6月19日
- 《斯坦福 STORM 方法:如何让 Claude 在几分钟内像博士一样做研究》很多人只把Claude当成问答工具,白白浪费了它深度梳理知识的核心能力。斯坦福研发的STORM系统能产出逻辑更完整的长文,仅凭四句提示词就能在 Claude 复刻同等效果。全程无需下载软件、拉取代码、调试配置,复制粘贴就能直接使用。短短五分钟就能完成对某个主题的深度调研,梳理出的知识框架也条理清晰。快来试试!
知识库精选
知识库精选-2026年6月18日
知识库精选-2026年6月18日
- 《Anthropic CEO 深度访谈:Claude、AI公司与未来工作丨Bloomberg》Anthropic CEO Dario Amodei的深度访谈横跨他离开 OpenAI、Claude 的企业路线、SaaS 冲击、白领岗位、国防合作和 AI 治理。这场访谈最有价值的地方在于把AI 的真实影响放回组织现场:商业模式、客户流程、岗位迁移、政府边界都会一起变化。让我们一起来看看!
知识库精选
知识库精选-2026年6月17日
知识库精选-2026年6月17日
- 《基于Claude 的Agent Harness工程:从单一智能体到自迭代系统的 14 步路线图》大家都在聊循环。几乎没人认真讨论循环到底跑在什么之上。10 个开发者里有 9 个直接用 Claude Code 的默认harness:没有规则,没有子智能体,没有钩子,也没有记忆。本篇文章是一条 14 步路线图,讲的是如何搭好这层harness,从一个智能体,走到一个能自我改进的系统。
知识库精选