Navigate to WaytoAGI Wiki →

知识库精选- 5 月 7 日

·2024-05-07·#知识库精选
知识库精选- 5 月 7 日
  • 我如何夺冠新加坡首届 GPT-4 提示工程大赛-翻译自宝玉》上个月,张席拉(Sheila Teo)非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。提示工程是一门将艺术与科学巧妙融合的学科 — 它不仅关乎技术的理解,更涉及创造力和战略思考。这里分享的是我在实践中学到的一些提示工程策略,这些策略能够精准地驱动任何大语言模型为你服务,甚至做得更多!

https://assets.waytoagi.com/usercontent/91f289f5_03e4_42f5_a152_a222193abf92_2e3f9a9038.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_14_42_53_c8fcbbdc87.png

  • AI似乎在向着奇怪的方向飞奔》作者 JioNLP 从 AI 发展方向争论谈起:杨植麟支持技术创新,朱啸虎提倡跟随 OpenAI。互联网寒冬下,AI 火爆,但找需求仍困难。AI 大模型虽进步,但仍替代不了大部分人类工作。找 AI 落地点急切,但需求匮乏,盲目探索无果。

  • 大模型月度回顾 · 2024年4月》 作者ADFeed,这是我看到非常全面详细的大模型月度回顾文章,非常清晰直观展示了上个月的大模型进展。包括不限于:

    • 谷歌在 Google Cloud Next 2024 上发布一系列生成式 AI 产品和服务,包括优化 AI 基础设施、Gemini 1.5 Pro、Vertex AI 等。
    • OpenAI 发布了 GPT-4 Turbo 模型,并开源评估框架 simple-evals,取得在 Chatbot Arena 中的首位。
    • xAI 发布了首个多模态模型 Grok-1.5V 的预览版,在多模态理解和物理世界理解方面取得显著进展。
    • 微软 WizardLM 团队发布 WizardLM-2,首次在 MT-Bench 上超越 GPT-4,但随后紧急撤回进行毒性测试。
    • Mistral AI 开源了 Mistral 8x22B 模型,具有多语言能力、数学和编程能力、成本效率等优势。
    • Meta 发布拥有 4000 亿参数的开源大模型 Llama 3,提升了性能并分为不同规模版本。

    https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_57_35_07c515f602.png

  • 波士顿咨询公司 (BCG) 发布的全球最具创新能力的50家公司「the 50 Most Innovative Companies」,自 2003 年开始每年发布最具创新力公司的报告,评选全球创新领域中最受赞誉的 50 家公司。这些年来,创新领域发生了巨大变化,许多公司在榜单中持续获得认可。创新已成为企业建立韧性和在不确定时期表现出色的核心要素。通过浏览过去的报告,可以了解宏观趋势如何塑造了公司的创新方式。

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_19_22_454c878dcd.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_28_56_b7eb97e830.png


?Xiaohu.AI 日报「5 月 7日」 ✨✨✨✨✨✨✨✨ 1️⃣

? 新款 iPad Pro 配备 M4 芯片:

  • 拥有更快的神经处理单元 (NPU) 来增强 AI 能力。
  • 支持每秒 38 万亿次运算。
  • 宣称其 AI 功能比现今的 AI PC 更加强大。
  • 更像电脑的设计风格,重点在于 M4 芯片发布,预示下月 WWDC 发布会对 AI 的全面拥抱。 ? https://x.com/imxiaohu/status/1787853964190552373

2️⃣

? STRUCTCHEM:提升大模型解决复杂化学问题能力

  • 新的提示策略,分三阶段进行:生成公式、逐步推理、复查与优化。
  • 显著提升 GPT-4 在化学推理方面的表现,可达 30 个百分点的提升。
  • 数据集覆盖量子化学、物理化学等领域。 ? 详细:https://xiaohu.ai/p/1595

3️⃣

? GPT-2 聊天机器人重回竞技场:

4️⃣

? 4 摄像头视角与 3D 骨骼姿势全息角色传送:

5️⃣

? DeepSeek 发布 2360 亿参数的 DeepSeek-V2:

  • 60 位专家混合开源模型,数学、编码和推理表现出色。
  • 236B 参数,21B 在生成过程中被激活。
  • 在 MT-Bench 上表现优异,中文能力强且性价比高。 ? 详细介绍:https://xiaohu.ai/p/7468

6️⃣

? Google Gemini 网络安全产品:

  • 检测并防御网络钓鱼攻击。
  • 结合广泛的用户和网络监控发现威胁。
  • 利用 AI 分析功能生成情报报告。 ? 详细:https://xiaohu.ai/p/7460

7️⃣

? Wayve 获超 10 亿美元 C 轮融资:

  • 开发“驾驶 GPT” 基础模型,实现具身体智能自动驾驶。
  • 使车辆在各种环境中操作,几乎无需人为干预。
  • 使车辆与人类互动、学习并理解人类行为。 ? 详细内容:https://xiaohu.ai/p/7453

8️⃣

? CURE 模型预测治疗结果:

  • 利用 300 万患者数据进行预训练并针对特定健康状况微调。
  • 效果堪比随机临床试验,能帮助理解治疗对患者健康的具体影响。
  • 学习患者数据的模式,预测不同治疗方式可能的效果。 ? 详细介绍:https://xiaohu.ai/p/7321

9️⃣

? Logo Diffusion:快速创建 Logo 标志

?

? 微软推出 MAI-1 大模型:

  • 由 Inflection CEO Mustafa Suleyman 负责。
  • 模型规模超过 5000 亿参数,远超微软之前的开源模型。
  • 使用 Inflection 技术和数据,但独立于原有项目 Pi。 ? 来源:https://t.co/aba77GFcnD
知识库精选
相关推荐
知识库精选-2026年3月18日
知识库精选-2026年3月18日
《MiniMax M2.7: 开启模型的自我进化》 《OpenClaw🦞养虾基建系列[1]:yt-dlp 可下载1700个网站视频的瑞士军刀》 《深度|OpenAI对话OpenClaw:AI 正在重新定义开发者,以一种玩乐的心态去面对AI》 《每个ADK开发者都应该了解的5种 Agent Skill 设计模式》 《构建 Claude Code 的经验:我们如何使用 Skills》
知识库精选
知识库精选-2026年3月17日
知识库精选-2026年3月17日
《一文讲透:OpenClaw多agent模式下Skills的分层调用机制》 《Harness Engineering 深度解读:AI Agent 时代的工程范式革命》 《花 2000 多块买了台 MacBook Neo 养龙虾,结果把它拆了个底朝天!(亲测!!)》 《黄仁勋2小时都发布了什么:英伟达 GTC 2026 “AI春晚” 全部重磅,一文看完》
知识库精选
知识库精选-2026年3月15日
知识库精选-2026年3月15日
《第3课:数据中枢——小龙虾协同多维表格》 《保姆级OpenClaw+Claude Code术语全攻略(万字长文)》 《从底层机制一文讲透:OpenClaw🦞如何运行多Agents》 《AI 记忆系统的核心公式:召回 = 存储 + 检索(一点小感悟)》 《OpenClaw 记忆系统演进系列(二)——构建主被动记忆的防线》 《为什么视频营销仍被低估?为什么公司没有“传统”PM?》 《大白话读懂AI的27 个大语言模型核心概念》
知识库精选
知识库精选-2026年3月14日
知识库精选-2026年3月14日
《OpenClaw 命令行手册》 《彬子:拯救金鱼记忆,OpenClaw 记忆系统演进系列(一)——搭建记忆结构的底座》 《AI 学习系统搭建指南:手把手教你打造属于你的AI私教》 《2026年了,你的拖延症,连AI都看不下去了》 《未来软件的用户将不是人...》 《深度|Anthropic CEO:AI行业的盈利本质上源于对市场需求的低估,而亏损则因为高估了需求,2030年AI行业营收将跃迁至万亿美元级》 《最全整理:有关 OpenClaw 的限制条令汇总》
知识库精选
知识库精选-2026年3月13日
知识库精选-2026年3月13日
《秒懂大模型API,教你免费体验OpenClaw》 《实测3款主流开源OCR模型:DeepSeek、PaddleOCR、GLM》 《智能体工程的 8 个等级》 《三分钟大白话:什么是SubAgent?它凭什么让OpenClaw、Claude Code、Codex中都有它的影子》 《你不知道的 Claude Code:架构、治理与工程实践》 《Uber 如何用 AI 做开发:内部实况揭秘》
知识库精选
知识库精选-2026年3月12日
知识库精选-2026年3月12日
《全链路追踪:扒开 OpenClaw 最核心的架构设计图纸》 《《OpenClaw 从入门到精通指南》正式发布,开源免费!》 《Mango:斯坦福CS146S:分布式追踪,你的系统出了问题,你为什么找不到?》 《a16z:Agent 表现不好,可能是缺乏正确的数据上下文》 《「文科生友好」手把手教你部署Claude Code,顺便聊聊OpenClaw》 《为什么当今企业都在招GTM工程师了?》 《李宏毅用 OpenClaw 讲透 AI Agent 运作原理》
知识库精选
知识库精选-2026年3月11日
知识库精选-2026年3月11日
《Gemini Embedding 2:原生多模态 embedding 模型》 《编程 Agent 如何重塑工程、产品和设计》 《【虾说】我如何带领人类同事在一个月内实现翻倍增长》 《为什么 100 万 token 窗口也救不了你的 Agent? 》 《第1课:认知破局——认识OpenClaw小龙虾》 《麻省理工研究生利用AI 将一个学期的学习压缩到 48 小时内学完》
知识库精选
知识库精选-2026年3月10日
知识库精选-2026年3月10日
《OpenClaw橙皮书-从入门到精通.pdf》 《🤖用最简单的比喻,让你秒懂OpenClaw工作原理》 《我用Claude code开发了一个微信小程序:实测78个skills,这5个组合最香》 《OpenClaw Skill下载榜 2026年3月10日》 《AI 新手扫盲 —— 一文带你了解 LLM、Chatbot、Agent》 《VPS 到手后的第一个小时:从裸机到安全可用的完整初始化指南(让你的OpenClaw更安全)》 《不写代码也能驯服 Claude Code》
知识库精选