Navigate to WaytoAGI Wiki →

知识库精选- 5 月 7 日

·2024-05-07·#知识库精选
知识库精选- 5 月 7 日
  • 我如何夺冠新加坡首届 GPT-4 提示工程大赛-翻译自宝玉》上个月,张席拉(Sheila Teo)非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。提示工程是一门将艺术与科学巧妙融合的学科 — 它不仅关乎技术的理解,更涉及创造力和战略思考。这里分享的是我在实践中学到的一些提示工程策略,这些策略能够精准地驱动任何大语言模型为你服务,甚至做得更多!

https://assets.waytoagi.com/usercontent/91f289f5_03e4_42f5_a152_a222193abf92_2e3f9a9038.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_14_42_53_c8fcbbdc87.png

  • AI似乎在向着奇怪的方向飞奔》作者 JioNLP 从 AI 发展方向争论谈起:杨植麟支持技术创新,朱啸虎提倡跟随 OpenAI。互联网寒冬下,AI 火爆,但找需求仍困难。AI 大模型虽进步,但仍替代不了大部分人类工作。找 AI 落地点急切,但需求匮乏,盲目探索无果。

  • 大模型月度回顾 · 2024年4月》 作者ADFeed,这是我看到非常全面详细的大模型月度回顾文章,非常清晰直观展示了上个月的大模型进展。包括不限于:

    • 谷歌在 Google Cloud Next 2024 上发布一系列生成式 AI 产品和服务,包括优化 AI 基础设施、Gemini 1.5 Pro、Vertex AI 等。
    • OpenAI 发布了 GPT-4 Turbo 模型,并开源评估框架 simple-evals,取得在 Chatbot Arena 中的首位。
    • xAI 发布了首个多模态模型 Grok-1.5V 的预览版,在多模态理解和物理世界理解方面取得显著进展。
    • 微软 WizardLM 团队发布 WizardLM-2,首次在 MT-Bench 上超越 GPT-4,但随后紧急撤回进行毒性测试。
    • Mistral AI 开源了 Mistral 8x22B 模型,具有多语言能力、数学和编程能力、成本效率等优势。
    • Meta 发布拥有 4000 亿参数的开源大模型 Llama 3,提升了性能并分为不同规模版本。

    https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_57_35_07c515f602.png

  • 波士顿咨询公司 (BCG) 发布的全球最具创新能力的50家公司「the 50 Most Innovative Companies」,自 2003 年开始每年发布最具创新力公司的报告,评选全球创新领域中最受赞誉的 50 家公司。这些年来,创新领域发生了巨大变化,许多公司在榜单中持续获得认可。创新已成为企业建立韧性和在不确定时期表现出色的核心要素。通过浏览过去的报告,可以了解宏观趋势如何塑造了公司的创新方式。

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_19_22_454c878dcd.png

https://assets.waytoagi.com/usercontent/Xnapper_2024_05_07_09_28_56_b7eb97e830.png


?Xiaohu.AI 日报「5 月 7日」 ✨✨✨✨✨✨✨✨ 1️⃣

? 新款 iPad Pro 配备 M4 芯片:

  • 拥有更快的神经处理单元 (NPU) 来增强 AI 能力。
  • 支持每秒 38 万亿次运算。
  • 宣称其 AI 功能比现今的 AI PC 更加强大。
  • 更像电脑的设计风格,重点在于 M4 芯片发布,预示下月 WWDC 发布会对 AI 的全面拥抱。 ? https://x.com/imxiaohu/status/1787853964190552373

2️⃣

? STRUCTCHEM:提升大模型解决复杂化学问题能力

  • 新的提示策略,分三阶段进行:生成公式、逐步推理、复查与优化。
  • 显著提升 GPT-4 在化学推理方面的表现,可达 30 个百分点的提升。
  • 数据集覆盖量子化学、物理化学等领域。 ? 详细:https://xiaohu.ai/p/1595

3️⃣

? GPT-2 聊天机器人重回竞技场:

4️⃣

? 4 摄像头视角与 3D 骨骼姿势全息角色传送:

5️⃣

? DeepSeek 发布 2360 亿参数的 DeepSeek-V2:

  • 60 位专家混合开源模型,数学、编码和推理表现出色。
  • 236B 参数,21B 在生成过程中被激活。
  • 在 MT-Bench 上表现优异,中文能力强且性价比高。 ? 详细介绍:https://xiaohu.ai/p/7468

6️⃣

? Google Gemini 网络安全产品:

  • 检测并防御网络钓鱼攻击。
  • 结合广泛的用户和网络监控发现威胁。
  • 利用 AI 分析功能生成情报报告。 ? 详细:https://xiaohu.ai/p/7460

7️⃣

? Wayve 获超 10 亿美元 C 轮融资:

  • 开发“驾驶 GPT” 基础模型,实现具身体智能自动驾驶。
  • 使车辆在各种环境中操作,几乎无需人为干预。
  • 使车辆与人类互动、学习并理解人类行为。 ? 详细内容:https://xiaohu.ai/p/7453

8️⃣

? CURE 模型预测治疗结果:

  • 利用 300 万患者数据进行预训练并针对特定健康状况微调。
  • 效果堪比随机临床试验,能帮助理解治疗对患者健康的具体影响。
  • 学习患者数据的模式,预测不同治疗方式可能的效果。 ? 详细介绍:https://xiaohu.ai/p/7321

9️⃣

? Logo Diffusion:快速创建 Logo 标志

?

? 微软推出 MAI-1 大模型:

  • 由 Inflection CEO Mustafa Suleyman 负责。
  • 模型规模超过 5000 亿参数,远超微软之前的开源模型。
  • 使用 Inflection 技术和数据,但独立于原有项目 Pi。 ? 来源:https://t.co/aba77GFcnD
知识库精选
相关推荐
知识库精选-2026年1月30日
知识库精选-2026年1月30日
《为什么我们总是写不好提示词?(附提示词手册)》 《AI 互动游戏的 GPT 时刻到了!谷歌Genie 3首测!太牛了!》 《2025美团技术年货,「马」上到来 | 内含新春福利》
知识库精选
知识库精选-2026年1月29日
知识库精选-2026年1月29日
《Qwen3-ASR开源:够稳定,能流式,多语言!》 《Chatbot-n8n-Skill:这应该是全网最全的电商竞品AI分析指南。》 《成峰:更新啦!我用 Claude Skills 做的剪辑 Agent!识别效果+交互大升级》 《Richard 林旅强:开源出海·技术、商业与全球化【对谈万字稿】》 《燃尽、重启、爆火:Clawdbot 创始人的 35 分钟访谈实录》 《做了个日历生成器,大家都能定制自己的专属日历!》
知识库精选
知识库精选-2026年1月28日
知识库精选-2026年1月28日
《用飞书多维表格做个选项联动,实现选完省份自动弹出对应城市,逻辑其实很简单》 《Clawdbot(Moltbot)免费极简安装教程(10分钟)持续更新》 《贾栾:浅析我的 AI 记忆大脑“贾维斯”》 《甲木:ClawdBot 火爆全网,手把手教你如何部署,还能直接用钉钉操作!》 《Clawdbot 杀疯了!手把手教你接入飞书,把 AI 助理装进社群》 《普通人克服 FOMO,进化为 OPC 的最好搭子是秒哒》 《成峰:我做了 Claude Code 的Raycast ,Skills 1秒启动》
知识库精选
知识库精选-2026年1月27日
知识库精选-2026年1月27日
《咖啡:我做的秒哒海报被做成卫衣周边——分享AI时代的设计增效》 《K tao:Windows系统Claude Code小白安装教程》 《Qwen3-Max-Thinking万亿参数的大脑有多野?我拿6个问题测了下》 《一文带你读懂DeepSeek-OCR 2的细节!附实测!》 《Kimi K2.5 测评》 《Sam Altman 与开发者的一小时:GPT-5 搞砸了、招聘放缓、以及 2026 年最担心的事》
知识库精选
知识库精选-2026年1月26日
知识库精选-2026年1月26日
《“Skills 不就是脚本套个壳吗?我十几年前就玩 AutoIt 了”》 《Qwen3-Max-Thinking:会想能干,比强更强》 《Claude Code 更长更快!Agent能自己管项目了!从 Todo 升级到 Task》 《CY:Vibe Coding 的四个心法:速度、借力、放大、进化》 《AI音乐周刊 W.A 012》
知识库精选
知识库精选-2026年1月25日
知识库精选-2026年1月25日
《贾栾:把厚厚的PDF变成AI知识库:一个普通人也能用的技能》 《实测:Claude in Excel,能联网、能做表、办公完全自动化》 《我用 Claude 给自己打造了个人助理,他将比我更了解我自己》 《芒格·普世智慧(提示词)》 《“Skill 不就是长一点的提示词吗?”》 《深度|AI吞噬软件,AI构建AI,来自达沃斯的2026预测》
知识库精选
知识库精选-2026年1月24日
知识库精选-2026年1月24日
《又过了一周,终于把飞书多维表格仪表盘与应用模式讲透了》 《第6课:把产品交付到真实世界——上线与发布》 《Claude Code 升级: Tasks 取代 Todos》 《AI 创业日记 |出货量最大的AI 硬件是什么?在深圳第一线的AI 硬件行业洞察》 《毕玄:公司不再按技术栈,划分技术岗位》 《向阳乔木:Al智能体推理全景图:UIUC×MetaxDeepMind联合发布》
知识库精选
知识库精选-2026年1月23日
知识库精选-2026年1月23日
《一个被忽视的Prompt技巧,居然是复制+粘贴。》 《Qwen3-TTS全家桶开源上线!》 《喝点VC|a16z复盘消费级AI:为什么还没有AI社交软件?2026年多模态与应用生成为破局关键》 《Day 2 教你用: Listenhub API混搭大模型 API手搓一个好用的 Skills 》 《国产开源GLM-Image实测:文字渲染登顶SOTA,画面质感仍是最大瓶颈丨302.AI 基准实验室》 《进阶教程:给AI装上“逻辑大脑”,打造金融级稳定的多轮对话Agent(Dify实战)》
知识库精选