- 《Kimi K2 Thinking 测评》Kimi 历经波折,从 K1.5 的探索困境,到闭关半年打造出惊艳的万亿模型 K2,如今 K2-Thinking 推理版本重磅登场。虽未摘得首个万亿开源桂冠,但其能力不容小觑,在推理场景中优势尽显,只是 Token 消耗颇高,暴露出国产算力短板。与 Grok 4、GPT - 5 Mini 相较,K2-Thinking 有长链推理优势,在上下文幻觉与计算能力上表现出色。不过,指令遵循与编程基本功欠佳,输出还常现特殊字符,Token 控制也不理想。尽管如此,Kimi 勇挑国产开源大梁,为国产模型发展立下新里程碑,值得关注!
- 《智能体工作流设计模式-规划式解读》 智能体工作流有新玩法——Plan-and-Execute规划式工作流,它就像给任务处理装上“智慧大脑”与“高效双手”。这一工作流将任务拆解为智能规划和执行操作,源于“计划与执行分离”理念,借助LLM推理能力,先深度规划,再系统执行。涵盖智能规划、系统化执行、动态重规划三阶段,在复杂研究分析、创意内容生成等任务中表现出色。虽有规划成本高、适应变化难、实时响应弱等局限,但优势显著,为复杂任务处理带来新思路。

