- 《我们被骗了多久?LLM推理'确定性'的真相大白》你是否困惑,为何同样设置,AI回答却时好时坏?前ChatGPT科学家团队的研究,揭开惊人真相。原来,GPU并行计算的非确定性,使浮点运算误差在token选择阶段被放大,导致LLM输出不稳定。这一发现,解释了API调用失败等诸多“玄学”现象。对此,我们可重新审视业务需求,接纳创意场景的不确定性;技术上多采样投票等;架构设计转变思路。该研究犹如警钟,让行业重新思考,在不确定中挖掘AI真正价值,你怎么看?

- 《云舒:从一堆废图到稳定出片:我的Nano Banana封面探索全记录》想知道如何用Nano Banana打造独特公众号封面?云舒亲测,带你解锁探索秘籍。基于对Nano Banana特性的了解,经两轮测试,从单张垫图、双图融合的摸索,到借助Gemini生成指令优化,最终沉淀出实用提示词,成功产出满意底图。此外,云舒还探讨了产品化可能性,指出频率、共性、付费动力是关键。面对AI及各类挑战,自我提问与探索才是找到答案的正途。

- 《AI 不懂「疯狂星期四」》想知道视觉推理大模型谁更“聪明”?一泽新奇地发起“AI看图猜字谜”大挑战,拉来GPT、Gemini、豆包等8家顶级视觉推理模型参赛。以网络热梗为谜底,设三档难度,从单步推理到复杂多步推理。简单题模型大多轻松应对,难度升级后表现分化,最终一题“疯狂星期四”更是全军覆没。一番激烈角逐,豆包Seed 1.6脱颖而出夺冠。这场有趣测试,清晰展现模型能力边界,揭示AI迈向更高智能,需补上“人文感知”这一课。



