世界是无趣,但 AI 还行
早在 Google I/O 之前,Google 已经发布了 2.5 Pro 的新版本了,偷跑的其实也不仅仅是大模型,其实 DeepResearch 今天也提前偷跑了。
Google DeepResearch,不好好去改善其搜索 Agent 自主性能力,又在屎上雕花,堆了一大堆的料,叫着无聊的料。
先是卧槽,然后哦
不知道什么时候,我 AI 阳痿了。
对 AI 硬不起来,所以也不怎么更新了。
我怀疑大聪明也福报了,不然为什么去开酒吧了捏。
deep research -> Word 报告 -> 产生成网页代码应用 -> 分享网页链接。
大模型就在产生废料以及转换废料中飞速奔跑。
AI 厂商像是进入了修罗场不一样不进步就永远失败,
不过这次更新有大进步
1、 DeepResearch更加智能了,在搜索过程中会主动调整方向。
2、DeepResearch 开始支持本地文件的 DeepResearch 了,说明谷歌也更加认识到精准的上下所能产生的价值,而并不仅仅只是搜索引擎一堆难以评估质量的废料。

当然这么大文档还是有点难为他了,所以上了我的红楼梦水浒传测试文档,
为什么宋江要暴打林黛玉?

看起来思路清晰,跑下来其实就是差不多是一个上下文长的一次问答。
Deep-Think – Gemini 2.5 Pro
大家都吹 Gemini 2.5的神奇之处,尤其是编程,但是我的体感并没有那么好。
1、指令遵循略有不足,和很多变成工具一起配合容易掉链子。
2、幻觉更想,思考像是给大模型带上想象的翅膀,总会在你不曾期待的方向上创新的一塌糊涂。
3、擅长给你的代码写注释,你也不知道他为什么要写那么多注释,但是就是不听我的解释。

这次发布了一个思考更加能力的 Deep Think,新的测试集测试结果提升接近 60%,但是你看其他代码测试等,其实提升并不明显。

当然可能在 Agent 调用、MCP 调用等会有个更多优秀的表现。
涨价 Flash 2.5
Flash 2.5 涨价了,可能是因为最近的使用率上去了,开始拥有更多自信了吧,虽然涨价了但是还是比友商便宜一些。

涨价的套餐
Project Mariner已经加入到 Ultra 套餐,只要 299 美元,1800 多人名币一个月,您就可以提前当Project Mariner的小白鼠了呢,感动不?
好消息,前三月只要 149 美元。

谷歌应该已经放弃治疗了
这世界最大的爬虫就是谷歌,
这世界AI 都爬不赢哪个谷歌。
谷歌放弃了,他已经开始直接提供URL Content 了,这意味着谷歌已经开始的正式与过去告别。

还有一大堆更新就不累赘了~