用AI重做一切?花两千给Google I/O 更新们去去水分


用AI重做一切?花两千给Google I/O 更新们去去水分

这合理吗?(熬夜破防版)

今天凌晨更新的 Google 掏出了一大堆好东西,

但是在 CEO 皮查伊精准的刀法下,

分为了free($0)、pro($19.99)、ultra($249.99) 三档的订阅套餐,看了一早上各种盘点,想要试试带原生音效的 AI 视频模型 Veo3,结果要先充1800,

大大小小23+个更新,体验入口、形式都不一致,这我能忍?OpenAI Pro 都不能让我每个月准时充,

于是我和我的钱包一拍即合,

将三个档位的账号都弄了一个,把这次更新分为了体验级,实用级、不差钱级。让大家可以清晰知道要不要订阅,以及订阅后能体验到百分之多少的新能力。

看看 veo3 生成的视频,自带音效,太值得听听了


 01|Gemini 2.5 模型四连 

Gemini 2.5 Pro 的预览版已经上线几周了,

模型得分没话说,人类终极测试AIME数学竞赛MMMU(视频理解)等多个测试集已经超 OpenAI o3-mini、Claude 3.7 Sonnet、DeepSeek R1了。

用AI重做一切?花两千给Google I/O 更新们去去水分

But,这个模型目前免费用户用不了,Pro 可以用基础版,

Ultra 可以在 Gemini 2.5 Pro 基础上开启Deep Think模式

简单来说,Deep Think 模式下 Gemini 2.5 Pro 支持生成多条推理链,交叉验证后,会把投票最高的一条作为答案。这个方法让 2.5 Pro 在 MMMU 上打败了 OpenAI o3。

用AI重做一切?花两千给Google I/O 更新们去去水分

虽然在 Ultra 套餐里面说了可以用,但是 deep think 目前还是大期货。

除了Pro外,Gemini 2.5 系列的编码之王就是 Flash 了,

好消息是所有套餐都可以用上。

现在已经可以在 ai studio 上用了预览版:

用AI重做一切?花两千给Google I/O 更新们去去水分

而且从指标上看,长文本和数据能力一骑绝尘,甚至超过了 Claude 3.7 sonnet。

还有还有,一个新的文本扩散模型 Gemini Diffusion,

与主流的、GPT 使用的 Transformer 框架不同,Diffusion 不直接生成文本,而是通过学习逐步细化噪声来生成。

这样的好处是推理速度可以达到每 12 秒 10095 token,是 flash 的3倍。

但这个模型就跟订阅套餐没啥关系了,需要申请等待列表(链接较长就放在评论区啦)


 02|AI搜索 

这应该是这场发布会里最激进的更新了。

如果使用搜索的次数较多,

AI摘要(AI Overviews)这个功能应该不算陌生,当搜索一些事实性的问题的时候,在顶部的AI摘要会根据搜索结果生成概要以及信息来源,

用AI重做一切?花两千给Google I/O 更新们去去水分
左侧文本,右侧信息源

可能是AI摘在过去一年带来了10%流量增长,

也可能是时间节点到了,苹果 Safari 明示要引入 AI 搜索的时候,Google 的市值蒸发了1兆830亿,

用AI重做一切?花两千给Google I/O 更新们去去水分

总之,传统的搜索网页被彻底否决了,

对话框形式的 AI Mode 正式上线,

且这个功能目前没有任何套餐限制。

用AI重做一切?花两千给Google I/O 更新们去去水分

发动钞能力的我也是前后体验了几十次,这篇文章的数据和事实性信息都是我跟 AI mode 对话得到的。

但体验上跟开了联网搜索的 Gemini 2.5 pro 没太大的区别。

用AI重做一切?花两千给Google I/O 更新们去去水分

不过比起 Deep Research(深度研究),

AI Mode 参考的信息源不算多。

至于发布会上说的可以通过过去搜索记录邮件信息来个性化搜索、Deep Search(深度研究)等还没有看到。

除了文本输出,AI mode 本身还支持买门票、买衣服、订餐厅等操作,还可以尝试 AI 试衣:

用AI重做一切?花两千给Google I/O 更新们去去水分

讲完了最颠覆的,

那一定要说说最值钱的了。


 03|AI视频&生图 

史上最贵的AI视频模型 veo2 引来了新一代:

veo3

没想到最核心的提升不是画质、逼真度、物理模拟性,而是原生音频

之前的工作流是先生成无声视频,再让一个新的模型边看画面边配音,缺点就是容易音画不同步。veo3 生成的视频里可以自带背景音效、环境声,甚至是人物对话。

但是 veo3 真的太高贵了,只开放给 Ultra 用户,150的Pro用户只能用720p的 Veo2,

效果是真的强,我的感受是1800里有1400都是归veo3的。坏消息是能力变强了,价格一点没下降,

假设一条视频都没浪费,一个月也就能生成80个。

跟veo3一起出来的是AI视频工作台flow

Pro 和 Ultra 用户都能用

类似于 OpeAI Sora 的故事版,支持视频生成、剪辑和延长,

等我多玩几天玩明白了,再做一期veo3专题

? labs.google/fx/tools/flow

除了视频外,

这次imagen4还把图片质量追回来了,更新了图片里的文本效果,

更6的是,出图功能不消耗积分,可以无限制生图。

我拿 gpt4o 的提示语试了一下

? labs.google/fx/zh/tools/whisk

用AI重做一切?花两千给Google I/O 更新们去去水分

不过就目前测试下看的话,不太会写中文。

对了,Pro 用户目前用不了 Imagen4 。。。


 04|AI播客 

AI 播客就是 NoteBookLM 带起来的,前段时间也支持上了中文,

用AI重做一切?花两千给Google I/O 更新们去去水分

移动端早就应该做了,

目前登陆了安卓和ios平台,可以随机将链接转成笔记和知识。


 05|跟订阅无关的更新们 

Agent Project Mariner

相当于 OpenAI Operator,浏览器使用 Browser Use 的升级版,

Mariner 现在可以同时执行10个任务,而且还学会了 RPA 那套,我成功操作一次,Mariner 就可以重复运行,

不过目前只通过 API 开放给开发者,

用AI重做一切?花两千给Google I/O 更新们去去水分

还不是非常清楚是不是通过操作的视频来学习如何操作软件,

蹲个后续吧。

? deepmind.google/models/project-mariner/

AI编程 Jules

对标隔壁 OpenAI CodeX,

能修复 Bug、更新版本、编写测试、写代码等等。每天提供5次免费任务。

Android XR 智能眼镜

跟 Xreal 合作推出的支持安卓 XR 的智能眼镜,支持实时导航、翻译和摄像功能,不过现场演示的时候卡住了。。。

Project Moohan 头显

跟三星联动,第一台安卓XR设备,长得果里果气的。

用AI重做一切?花两千给Google I/O 更新们去去水分

认得出哪个是 Apple Vision Pro 吗?

3D视频通话 Beam

通过六个摄像头组成的矩阵来扫描用户,实现每秒60帧的毫米级精度实时头部追踪

用AI重做一切?花两千给Google I/O 更新们去去水分

这些更新就跟订阅没太大关系了,大部分都处于是早期体验状态。


 写在最后 

呼!

盘点完后心念通达多了,

现在这个阶段的1800基本就是为了 veo3 服务的,

还记得 I/O 2024的时候,

Google 被 OpenAI 的 GPT-4o 打到抬不起头,

今年,轮到 GPT5 还没放出来,没能顺利截胡这一大堆更新了,

现在,我反而是希望I/O 2026能不能学学OpenAI,多开几场,

给我留点试玩的时间,

这么多好东西,一股脑放出来,还是有些东西容易被错过了,

毕竟AI更新已经那么快了,

你Google质量都这么高了,

不那么卷,peace一点也是可以的。



@ 作者 / 卡尔 @ 动手学AI知识库 / learnprompt.pro


最后,感谢你看到这里?如果喜欢这篇文章,不妨顺手给我们点赞?|在看?|转发?|评论?更多的内容正在不断填坑中……

用AI重做一切?花两千给Google I/O 更新们去去水分

前沿技术大模型技术新闻资讯

🧠 解码大语言模型的记忆力:上下文长度的前世今生

2025-5-22 1:39:16

前沿技术大模型技术新闻资讯

🧠 解码大语言模型的记忆力:上下文长度的前世今生

2025-5-22 2:42:54

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索