今天是2026年1月14日。 我觉得有必要记下这个时间,因为AI产品的更新速度实在太快了。
你可能听说过,或者正在使用这些工具:Gemini、NotebookLM、Nano Banana……但如果我问你:它们彼此是什么关系?谁是底层模型?谁是独立产品?谁又只是某个功能的“马甲”?
谷歌的 AI 体系非常庞大、且更新频繁,以至于普通用户几乎不可能一次性看清全貌。
01 拒绝迷路:一张全景图,带你走入谷歌 AI 梦工厂
为了便于大家理解,我们不妨把谷歌的 AI 体系想象成一家巨大的连锁餐饮集团。
如果你已经接受了这个“连锁餐饮集团”的比喻,事情就变得简单了。让我们先从厨房里真正干活的厨师团队们说起。
在谷歌的世界里,真正决定 AI 能力上限的,并不是某个产品界面,而是藏在后台的底层模型(LLM)。它们就像中央厨房里的厨师团队,决定了菜能不能做好、好到什么程度。
1. Gemini 家族:谷歌 AI 的“通用大脑”
不同版本的 Gemini,决定的是思考深度、速度和成本。
- Gemini 3 Deep Think(首席):2026 年新晋王牌,专门用来解决人类最前沿的数学、科学和哲学难题。它支持深度自我校对,目前只对付费用户开放。
- Gemini 3 Pro(高级):记忆力惊人的学霸型选手,可以一口气读完几本法律合同,或一个超大型代码库。同样属于付费用户专属。
- Gemini 3 Flash(中级):这是 2026 年的默认主力。最大的特点是快,而且具备很强的 Agent(智能代理)能力,能一边写代码,一边运行测试、修正结果。
- Gemini 2.5 Flash / 3 Flash Lite(初级):反应快、成本低,最适合处理润色邮件、简单整理这类日常任务。
如果说 Gemini 负责“思考”,那 Nano Banana 负责的就是“看”和“画”,即图像与视觉,目前主要有两个版本。
- Nano Banana Pro:接近专业设计师水准,尤其擅长在图片中生成精准、可用的文字排版,甚至能画出结构复杂的物理原理图。
- Nano Banana:创意快手。擅长快速修图、换背景,并能保证同一个角色在不同生成的图片中长相高度一致。
它的官方名称原本是 Gemini Image(前身是 Imagen)。
没想到,这个模型生成的图像质量高得离谱,瞬间引爆社交媒体。后来,谷歌干脆顺水推舟,把这个名字留了下来。
Veo 家族负责视频创作,是目前谷歌 AI 体系里算力消耗最高、最烧钱的一支团队。
03 六大门店探店:怎么“点菜”最专业?
对大多数人来说,也许是一次不经意。谷歌AI 的 “紫色星标” 悄咪咪地出现在了很多地方,你还没意识到,AI 就开始为你工作了。
门店一:Google Search AI —— 搜索快捷分店
它就藏在 Google 搜索里(https://www.google.com/search)。
这家门店有两道招牌菜(工具):
这是现在 Google 搜索的默认形态。过去,我们需要自己点开多个网页、反复对比、手动提炼信息;而现在,AI Overview 会直接帮你把相关网页通读一遍,然后给出一段总结。
AI Mode:
因为这类问题步骤多、逻辑复杂,AI Mode 背后的主力模型通常是 Gemini 3 Pro,甚至Gemini 3 Deep Think这样的高阶模型。
如果说 Search AI 是你路过就能顺手吃一口的快餐店,那 Gemini(Web / App)就是整条街招牌最亮、功能最全的“旗舰总店”。
官方入口:https://gemini.google.com/app
nerror="javascript:errorimg.call(this);">
除了这些“明面上的功能”,Gemini 还有不少默认开启、但你未必意识到的隐藏能力。比如:
- Google Workspace 工具: 可以直接可以直接读取你的 Gmail、Drive 和 Docs等。比如,你可以直接问它“我上周收到的那份合同里,金额是多少?”。
- 实时信息工具: 包含 Google Maps(找路线)、YouTube(总结视频)、Flights 和 Hotels(查实时航班和酒店数据)。
- Gemini Live (语音助手): 在移动端 App 尤为突出,支持实时语音对话,还可以共享摄像头或屏幕,边看边聊、边问边改。
- Code Assist (代码助手):面向程序员用户,支持生成、运行和调试代码,甚至可以像 Agent 一样操作浏览器执行任务。
不过,你能看到哪些工具、能调用到什么级别的模型,最终取决于你的会员等级。 像 Deep Research、Canvas 以及 Create videos,目前只对付费用户开放。
这家门店最特别,它没有门脸。
它并不是一个独立的 App,而是直接“长”在 Gmail、Docs、Sheets、Slides、Meet 这些办公工具里,主打一个AI 触手可及。
在 Workspace 这家分店里,AI 不再是一个完整的工作台,而是散落在各个角落的一枚枚“魔法按钮”。你点一下,它就把活干了:
嵌入在 Gmail 和 Docs 中,主要调用 Gemini 3 Pro。
表格类:Help me organize(帮我组织)
可以自动生成项目跟踪表、日程模板,还能把一堆杂乱数据按逻辑重新整理。
在 Slides 中调用 Nano Banana Pro,快速为 PPT 生成配图;
交互类:Gemini Side Panel(侧边栏助理)
它擅长跨文档操作,比如:根据 Drive 里的报价单,帮我写这封邮件。或者快速摘要长邮件、查询日程安排。
在 Gmail 中生成邮件摘要(Gemini 3 Flash),在 Google Chat 中总结未读消息(Gemini 3 Flash),在 Drive 中生成跨文档的项目概览(Gemini 3 Pro)。
隐藏在 Sheets 表格里,由 Gemini 2.5 Flash 驱动。
据说,2026 年 Workspace 的一个重要趋势是「In-line AI」。也就是:侧边栏正在逐渐消失,AI 会直接出现在你打字的光标附处,随写随用。
它是一款专为工作场景设计的 AI 视频创作工具,目标很明确——解决上班族“做视频太难”的问题。
你可以在 Google Drive 里右键创建 Google Vids, 也可以直接访问链接:https://docs.google.com/videos/u/0/
nerror="javascript:errorimg.call(this);">
同时,如果你的公司已经为你开通了 Gemini for Workspace,当你打开 Gemini(Web / App)时,也可以默认使用企业订阅解锁的高级工具和模型。
门店四:NotebookLM —— 深度研读茶室
如果说 Gemini 的旗舰总店像一座热闹的综合商场,那 NotebookLM 更像一间挂着「慢火炖煮知识」招牌的研读茶室——安静、克制,只专注一件事:把复杂内容真正消化掉。
NotebookLM 不擅长天马行空的创作,但在处理海量资料、提炼核心观点这件事上,它几乎是谷歌 AI 体系里的天花板。
NotebookLM 的“招牌菜”,几乎都围绕着同一个目标:让你真正理解,而不是快速看完。
这是目前最出圈的功能。它可以把枯燥的专业文档,直接变成一段由两位 AI 主持人对谈的音频内容,让你在通勤路上就能“听懂”一本专业书。
Video Overviews(视频概览):
你也可以直接丢一个 YouTube 链接或本地视频,让 AI 帮你梳理脉络、快速抓重点。
自动为你上传的资料生成测验、常见问题集(FAQ)和学习指南,几乎是为学生和研究者量身定做的功能。
类似 Search AI 的能力,但范围只限于你上传的资料。
Data Tables (数据表):
除了这些显性的工具,NotebookLM 还有一些不太张扬的“隐藏能力”。
- 在视觉层面:自动生成 Slides、信息图表(Infographics)、心智图(Mind Map)。
- 洞察层面:盲点分析(Blindspot Check)、辩论模式(Debate Mode),帮你从不同立场重新审视同一份资料。
但为了保证理解的深度和准确性,NotebookLM 全程由 Gemini 3 Pro,Nano Banana Pro, Veo 3.1 fast这些最强模型坐镇。
门店五:Google Labs —— “未来功能”的试吃区
这里展示的,都是谷歌那些还没完全“修成正果”的 AI 黑科技。
如果表现稳定、反响不错,这些功能才会被正式搬进 Gemini 旗舰总店,或 Workspace 等这样的“常规门店”。
nerror="javascript:errorimg.call(this);">
目前,Google Labs 里最受关注的“镇店之宝”,是 Google Flow。
nerror="javascript:errorimg.call(this);">
Google Flow 并不只是一个视频生成工具,而是一整套 AI 电影工作室。
你可以把它理解为:Veo 模型能力的极限展示区,也是谷歌对“未来视频创作形态”的一次公开实验。
门店六:Google AI 开发平台 —— 极客专业食堂
官方入口:https://ai.google.dev/
1. Google AI Studio:想法验证的第一站
官方入口:https://ai.google.dev/
nerror="javascript:errorimg.call(this);">
2. Vertex AI(on Google Cloud): 企业级 AI 的主战场
官方入口:https://cloud.google.com/vertex-ai
nerror="javascript:errorimg.call(this);">
3. Google Antigravity:从“写代码”到“下达任务”
官方入口:https://antigravity.google/
nerror="javascript:errorimg.call(this);">
某种程度上,它更像是 Cursor 或 Windsurf 的“完全体”。
Gemini CLI 是一个直接运行在本地终端里的增强型 CLI 助手。它为 Bash、Zsh、PowerShell 增加了 LLM 级别的语义理解能力。
它可以:
- 把模糊的自然语言需求,翻译成复杂的 Shell 指令组合;
- 自动捕获错误输出(stderr),并给出实时诊断和修复建议;
- 通过 RAG,在终端里快速查询本地文档或代码片段;
这四个工具,几乎刚好组成了一个完整闭环:
- 想验证想法 → 去 Google AI Studio
- 想在终端写代码、修 Bug → 用 Gemini CLI
- 想让 AI 自主完成复杂项目 → 用 Antigravity
- 想支撑真实业务和大规模用户 → 选 Vertex AI
走到这里,你大概已经意识到一件事:谷歌 AI 并不是让你“全都用上”,而是让你根据需求,在合适的场景,用对产品。
下面是我理解的一份参考指南:
- 如果你只是想更快找到靠谱答案:Google Search AI(AI Overview + AI Mode) 就已经够用了。不用学、不用配,几乎没有使用成本。
- 如果你需要写作、规划、思考和创作:Gemini(Web / App) 是主力工具,长文、代码、方案、图片、视频,都可以在一个界面里完成。如果预算允许,付费版会明显拉开效率差距。
- 如果你的主要战场在邮件、文档和表格里:Gemini for Workspace 是最“无感但最有价值”的选择,AI 不需要你主动打开,它已经开始在替你改邮件、补文档、看数据。对企业来说,数据隔离和合规性,才是它真正的护城河。
- 如果你最头疼的是资料太多、理解太慢:NotebookLM 是你最值得使用的产品,限定知识范围,让它比大多数聊天式 AI 都更可靠。而且,目前它是完全免费的。
- 如果你想第一时间看到谷歌未来会做什么:去 Google Labs。那里的东西不一定稳定,也不一定马上好用,但很多“未来功能”,都会先在那里露面。
- 如果你想把 AI 真正接入自己的产品或工作流:去Google AI 开发平台, Google AI Studio, Gemini CLI,Antigravity,Vertex AI(on Google Cloud)加在一起,构成了谷歌 AI 最完整、也最硬核的一条技术路线。
当你搞清楚“模型在后台、工具在中间、产品在前台”,很多原本看起来混乱的东西,反而会变得异常清晰。
作者:七姑娘 公众号:七姑娘日记
题图来源于Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
flash builder4(别被名字绕晕了!一文看懂谷歌 AI 全家桶)
