尊龙凯时中国官网入口 一文看懂谷歌I/O2026: Gemini 3.5领衔 谷歌打响智能体和全模态大战

发布时间:2026-05-21 浏览次数:127 来源:未知 作者:admin

尊龙凯时中国官网入口 一文看懂谷歌I/O2026: Gemini 3.5领衔 谷歌打响智能体和全模态大战

出品|《立场》

作家|袁宁丁广胜

山景城海岸线戏院,再次成为全球科技圈的焦点。

北京时期5月20日凌晨1点,2026GoogleI/O认真登场。这个不错容纳两万多东谈主的露天戏院,每年都一票难求。主会场坐满后,以致有不少东谈主坐到山坡草坪上,远眺望向舞台,恭候Google这位顶尖玩家亮牌。

现场的腻烦并不像一场传统设备者大会,更像一场庞大的科技派对。走参加口,责任主谈主员会神色地和与会者击掌;进口隔邻有室外乐队扮演;戏院外则是大片Demo展区,Google各条业务线和合作伙伴都在展示我方的最新产物与期骗,比如来自中国的Xreal。设备者、媒体、创业者、投资东谈主和合作伙伴穿梭其中,统共东谈主都在恭候团结个问题的谜底:

在大模子竞争参加智能体阶段后,Google准备怎样出牌?

往日一年,AI行业的叙事发生了彰着变化。OpenAI依然是焦点,但Anthropic正在变得越来越“抢镜”。据咱们了解,某种进程上,Google的“假念念敌”照旧不再仅仅OpenAI,也初始越来越多地指向Anthropic。

今天凌晨,GoogleCEOSundarPichai给出了此次大会的中枢叙事:“Gemini3.5和Antigravity正在开启一个智能体和智能体才智的新寰球。咱们照旧把智能体带给设备者和企业一段时期了。当今,咱们十分专注于把智能体的力量,以安全、可靠的式样带给破费者,让它适用于每一个东谈主。”

在此次I/O上,Google简直把统共中枢业务线都重新用“智能体”串了一遍:从Gemini3.5Flash,到GeminiOmniFlash;从Search里的信息智能体、预订智能体,到GeminiApp里的24/7个东谈主智能体GeminiSpark;从设备者平台Antigravity,到购物场景里的UniversalCart;再到Workspace、YouTube、Flow、Android、Cloud以及骨子溯源器具。

咱们看到,Google试图把AI从“答谢问题的模子”,鼓吹到“握续判辨、野心、践诺任务的系统”。不错说,2026GoogleI/O,是Google全面押注AgenticAI的一次皆集展示。

01Gemini3.5Flash登场:速率快4倍,“会活动的模子”将成默许进口

本届I/O最受关注,亦然最中枢的技巧发布,依旧是Gemini。

但并非巨匠期待的Gemini4,Google发布了Gemini3.5模子家眷的首个成员Gemini3.5Flash。Google将其界说为“结合前沿智能与活动才智”的新一代模子,主打两个关节词:智能体才智和速率。

按照Google的说法,Gemini3.5Flash是其目下最强的智能体和代码模子,在复杂长周期任务、代码生成、多模态判辨等方面均有权臣进步。Google给出的benchmark包括:Terminal-Bench2.1达到76.2%,GDPval-AA达到1656Elo,MCPAtlas达到83.6%,CharXivReasoning达到84.2%。

更紧要的是,Google强调3.5Flash在输出速率上比其他前沿模子快4倍。这意味着它并不是单纯追求“更坚定模子”的道路,而是试图在才智、延迟和老本之间找到一个更合适大鸿沟产物化的均衡点。

这也讲解了为什么Google首发的是Flash,而不是Pro。

往日大模子竞争强调“谁更强”,但参加2026年,产物化竞争更敬重“谁能以更低延迟、更低老本、更踏实地工作海量用户”。Flash的定位只怕契合这少许:才智迷漫强,同期不错大鸿沟铺进搜索、App、设备者器具和企业平台。

证据Google的安排,Gemini3.5Flash将参增加个中枢场景:

●面向普通用户,成为GeminiApp和GoogleSearchAIMode的默许模子;

●面向设备者,参加GoogleAntigravity、GeminiAPI、GoogleAIStudio和AndroidStudio;

●面向企业,参加GeminiEnterpriseAgentPlatform和GeminiEnterprise。

据现场泄漏,Gemini3.5Pro已在里面使用,议论于下个月推出。这意味着Google会先用Flash邻接鸿沟化需求,再用Pro工作更复杂的高阶任务。

02GeminiOmniFlash:从“判辨多模态”走向“生成自便模态”

若是Gemini3.5Flash代表Google对“活动模子”的押注,那么GeminiOmniFlash则代表Google在多模态生成上的新贪心。

Google对Omni的界说十分径直:不错从任何输入生成任何输出的模子,最初从视频初始。这句话背后,是多模态AI的范式变化。

往日的多模态更多是“输入多模态”:模子不错看图、听音频、判辨视频,再用翰墨答谢。但GeminiOmni要作念的是“输入和输出都多模态”。用户不错用文本、图片、音频、视频动作输入,再生成高质地视频。改日,它还会支握图像和音频等更多输出体式。

它的中枢才智包括三类。

●第一,是通过当然谈话裁剪视频。用户不错一语气对视频建议修改要求,比如改造环境、角度、动作、作风,以致加入扮装和物体。Google强调,Omni不错在多轮对话中保握扮装一致性、物理逻辑和场景一语气性。

●第二,是基于Gemini的寰球常识生成视频。Google默示,Omni不仅仅生成“看起来真实”的画面,而是能结合物理、历史、科学和文化语境,生成更有逻辑的视觉叙事。举例更准确地发挥重力、动能、流体等物理后果,或者把复杂主见回荡为讲解型视频。

●第三,是从自便素材初开创作。用户不错把文本、图片、视频,以致语音动作参考输入,生成合股作风的视频骨子。初期音频输入主要支握语音参考,更多音频类型会在之后推出。

值得郑重的是,Google还提到了数字化身功能。用户不错使用我方的声息创建个东谈主avatar,Z6尊龙凯时官方网站让生成视频看起来和听起来像我方。但在视频裁剪中修改音频和语音的才智,Google默示仍在测试,以更严慎地处理潜在风险。

在骨子安全方面,Omni生成的视频将包含不成感知的SynthID数字水印。用户不错通过GeminiApp、Chrome中的Gemini以及GoogleSearch考证视频是否由GeminiOmni生成。

(SundarPichai辱弄他不吃汉堡,这是假图)

从发布节拍看,GeminiOmniFlash会向GoogleAIPlus、Pro和Ultra订阅用户全球推出,也会从本周起在YouTubeShorts和YouTubeCreateApp中向用户免费绽放。改日数周内,Google还将把它通过API提供给设备者和企业客户。

这意味着,Google不仅仅念念作念一个视频生成器具,而是念念把视频生成才智镶嵌统共这个词创作家生态:Gemini负责个东谈主创作进口,Flow负责专科责任流,YouTubeShorts负责分发场景。

这套闭环,恰是Google比拟许多纯AI创业公司的上风地点。

03GeminiApp酿成24/7个东谈主助理:GeminiSpark是关节

GeminiApp也在此次I/O上迎来大更新。

SundarPichai泄漏,往日一年GeminiApp增长赶紧:昨年GoogleI/O时,Gemini有4亿用户;本年月活照旧进步9亿,隐敝230个国度和地区、70多种谈话。

新的GeminiApp有几个重心变化。

●最初是遐想谈话升级。Google推出了新的NeuralExpressive遐想谈话,包括更流通的动画、更显明的颜料、新字体和触觉响应。GeminiLive也被径直整合进Gemini,用户不错在翰墨发问和语音对话之间无缝切换。

●其次是答谢模样的变化。Gemini不再仅仅输出长文本,而是不错证据问题及时遐想谜底体式,加入图片、交互式时期线、旁白视频和动态图形。

●第三,亦然最紧要的,是两个智能体功能:DailyBrief和GeminiSpark。

DailyBrief是一个个性化晨间简报智能体,不错匡助用户整理每天初始前需要知谈的信息。

GeminiSpark则是Google面向破费者推出的个东谈主AIagent。它会24/7运行,在用户授权和指示下匡助不竭任务、处理数字生存。

此外,macOS版GeminiApp也会集成GeminiSpark,使其不错在土产货机器上践诺操作,并加入更强的语音功能。

Google议论先向trustedtesters推出GeminiSpark,并鄙人周面向好意思国GoogleAIUltra用户推出Beta。macOS版GeminiApp改日也会集成GeminiSpark,使其不错在土产货机器上践诺操作。

这对Google很紧要。因为它领有Gmail、Calendar、Photos、Drive、Chrome、Android、Search、Maps等高频产物。若是GeminiSpark能在用户授权下调度这些工作,它就不仅仅聊天机器东谈主,而可能成为确凿的个东谈主任务调度层。

同期,Google文牍推出每月100好意思元的AIUltra议论,同期为AIPlus、Pro和Ultra订阅用户增加新功能和权柄。

04Search迎来25年最大改版:搜索框酿成智能体进口

GoogleI/O的另一个重磅更新,是Search。

据先容,新的搜索框会动态膨胀,尊龙凯时中国官网入口允许用户输入更复杂、更当然的问题;它不错给出AI驱动的问题建议,不再仅仅传统autocomplete;它还支握多模态输入,包括文本、图片、文献、视频和Chrome标签页。

更中枢的是,Google正在把Search从“找谜底”酿成“派任务”。

最初,AIMode将使用Gemini3.5Flash动作全球默许模子。用户不错从AIOverview径直连接追问,参加AIMode的对话式体验,并保留高下文。

其次,Google推出了Searchagents。这类智能体不错在后台24/7运行,握续追踪用户怜惜的信息,并在合应时期给出概述更新。

比如,你正在找房,不错告诉Search预算、位置、户型、通勤和其他要求,信息智能体会握续扫描网页、新闻、博客、酬酢信息,以及金融、购物、体育等及时数据,一朝发现匹配扫尾就奉告用户。又比如,你关注某位开通员和品牌联名的球鞋,智能体也不错在新产物发布时请示。

这类信息智能体将率先在本年夏天面向GoogleAIPro和Ultra订阅用户推出。

Google还在膨胀Search中的agenticbooking才智。用户不错让Search襄理寻找并预订土产货工作,比如周五晚上可容纳六东谈主、供应夜宵的私东谈主KTV包间。Search会整合最新价钱和可用性,并给出径直预订聚首。

在家政维修、好意思容、宠物照拂等部分品类中,用户还不错让Google代为给商家打电话。这些才智将于本年夏天在好意思国面向统共效户推出。

更有念念象空间的是,Search还将取得“生成式UI”和“迷你期骗”才智。

借助Gemini3.5Flash的代码才智,以及Antigravity的智能体设备才智,Search不错证据用户问题即时生成交互界面。比如,当用户念念判辨天体物理问题,或者念念看懂机械表运行旨趣,Search不错自动生成包含图表、表格、模拟器、交互组件的定制谜底。

更进一步,关于永久任务,比如婚典筹备、搬家不竭、健康议论,Search不错生成一个可握续使用的dashboard或tracker。Google把这类体验称为用户专属的miniapps。

这其实是对搜索产物模样的一次根底改写。

往日,搜索扫尾页的中枢是聚首、摘记和告白。改日,它可能酿成一个动态生成的任务操作台:既能判辨问题,也能生成器具,还能握续追踪情景。

对Google来说,这既是防护,亦然伏击。防护在于,AI聊天产物正在侵蚀传统搜索进口;伏击在于,Google试图用智能体把搜索重新界说为更强的任务进口。

05AI购物:UniversalCart是Google的“智能体交易化”历练田

AI时期,Google最大的问题之一是:若是搜索扫尾不再以聚首为中枢,告白和交易化怎样办?

本届I/O给出的谜底之一,是agenticcommerce,也等于智能体购物。

2026美加墨世界杯中国认证平台

Google文牍推出UniversalCart,一个智能购物车,亦然用户在Google上进行AI购物的中心。

购物自然合适智能体。

因为用户真实的购物需求往往很复杂,不是一个关节词能惩办的。比如买一台合适出差的浮薄本,用户怜惜的不仅仅价钱,还包括分量、续航、性能、接口、品牌、售后、优惠、库存、配送时期和用户评价。传统搜索需要用户反复筛选,智能体则不错握续比较、监控价钱、组合商品,以致协助完成购买。

UniversalCart的价值就在这里:它可能把Search、Shopping、告白、商学派据和支付链路勾搭起来,让AI不仅仅推选商品,而是参与购物决议和来去进程。

这对Google具有政策意旨。

往日,搜索告白的中枢是用户点击聚首,然后跳转到商家页面。AI搜索若是减少了用户点击,Google就需要新的交易闭环。智能体购物可能成为一种新旅途:Google从信息分发者,酿成来去决议和践诺过程中的参与者。

但它也会带来新问题:AI推选商品时如何排序?是否会偏向告白主?用户如何知谈推选依据?商家如何适配这种新渠谈?这些都将影响AI购物能否诞生信任。

06从AndroidHalo到Antigravity:Gemini正成为系统级基础门径

当智能体初始替用户践诺任务,Google必须重新界说AI在系统里的位置。

一个很径直的问题是:若是AI不仅仅答谢问题,而是初始帮你搜索、预订、整理、生成、比较价钱、不竭日程,用户怎样知谈它正在作念什么?又该在那里暂停、稽查或摄取?

Google给出的谜底之一,是AndroidHalo。

这是一个将在本年晚些时候上线的Android新才智,用来在手机屏幕顶部骄慢智能体正在处理的任务。你不错把AndroidHalo判辨为智能体时期的情景栏。

往日,情景栏骄慢的是时期、电量、信号、奉告;到了AI时期,系统还需要骄慢“你的智能体正在作念什么”。比如它正在搜索航班、整理文档、比较商品、生成视频、议论商家,或者后台握续追踪某个任务。

这也阐明,Google对智能体的判辨并不是单点期骗,而是系统级才智。模子、期骗、搜索、浏览器、操作系统之间的界限会越来越纵脱,确凿的竞争会发生在“谁能成为用户统共任务的调度层”。

若是AndroidHalo惩办的是“用户如何看见和牺牲智能体”,那么Antigravity惩办的等于“设备者如何构建智能体”。

Google显明不但愿智能体才智只留在自家产物里。除了Search、GeminiApp和AI购物,Google还但愿通过Antigravity,把Gemini的才智交给设备者。

Antigravity不错判辨为Google面向agenticAI时期的设备平台。它的重心不是浅显调用一个大模子接口,而是闪设备者大要构建、调度和部署多个合营式智能体。

往日的AI设备,许多时候是“期骗调用模子”:用户输入问题,模子返答谢案。但智能体时期的设备逻辑更复杂。设备者需要让AI判辨规划、拆解门径、调用器具、探望数据、践诺动作、查验扫尾,并在必要时连接迭代。

这就要求平台不仅仅提供模子,还要提供责任流、权限、器具调用、操心、评估和部署才智。

Antigravity的价值就在这里:它念念把Gemini从一个可调用的模子,酿成一个可设备、可组合、可部署的智能体平台。

这对Google很关节。因为智能体时期不成能只靠Google我方设备期骗。确凿的爆发,需要设备者基于Gemini作念出多数新器具、新插件、新责任流和新期骗。只消设备者生态起来,Gemini才能从Google我方的产物矩阵,蔓延到更通俗的软件寰球。

与此同期,Google我方的“全家桶”也在连接AI化。

●在Workspace里,Gemini会连接参加Gmail、Docs、Sheets、Slides、Meet等办公场景,匡助用户写邮件、归来文档、整管待议、生成表格、制作演示和不竭任务。对企业用户来说,这不是单点功能,而是把AI嵌进日常办公流。

●在YouTube里,GeminiOmniFlash和视频生成才智会进一步参与骨子创作,尤其是Shorts。创作家不错用AI生成素材、修改镜头、挽回作风,以致把一个创意快速酿成短视频骨子。

●在Flow里,Google更明确地把AI视频生成作念成创作责任流。比拟一次性生成视频,Flow的价值在于一语气裁剪、分镜不竭和多轮挽回,让AI视频从“玩物”酿成更接近专科坐褥的器具。

●在Pics/Photos关联场景里,AI会连接承担图片生成、图片裁剪、视觉判辨和骨子整理的扮装。用户不再仅仅保存像片,而是不错让AI襄理修图、生成回忆、索求信息,以致围绕图片连接创作骨子。

这些产物看似散播,但背后逻辑是一致的:Google正在把Gemini放进每一个高频场景。

07Google竟然凿意图:把AI作念成下一代操作层

把本届I/O的发布串起来,Google的道路照旧十分明晰。它不是单独发布几个AI功能,而是在搭建一套智能体时期的竣工系统:

●模子层:Gemini3.5Flash负责活动和代码,GeminiOmniFlash负责多模态生成;

●器具层:Antigravity、GeminiAPI、AIStudio、AndroidStudio工作设备者;

●进口层:Search、GeminiApp、Android、Chrome、Workspace、YouTube、Shopping邻接用户场景;

●交易层:AIUltra、AIPlus、Pro、UniversalCart和企业工作负责变现;

●基础门径层:GoogleCloud、TPU和EnterpriseAgentPlatform支握大鸿沟部署;

●治理层:SynthID、水印考证、骨子透明、安全框架和用户授权牺牲风险。

而改日,Search不再仅仅搜索扫尾页,而是任务进口;Gemini不再仅仅聊天佑手,而是个东谈主agent;Android不再仅仅期骗平台,而是智能体运行环境;Shopping不再仅仅商品索引,而是来去智能体;Cloud不再仅仅算力租借,而是企业智能体平台。

虽然,Google的挑战也很执行。

智能体要确凿替用户活动,必须惩办可靠性、狡饰、安全、权限、误操作、可讲解性和交易利益突破等问题。尤其在搜索、购物、预订和个东谈主数据场景中,一次诞妄推选、一次误拨电话、一次别离适的自动操作,都可能损伤用户信任。

从2026年GoogleI/O看,Google念念界说的新阶段照旧很明确:智能体不再仅仅产物功能,而会成为新的基础门径;AI不再仅仅信息器具,而会酿成下一代操作层。

(GoogleI/O26主题演讲天团)尊龙凯时中国官网入口