科技

谷歌Gemini 3.0 Pro强势登场:多项基准屠榜,阿尔特曼与马斯克罕见送上祝贺

0
登录或者登记去做吧。
阅读量:27

谷歌近日正式推出新一代推理模型Gemini 3.0 Pro,并在Google AI Studio同步开放预览版及API接口。该模型即将陆续集成到谷歌旗下各类产品中,一经发布便在多项权威评测中大幅领先,引发业界广泛关注。

有趣的是,竞争对手高层罕见公开“庆祝”。OpenAI联合创始人兼CEO萨姆·阿尔特曼在社交平台上评论称“Gemini 3看起来很不错”,xAI创始人埃隆·马斯克也转发了相关消息表示认可。谷歌CEO桑达尔·皮查伊则以轻松方式回应了阿尔特曼的评价。

在性能表现上,Gemini 3.0 Pro几乎横扫各大榜单:在LMArena大模型竞技场中,以1501的Elo得分稳居首位。在极具挑战性的数学竞赛基准MathArena中,该模型得分高达23.4%,而包括GPT-5.1在内的其他顶级模型仍徘徊在1%左右,一举成为当前全球数学推理能力最强的AI。

编程能力同样出色:在Live Code Bench基准中Elo得分突破2400分,在工具调用和终端操作测试中位列第一,虽未在SWE-Bench刷新最高纪录,但已稳居前列。更引人注目的是视觉理解能力,对屏幕截图的解析准确率达到72.7%,约为现有最先进水平的兩倍,这将极大提升AI Agent在复杂视觉场景下的表现。

谷歌还同期推出了Agentic编程平台Google Antigravity,进一步强化生态布局。Gemini 3.0 Pro基于自研TPU张量处理单元训练,相比传统CPU在处理大规模模型时效率更高,并配备大容量高带宽内存,支持高效批量推理。

实际应用层面,Gemini Agent实验功能已能独立完成多步骤复杂任务,例如用户只需指示“整理一下我的收件箱”,它便可自动优先处理邮件并生成回复草稿。

目前Gemini 3.0 Pro预览版已逐步开放:普通用户可通过Gemini应用直接体验;Google AI Pro/Ultimate订阅用户可在搜索AI模式中使用;开发者通过Gemini API、Google Antigravity及CLI工具访问;企业客户则经由Vertex AI和Gemini Enterprise获取服务。

此次发布标志着谷歌在多模态推理、Agent工具使用等领域实现全面领先,进一步巩固了其在生成式AI领域的技术优势。

1763522176_976642

《我独自升级:ARISE》豪华版预购开启:11月22日提前体验,买断制无抽卡
小米总裁卢伟冰:内存成本持续上涨,或将通过产品涨价和结构优化应对
您必须 登录 后才能评论。