https://www.youtube.com/watch?v=o8NiE3XMPrM
一、AI 模型與基礎設施進展
-
Gemini 2.5 Pro 是 Google 目前最先進的模型,性能在多項基準測試(如 LMArena)上取得領先,特別是在語言、程式碼、長上下文處理能力方面大幅提升。
-
Gemini Flash 2.5 是高效率版本,擁有低延遲與成本優勢。
-
引入 DeepThink 模式,讓模型有更長的思考時間,提升推理與解題能力(如美國數學奧林匹亞與競賽級程式設計)。
-
第七代 TPU Ironwood 每個 pod 可達 42.5 exaflops,為 AI 訓練與推論提供大規模算力。
二、Gemini 應用擴展
-
Gemini App 現已有超過 4 億活躍用戶,新增:
-
Agent Mode:可主動幫使用者搜尋房屋、預約行程等。
-
Personal Context:可存取使用者 Gmail、Docs 等資料,提供個人化建議。
-
Gemini Live:即時語音對話(支援 45+ 語言),可分享畫面與鏡頭。
-
Gemini in Chrome:可理解瀏覽頁面內容,自動提供協助。
-
三、AI 助理與代理功能(Agent)
-
Project Astra:實現攝影機與語音互動,辨識環境並執行複雜任務。
-
Project Mariner:AI 可操作瀏覽器、學習使用者教學,自動重複任務。
-
AI 溝通協議 MCP + 開放代理標準 A2A Protocol:促進多代理合作生態。
四、即時翻譯與會議應用
-
Google Meet 導入即時語音翻譯(目前支援英文↔西文),同步語調與情緒,未來將支援更多語言。
-
Google Beam(由 Project Starline 演進)為 3D 視訊會議平台,將推出實體裝置與 HP 合作販售。
五、搜尋與 AI 模式整合
-
AI Overview:生成式 AI 結合傳統搜尋,每月超過 15 億人使用。
-
AI Mode(美國已推出):可處理更長更複雜查詢,自動規劃搜尋策略。
-
結合個人化(如 Gmail 行程、偏好)回應。
-
支援即時視覺互動(Search Live)。
-
幫助分析數據(如體育或財報),也能主動完成任務(如訂票、預約)。
-
未來將整合購物試穿、價格追蹤、自動結帳等功能。
-
六、生成式多媒體創作
-
Imagen 4:新一代圖像生成模型,畫質、構圖、文字辨識均大幅提升。
-
Veo 3:影片生成模型,加入原生音效與對話功能。
-
Canvas 平台:可將文件轉換為網站、測驗、播客等格式,並支援多人協作創作。
-
Music AI Sandbox + Lyria:支援音樂人創作新曲,與專業藝術家合作開發。
七、AI 促進科學進展
-
AlphaFold 3:蛋白質與分子結構預測,推動藥物研發。
-
AlphaEvolve、AlphaProof、AMIE:在數學、醫學診斷與科研假說生成等方面展現突破。
-
AI 可協助像視障者透過 Astra 技術實現自主行動(合作單位如 Aira)。
No comments:
Post a Comment