Google Gemini 3.5 即時語音翻譯發佈

Google 推出 Gemini 3.5 Live Translate 實現即時語音對語音翻譯

Google 多年來一直追求即時翻譯，並稱其為「開創性的機器學習實驗」之一。過去我們在 Google 的活動中看過無數次舞台演示，但當時需要使用 Google 手機、耳機或其他特定的設備。去年，Google 將即時翻譯功能帶到了 Translate 應用程式中供更多用戶使用，而現在正進一步擴大其可用性。隨著 Gemini 3.5 Live Translate 的發佈，你將能在更多地方獲得比以往延遲更低的即時翻譯服務。

這款全新的人工智能模型是於 I/O 大會發佈的 3.5 系列成員之一。在今天之前，Google 僅推出了 Flash 版本，但我們預計 Pro 模型將在未來幾週內推出。Gemini 3.5 Live Translate 是一款語音對語音模型，經過調整後可自動偵測並翻譯超過 70 種語言。

Google 表示 Gemini 3.5 Live Translate 的速度足以跟上正常的對話，僅落後說話者幾秒鐘，同時還能匹配語調、節奏和音高。簡而言之，聲音聽起來更像你本人，而非通用的機器人。雖然這些演示都是在受控環境下錄製的，但聽起來確實令人印象深刻。不過，你不需要等太久就能親自驗證該模型的能力。

在 Google Meet 中使用 Gemini 3.5 Live Translate 進行語音翻譯。

Gemini 3.5 Live Translate 正在 Google 生態系統的多個部分陸續推出。開發者可以開始透過 Gemini Live API 或 AI Studio 的公開預覽版進行開發。該模型會持續處理語音並自動處理所有多語言輸入，免除開發者手動配置設定的麻煩。它還能過濾繁忙環境中的背景噪音。

Google 推出 Gemini 3.5 Live Translate 實現即時語音對語音翻譯

點解重要

新手貼士

術語小字典

Google 推出 Gemini 3.5 Live Translate 實現即時語音對語音翻譯

資料來源