Google 近日在 iOS 平台悄然上線一款全新語音輸入應用——Google AI Edge Eloquent,其核心賣點是「離線優先」的自動語音識別(ASR)功能。此舉標誌著 Google 再次向 Wispr Flow、SuperWhisper、Willow 等新興競爭者發起挑戰,並以其成熟的 Gemini 生態系統為後盾,為使用者提供即時、精準且不依賴網路的文字轉寫服務。
在技術層面,Eloquent 採用了 Google 自研的 Gemma 系列離線 ASR 模型,使用者只需先將模型下載至本機,即可在無網路環境下完成語音錄入。應用內提供即時轉寫畫面,使用者說話的同時即可看到文字流動;按下暫停鍵後,系統會自動剔除「um」與「ah」等語填詞,並根據內建的語意校正演算法對文本進行潤飾。更貼心的是,轉寫結果下方還設有「關鍵要點」「正式」「簡短」「詳盡」等多種格式選項,讓使用者僅需點擊即可將口語內容快速轉換為不同風格的書面稿,極大提升了資訊整理與分享的效率。
Eloquent 同時支援「雲端模式」與「本機模式」切換。啟用雲端模式時,系統會調用最新的 Gemini 大型模型進行深度文本清理與語意優化;關閉雲端模式則徹底依賴本機計算,確保資料隱私不外洩。應用還能自動從使用者的 Gmail 帳戶匯入常用關鍵字、專有名詞與行業術語,並允許手動新增自訂詞彙,從而減少專有名詞的誤辨率。所有轉寫會話均被保存於本地歷史記錄,使用者可以檢索過往內容、查看每分鐘說話字數以及累計口語量,為個人語言表達與效率提供可量化的回饋指標。
儘管目前僅在 iOS 上發佈,App Store 描述中已透露即將推出 Android 版,屆時可作為系統預設鍵盤,實現全系統範圍的語音輸入,並支援類似 Wispr Flow 的懸浮按鈕快捷入口。此舉顯示 Google 正在以實驗性產品測試市場反應,若用戶接受度高,未來有望將相關技術整合至 Android 原生輸入法與其他 Google 服務中,進一步提升跨平台的語音交互體驗。AI 驅動的轉寫應用正迅速崛起,Eloquent 的離線特性與深度語意校正將為隱私敏感或網路受限的使用場景帶來全新解決方案。未來若測試成功,Google 甚至可能在其 Gboard、Pixel 以及 Workspace 生態系統中全面推廣此類功能,為使用者打造從會議錄音到即時筆記的完整端到端工作流。更多資訊請參考Google quietly launched an AI dictation app that works offline。