谷歌低调发布iOS离线AI语音转文字应用

TechCrunch AI··作者 Ivan Mehta

关键信息

该应用支持纯本地模式(使用Gemma ASR)和云端模式(使用Gemini进行文本优化),可从Gmail导入关键词,并记录打字速度与会话历史。

资讯摘要

谷歌推出了名为‘Google AI Edge Eloquent’的免费iOS应用,利用本地运行的Gemma语音识别模型实现离线语音转文字。它能自动过滤掉‘嗯’、‘啊’等填充词,并提供‘要点’、‘正式’、‘简短’和‘详细’等多种文本优化选项。用户可关闭云端模式以确保全程私密性。

应用还支持从Gmail导入关键词并添加自定义词汇。虽然目前仅限iOS平台,但App Store描述中提到将推出Android键盘集成和类似Wispr Flow的浮动按钮功能。谷歌正在测试这款实验性工具,未来可能用于提升安卓系统的语音转文字能力。

谷歌低调发布iOS离线AI语音转文字应用

资讯正文

Google在周一悄然推出了一款名为“Google AI Edge Eloquent”的离线优先语音转录应用,登陆iOS平台,旨在与Wispr Flow、SuperWhisper、Willow等竞品竞争。

这款应用可免费下载。一旦下载了基于Gemma的自动语音识别(ASR)模型,你就可以在手机上开始语音输入。在应用内,你可以看到实时转录内容;按下暂停后,应用会自动过滤掉“嗯”、“啊”等填充词,并对文本进行润色。

转录结果下方提供“要点”、“正式”、“简短”和“详细”等选项,帮助你转换文本风格。

你还可以关闭云端模式,仅使用本地处理。(当开启云端模式时,应用会使用云端的Gemini模型来优化文本。)如果需要,该应用还能从你的Gmail账户中导入特定关键词、姓名和术语。此外,用户也可以添加自定义词汇到列表中。

应用还显示转录历史记录,并支持搜索所有过往内容。它能展示上一次会话中的词语、你的每分钟打字速度以及总发言字数。

Google在App Store的应用描述中写道:“Google AI Edge Eloquent是一款先进的语音转录应用,旨在弥合自然口语与专业可用文本之间的差距。不同于普通语音转录软件逐字记录停顿和填充词,Eloquent利用人工智能捕捉你的真实意图,自动去除‘嗯’、‘啊’及句子中的自我修正,输出干净准确的文稿。”

目前该应用仅限iOS平台使用,但App Store描述提到了安卓版本。(我们已联系谷歌寻求更多信息,如有回复将更新报道。)

根据描述,Eloquent提供“无缝的Android集成”,可以设置为用户的默认键盘,从而在任何文本输入框中实现系统级访问。此外,该应用还将支持浮动按钮功能——类似于Wispr Flow在安卓上的做法——方便用户随时随地启动转录。

随着语音转文字模型性能不断提升,AI驱动的语音转录应用越来越受到用户欢迎。通过这款实验性应用,Google加入了这一趋势。如果测试成功,未来我们或许也能在安卓平台上看到更出色的转录功能升级。

来源与参考

  1. 原始链接
  2. Google quietly launched an AI dictation app that works offline | TechCrunch

收录于 2026-04-09