该更新现在仅适用于 Pixel 手机,但将来应该会在其他设备上使用
谷歌正在使用人工智能驱动的离线听写更新其在 Pixel 手机上的 Gboard 键盘谷歌表示,此次更新意味着用户将能够更快,更可靠地口述电子邮件和文本,而不必担心他们是否已连接到互联网
想象一下,你正走出你的大楼,你想向某人发送一条消息,说'我要迟到了',谷歌语音识别和移动输入小组的研究科学家和团队负责人弗朗索瓦丝博费斯说这正是您无法连接的时刻,因为您正在从 Wi—Fi 转向蜂窝计划 伴随着 Gboard 的升级,Beaufays 告诉The Verge,这个问题不再存在了
这听起来像是一个微不足道的用例,但 Beaufays 认为语音识别的改进将慢慢彻底改变我们与移动设备交互的方式她指出,尽管语音识别最近几年来有所改进,但它仍然是一项不成熟的技术它是计算密集型的,这意味着大多数语音识别系统必须通过互联网发送数据,结果是听写既慢又不可靠
离线听写使其更可靠,也许更受欢迎
想象一下,如果你有一个键盘,只要连接性很差,你就无法点击按键,Beaufays 说你就是不会用那个键盘 但她说,通过让系统离线,听写将成为更自然的选择
为了实现这一转变,谷歌的团队花了五年时间调查这个问题并简化了应用程序用于语音识别的人工智能系统例如,虽然旧版 Gboard 听写软件使用三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成书面输出,但更新版本将所有这些工作整合到一个步骤中
新模型还精简了系统中被称为解码器图的部分,该组件的功能类似于书中的索引,将音频波形与书面文字进行匹配在旧版本的 Gboard 听写模型中,这个解码器图的大小为 2GB,对于设备上的处理来说太大了相比之下,新版本只有 80 兆字节,小了 25 倍
目前,此升级的推出仅限于美式英语听写和 Pixel 手机,但 Beaufays 表示,未来它将变得更广泛可用——扩大 AI 语音识别的范围从技术角度来看,我想说我们可以负担得起在更多手机上做到这一点,而不仅仅是 Pixel,Beaufays 说我认为将会发生的事情是,我们可能能够在更多设备 以更多语言推出它
“中国展现了卓越的治理战略,决心和危机应对能力,采取积极措施抵消疫情对经济的影响。因此,中国是2020年全球唯一实现GDP正增长的主要经济体。”霍华德马克斯说。