目录:
- Live Caption为所有类型的视频提供设备上的实时字幕。
- 直播中继允许有语言障碍的人使用Google智能助理拨打电话。
- 正在创建来自Google AI的Euphonia项目,以帮助有语言障碍的人比以往更快,更轻松地进行沟通。
将手机视为理所当然非常容易。 我们日复一日地使用它们而不给他们太多考虑,但对于有身体残障/残疾的人来说,即使是最简单的任务也可能证明是令人生畏的。 在谷歌I / O 2019年,谷歌宣布了三个正在努力改变这个项目的新项目 - 实时字幕,实时中继和项目Euphonia。
实时字幕
Netflix和YouTube等工具随时可以使用隐藏式字幕,以便让聋哑人或听觉人员更容易获取视频,但目前阶段的字幕存在一些问题。 并非每个视频或服务都支持它们,并且它们通常需要某种数据连接。
借助Live Caption,Google创建了一个系统,可以为各种媒体实时提供本地设备上的字幕。 无论您是观看YouTube视频,自己录制的视频,还是其他任何内容,Live Caption都可以即时转录文字,无需任何类型的数据连接。
我们没有确切的发布日期,但Google表示它将在“今年晚些时候推出”。
直播中继
另一方面,Live Relay旨在帮助人们即使讲话有困难也能接听电话。
如果有人使用直播中继接听电话,则通话另一端的人将被告知该人正在使用Google提供的由智能助理提供的直播中继服务 - 与Google双工的工作方式非常相似。
另一端的人所说的一切都在Live Relay用户的屏幕上实时转录,并且要回复,您可以在键盘上键入自定义消息或使用智能回复和智能撰写快速发送基于的预制消息这个人刚刚说了什么。
就像Live Caption一样,Live Relay在您的手机上本地运行,不需要任何数据或Wi-Fi即可运行。
Live Relay仍然处于“研究阶段”,但我们希望它能够尽快推出。
Euphonia项目
最后但同样重要的是,Project Euphoria正在创建,以帮助那些患有肌萎缩侧索硬化症,硬化症或其他语言障碍的人比以往更容易沟通。
每个Google:
为此,Google软件会将录制的语音样本转换为频谱图或声音的直观表示。 然后,计算机使用共同的转录频谱图来“训练”系统,以更好地识别这种不太常见的语音类型。 我们的AI算法目前旨在容纳说英语并且通常与ALS相关的障碍的人,但我们相信我们的研究可以应用于更大的人群和不同的语言障碍。
除了改进语音识别,我们还会培训个性化的AI算法来检测声音或手势,然后采取行动,例如向Google Home生成口头命令或发送短信。 这对于严重残疾且不会说话的人尤其有用。