Logo cn.androidermagazine.com
Logo cn.androidermagazine.com

谷歌的translatotron通过模仿说话者的声音使翻译变得不那么尴尬

目录:

Anonim

你需要知道什么

  • Translatotron是谷歌新的语音转语音翻译模型。
  • 通过使用语音转换,它可以跳过将源转换为文本的步骤,并可以加快翻译速度。
  • Translatotron还能够模仿说话者的声音和节奏,使结果听起来更人性化,更少机器人。

在全世界范围内相互沟通的能力对于建设我们的社会至关重要。 从交换想法到交易商品等,语言是我们所做的一切的核心。

问题是,我们并不都说同一种语言,这就是译者多年来使自己变得无价之宝的地方。 随着每一代新手的出现,翻译人员变得越来越聪明,速度越来越快,谷歌刚刚在这个领域取得了新的进步,并称之为Translatotron。

目前,在翻译所使用的模型时需要三个步骤:听取源材料并将其转换为文本,将文本翻译成目标语言,最后将该文本转换回语音。

使用Translatotron谷歌可以删除文本的抄录,直接进行语音到语音的翻译。 该系统的一个好处是它可以比我们现在使用的系统更快。 通过跳过将语音转换为文本的步骤,它还允许更准确的翻译,避免在转换期间发现的一些典型错误。

然而,Translatotron最令人印象深刻的特点是它能够保留原始扬声器的声音和节奏的一些特征。

这是旧方法永远无法实现的东西,并且会使翻译听起来更人性化,更少机器人化。 毕竟,我们所说的不仅重要,而且我们如何说。

谷歌在其博客文章中包含了一些样本,在其GitHub页面上还有更多样本。 如果您想了解Translatotron如何能够保留原始演讲者声音的各个方面,那么绝对值得一试。 虽然它远非完美,但它仍然听起来像机器人,但结果比我们今天的结果有了很大的改进。

谷歌的语音和听力障碍人士更容易使用手机

获得更多像素3a

Google Pixel 3a

  • Google Pixel 3a评论
  • 适用于Pixel 3a XL的最佳屏幕保护膜
  • Pixel 3a XL的最佳案例
  • Pixel 3a的最佳案例
  • 最好的Pixel 3a配件

我们可能会使用我们的链接获得购买佣金。 学到更多。