Alexa已安装在全球超过1亿台设备上,在此过程中收集了数十亿用户查询。 与所有数字助理一样,Alexa依靠数据模型提供更好的响应,但看起来亚马逊也为数字助理提供了人工评论的帮助。 彭博社的 一项调查显示,亚马逊拥有一支全球团队,负责将Alexa的录音转录并传播到世界各地,以“消除Alexa对人类言语理解的差距”,并让助理能够更好地回应您的查询。
该出版物发现,亚马逊雇佣了全球数千人 - 包括承包商和全职员工 - 来审查Alexa的录音,团队遍布波士顿,哥斯达黎加,印度和罗马尼亚。 根据一位未透露姓名的消息来源,每位评论员在9个小时的班次中解析超过1, 000个音频片段,对其进行注释并将其反馈给系统以改善Alexa的反应。 来自 彭博社 :
波士顿的一名工作人员表示,他为特定话语(如“泰勒斯威夫特”)挖掘了累积的语音数据,并对其进行了注释,以表明搜索者是指音乐艺术家。
有时听众会收拾东西Echo所有者可能宁愿保持私密:一个女人在洗澡时严重地唱着钥匙,或者说一个孩子在尖叫寻求帮助。 团队在需要帮助解析混乱的单词时使用内部聊天室来共享文件 - 或者遇到有趣的录音。
该出版物还发现员工遇到了令人不安的录音:
有时他们会听到他们发现令人不安或可能是犯罪的录音。 其中两名工人说他们接受了他们认为是性侵犯的行为。 当这样的事情发生时,他们可能会在内部聊天室分享经验,以缓解压力。
亚马逊表示,当工作人员听到令人痛苦的事情时,它已经制定了程序,但两名罗马尼亚员工表示,在要求对此类案件提供指导后,他们被告知干扰亚马逊的工作。
录音没有用户的全名或地址,但它们包括用户的名字,帐号和设备的序列号。 亚马逊此前曾提到它依靠自然语言处理来训练Alexa,但它已经向 Bloomberg 承认它使用人为元素来注释“Alexa语音录音的小样本”:
我们认真对待客户个人信息的安全性和隐私性。 我们只注释极少量的Alexa录音样本,以改善客户体验。 例如,这些信息有助于我们培训语音识别和自然语言理解系统,因此Alexa可以更好地了解您的请求,并确保服务适合每个人。
我们有严格的技术和操作保障措施,对滥用我们的系统采取零容忍政策。 员工无法直接访问可在此工作流程中识别此人或帐户的信息。 所有信息都具有高度机密性,我们使用多因素身份验证来限制访问,服务加密和审核我们的控制环境以保护它。
不只是亚马逊正在转向人类助手来开发其数字助理。 彭博社 发现,Apple还有一个人力团队,负责检查Siri对请求的解释是否与用户提出的要求相符。 谷歌有评论员培训助理,但剪辑没有任何个人身份信息,音频本身也被扭曲,以防止任何身份识别。