您的位置:首页 >Nature杂志 > Nature杂志精选 >

像孩子一样学习语言的机器

导读 孩子们通过观察周围的环境,倾听周围的人的声音,并在所见所闻之间连接各个点,来学习语言。除其他外,这有助于儿童建立他们语言的单词顺序

孩子们通过观察周围的环境,倾听周围的人的声音,并在所见所闻之间连接各个点,来学习语言。除其他外,这有助于儿童建立他们语言的单词顺序,例如主语和动词落在句子中的位置。

在计算中,学习语言是语法和语义解析器的任务。这些系统接受了人类注释的句子的培训,这些句子描述了单词背后的结构和含义。解析器对于网络搜索,自然语言数据库查询和语音识别系统(例如Alexa和Siri)变得越来越重要。不久,它们也可能用于家庭机器人。

但是,对于不太常见的语言,收集注释数据可能很耗时且困难。此外,人们并不总是同意注释,并且注释本身可能无法准确反映人们自然说话的方式。

在本周的“自然语言处理中的经验方法”会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种解析器,该解析器通过观察来学习,以更紧密地模仿孩子的语言习得过程,这可以大大扩展解析器的功能。为了学习语言的结构,解析器会观察带字幕的视频,而没有其他信息,并将单词与录制的对象和动作相关联。给定一个新句子,解析器随后可以使用所学的关于语言结构的信息来准确地预测句子的含义,而无需视频。

这种“弱监督”的方法(意味着它需要的培训数据有限)模仿了儿童如何观察周围的世界并学习语言,而没有任何人提供直接的上下文。研究人员说,这种方法可以扩展数据类型并减少培训解析器所需的工作量。例如,可以将一些直接注释的句子与许多带字幕的视频结合起来,以提高性能,这些视频更容易出现。

将来,解析器可用于改善人类与个人机器人之间的自然互动。例如,配备解析器的机器人可以不断观察其环境,以增强其对口头命令的理解,包括当口头句子不完全语法清晰时。人们彼此之间会用部分的句子,漫长的想法和混乱的语言交谈。您需要在家中使用一种能够适应其特定说话方式的机器人……并且仍然能弄清它们的含义。”合著者安德烈·巴布(Andrei Barbu)说,他是计算机科学和人工智能实验室(CSAIL)和麻省理工学院麦戈文研究所的大脑,思想和机器(CBMM)。

解析器还可以帮助研究人员更好地了解幼儿如何学习语言。共同作者说:“孩子可以从不同的方式获得冗余的补充信息,包括聆听父母和兄弟姐妹谈论世界的信息,以及触觉信息和视觉信息,这些信息可以帮助他或她了解世界。” Boris Katz,首席研究科学家兼CSAIL InfoLab集团负责人。“处理所有这些同时的感官输入是一个了不起的难题。这项工作是理解这一学习如何在世界上发生的更大部分的一部分。”

该论文的共同作者为:第一作者Candace Ross,电气工程与计算机科学系和CSAIL的研究生,CBMM的研究人员。Yevgeni Berzak博士'17,脑与认知科学系计算心理语言学小组的博士后;和CSAIL研究生Battushig Myanganbayar。

免责声明:本文由用户上传,如有侵权请联系删除!