人类如何学会语言?婴儿如何从外界接收语言信号,逐步建立语言能力并与人交流?这些问题一直是科学家们关注的焦点,但至今尚无普遍认可的答案。美国麻省理工学院教授迪布·罗伊(Deb Roy)利用自己喜得贵子的机会,启动了一项名为“人类家庭语言计划”(Human Speechome Project)的研究,旨在通过长期记录婴儿的语言学习过程,揭示人类早期语言习得的奥秘。
据英国广播公司(BBC)2006年5月19日报道,罗伊教授在其儿子出生后,立即启动了这项为期三年的记录计划。研究团队在住宅内安装了14个麦克风和11部全方位摄像机,每天从早上8点到晚上10点持续记录婴儿醒着时的所有活动和声音,每天收集约350吉字节的压缩数据。这些设备隐藏在天花板中,覆盖了厨房、餐厅、客厅、游戏室、卧室等所有房间,能够捕捉任何可能影响语言学习的因素。每秒钟记录14个画面,即使是微小的动作也不放过。不过,由于技术限制,像眨眼这样的细微面部表情尚无法捕捉,而这些表情被认为是语言学习的重要线索。
麦克风系统采用层级式设计,能够自动削弱噪音,记录所有房间的声音,即使是轻声耳语也不会遗漏。预计三年将记录下33.8万小时的数据,包括14.2万小时视频和19.6万小时音频。数据收集完成后,将通过隐藏的数据线传输到麻省理工学院媒体实验室的5千兆字节磁盘存储系统,并由10台串联的电脑进行大规模数据分析。声音数据则储存在地下室的一个标本取样器中。
数据分析有两种途径:一是通过自动语言识别器转录,但出错率较高;二是人工转录,通过人工识别区分婴儿声音和噪音,以减少误差。罗伊教授团队还自行设计了一套系统,能够自动识别长时间记录中的语音,并通过数学运算生成类似光谱的声音图像,每1分钟对话约需2.5分钟转录时间。这些系统共同构建了一幅幼儿感官刺激的完整图画,从而可以建立一个模拟婴儿语言学习的模型。
在采访中,罗伊教授回答了关于婴儿语言学习的多个问题。他指出,婴儿最先学会的单词并非“妈妈”,尽管“妈妈”发音简单且出现较早。关于隐私问题,所有记录均可通过墙上的微型触摸控制器或“哎呀”按钮手动控制,以擦除不需要的记录。对于观察者可能影响实验结果的问题,罗伊教授表示,这种影响通常只持续24到48小时,而长期记录已使影响降至最低。记录周期定为三年,因为2到3年是婴儿从学习第一个单词到出现简单语法的关键期。罗伊教授认为,天生的语言结构和环境因素在语言习得中均起重要作用,该计划旨在为研究人类语言获取过程提供自然、丰富、纵向的参考数据,并有望应用于个人视频分析或监控影像处理等领域。