研究表明:人工智能可以进行类似儿童的语言学习

2024年02月02日 由 samoyed 发表 309 0

GPT-4等人工智能系统现在可以学习和使用人类语言,但它们从天文数字的语言输入中学习——远远超过儿童在学习如何理解和说语言时所获得的。最好的人工智能系统在数以万亿计文本上训练,而儿童每年只接收到数百万字。


abc-3523453_1280


由于这种巨大的数据差距,研究人员一直怀疑最近的人工智能进步能否告诉我们很多关于人类学习和发展的信息。演示连接的理想测试将涉及训练 AI 模型,不是基于来自网络的大量数据,而是仅基于单个孩子接收的输入。那么模型能够学习什么呢?


纽约大学的一组研究人员进行了这个确切的实验。他们通过一个孩子的眼睛和耳朵训练了一个多模态人工智能系统,使用从孩子6个月大到两岁生日的头戴摄像头视频记录。他们研究了人工智能模型是否可以学习儿童日常经验中存在的单词和概念。


他们的研究结果发表在《科学》杂志上,表明该模型或神经网络实际上可以使用儿童经历的有限片段来学习大量的单词和概念。也就是说,该视频只捕捉到了孩子清醒时间的1%左右,但这对于真正的语言学习来说已经足够了。


“我们首次证明,一个神经网络在单个孩子的这种发展现实输入上训练,可以学会将单词与视觉对应物联系起来,”纽约大学数据科学中心的研究科学家、该论文的第一作者Wai Keen Vong说。


“我们的研究结果表明,最近的算法进步与一个孩子的自然体验相结合,有可能重塑我们对早期语言和概念习得的理解。


“通过使用人工智能模型来研究儿童面临的真实语言学习问题,我们可以解决关于儿童学习单词需要哪些条件的经典争论,他们是否需要特定语言的偏见、先天知识、或者联想学习能力才能开始学会使用单词,”纽约大学数据科学中心和心理学系助理教授,该论文的资深作者Brenden Lake补充道。“似乎我们可以通过学习获得比通常想象的更多的东西。


Vong、Lake和他们的纽约大学同事Wentao Wang和Emin Orhan分析了从6个月到25个月,每周超过60小时的镜头,通过轻型头戴式摄像机通过第一人称视频捕捉到的孩子的学习过程。


这些镜头包含大约一百万个单词实例中的四分之一(即交流的单词数量,其中许多是重复的),这些实例与儿童说出这些单词时所看到的视频帧相关联,并包括整个发展过程中的各种不同活动,包括进餐时间、阅读书籍和孩子玩耍。


然后,纽约大学的研究人员用两个独立的模块训练了一个多模态神经网络:一个模块接收单个视频帧(视觉编码器),另一个模块接收转录的儿童导向语音(语言编码器)。

文章来源:https://techxplore.com/news/2024-02-child-language-ai-tools.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消