大型语言模型将帮助人类与动物交流

2024年06月04日 由 samoyed 发表 122 0

语言行业中存在一个常见的陈词滥调,即翻译有助于打破语言障碍。自20世纪50年代后期以来,研究人员一直在试图理解动物交流。如今,科学家们正在将动物智慧与人工智能工具结合起来,理解动物的“语言”。


LLMs-Can-Help-Humans-Communicate-with-Animals-1300x731


通过研究包括音频记录、视频片段和行为数据在内的大量数据集,研究人员现在正使用机器学习来创建一种程序,该程序可以解释这些动物交流方式,以及其他事物。


更贴近现实


地球物种项目(ESP)正利用人工智能来解决该行业一些长期存在的问题,以此为基础开展工作。通过绘制乌鸦叫声地图和创建动物声音基准等项目,ESP正在为进一步的AI研究奠定基础。


该组织的首篇同行评审出版物《科学报告》介绍了一种可以从多个说话者的录音中分离出单个声音的技术,展示了在AI的帮助下,动物交流领域所取得的令人印象深刻的进步,并向观众展示了其中的可能性。


科学家们将在一系列声音中隔离和理解单个动物交流信号的复杂任务称为鸡尾酒会问题。在此基础上,该组织开始评估博客中的信息,将行为与交流信号配对。


ESP联合创始人阿扎·拉斯金(Aza Raskin)表示:“作为人类,我们的理解能力受限于我们的感知能力。而人工智能确实拓宽了人类感知能力的范围。”


说起来容易做起来难


一个常见的错误是假设动物只使用声音作为交流的一种方式。事实上,在动物交流中,视觉和触觉刺激与听觉刺激一样重要,这凸显了这一领域的复杂性和迷人之处,必定会引起观众的兴趣。


例如,白鲸在交流时会使用特定的发声线索来展示其社会体系。猫鼬会根据捕食者的接近程度和风险级别,使用一套复杂的警报叫声来应对捕食者。鸟类还会在天空中向同伴传达危险和其他信息,如交配伴侣的状态。


这些只是研究人员在研究动物交流时必须面对的一些挑战。


为此,拉斯金和ESP团队正在将目前最流行且影响深远的创新——生成式AI和大型语言模型——融入一套工具中,以实现他们的项目。这些先进技术可以通过机器学习理解和生成多种语言、风格和语境下的人类类似回应。


ESP最近开发了动物声音基准(简称BEANS),这是首个动物发声基准。它为生物声学数据上机器学习算法的性能衡量设定了标准。


在自我监督的基础上,他们还创建了动物发声编码器(AVES)。这是动物发声的首个基础模型,可以应用于许多其他应用,包括信号检测和分类。


DeepSqueak是华盛顿大学研究员Kevin Coffey和Russell Marx开发的另一种机器学习技术,能够解码啮齿动物的叫声。DeepSqueak使用原始音频数据识别啮齿动物的叫声,将它们与具有相似特征的叫声进行比较,并提供行为见解,展示了动物交流研究的多种方法。


ChatGPT用于动物


2023年,一位名为Cooper的X用户声称GPT-4帮助救了他狗的生命。他使用GPT-4对自己的狗进行了诊断,这个大型语言模型帮助他缩小了困扰他那只名叫Sassy的边境牧羊犬的潜在问题范围。


虽然实现通用人工智能(AGI)可能还需要数年时间,但Sassy的恢复证明了GPT-4在动物身上的潜在实际应用。


虽然这本身就很惊人,但开发一个基础工具来理解所有动物的交流是一项挑战。与以简单方式(对人类)进行标注的人类数据相比,动物数据难以获取,并且需要专门的研究进行标注。


与人类相比,动物的声音范围非常有限,尽管许多动物都有复杂、复杂的社群。这意味着同样的声音在不同的使用环境中可能有多种含义。确定意义的唯一方法是检查上下文,包括呼叫者的身份、与他人的关系、等级制度和过去的互动。


然而,拉斯金表示,这可能在几年内实现。“我们预计在未来12到36个月内能够产生原始的动物叫声。想象一下,如果我们能创造一个合成乌鸦或鲸鱼,它们似乎在与同类交流。情节转折是,在我们意识到自己在说什么之前,我们可能已经参与了保护工作,”拉斯金说。

文章来源:https://analyticsindiamag.com/soon-llms-can-help-humans-communicate-with-animals/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消