人工智能在手语翻译领域进行了一次成功的尝试
2023年05月25日 由 Samoyed 发表
389966
0
巴塞罗那超级计算中心(BSC-CNS)和加泰罗尼亚理工大学(UPC)的研究人员开发了一种利用人工智能打破听力困难人群常见的沟通障碍的自动手语翻译工具。
尽管Alexa和Siri等语音识别技术取得了进步,但这些应用程序仍然不能识别手语,这些应用程序越来越多地出现在日常生活中。这给依赖手语作为首选交流方式的人们与技术互动和获取仅为口语设计的数字服务造成了障碍。
这个新的开源软件的开发是使所有人都能无障碍交流的重要一步。为此,BSC和UPC的研究人员将计算机视觉、自然语言处理和机器学习技术结合起来,推进自动手语翻译的研究。世界上手语的数量众多并且可变性大,这让自动手语翻译的研究成为一个复杂的问题。
该系统仍处于实验阶段,它使用了一种名为Transformers的机器学习模型,该模型是ChatGPT等其他人工智能工具的基础,可以将视频格式的整个手语句子转换为文本格式的口语。它目前专注于美国手语(ASL),但只要所有必要的可用数据(即存在一个有平行数据的语料库,其中每个手语句子(视频格式)都有相应的口头语言翻译(文本格式)),就可以适应任何其他语言。
“开发的新工具是BSC和UPC之前发表的How2Sign的扩展,其中发布了训练模型所需的数据(超过80小时的视频,其中包括美国手语口译员翻译烹饪食谱或DIY技巧等视频教程)。有了这些数据,该团队开发了一种新的开源软件,能够学习视频和文本之间的映射关系,”BSC和UPC的研究员Laia Tarrés说,他在全球无障碍宣传日的庆祝活动中介绍了这个研究成果。
研究人员表示,这项新工作是朝着正确方向迈出的一步,但他们也强调,仍有很大的改进空间。目前这些仅是首个结果,还不能为用户提供具体的应用程序。他们的目标是继续努力改进工具,实现创建面向听力困难人群的无障碍技术的真正应用。
该项目已经在马德里的Fundación Telefónica作为“代码和算法”展览的一部分进行了展示。该展览汇集了与人工智能有关的不同项目,BSC在其中发挥了重要作用。该项目还将很快在巴塞罗那现代文化中心的“人工智能”展览中展出,该展览也将于十月开幕。
“这个开放的自动手语翻译工具是对无障碍科学界的宝贵贡献,它的发布代表着朝着为所有人创造更具包容性和无障碍的技术迈出的重要一步,” Tarrés总结道。
来源:https://techxplore.com/news/2023-05-ai-tool-accessibility-technology-people.html