据许多观察者称,今年应该是生成式人工智能(GenAI)在企业中腾飞的一年。这种情况发生的方式之一是通过检索增强生成(RAG),这是一种方法,即通过大型语言模型与包含特定领域内容(如公司文件)的数据库相连接。
然而,RAG是一项新兴技术,有其不足之处。
因此,亚马逊AWS的研究人员在最新的一篇论文中提出,要设定一系列基准,专门测试RAG在回答特定领域内容问题方面的能力。
“我们的方法是一种自动化、成本效益高、可解释性强且稳健的策略,用于为RAG系统选择最佳组件,”论文第一作者高提耶·吉内特(Gauthier Guinet)及其团队在arXiv预印本服务器上发布的《使用特定任务考试生成自动评估检索增强语言模型》一文中写道。
该论文将在7月21日至27日在维也纳举行的第41届国际机器学习大会上进行展示。