Diffbot推出基于知识图谱的AI聊天机器人,旨在解决“幻觉”问题

2025年01月10日 由 daydream 发表 890 0

知识图谱初创企业Diffbot Technologies Corp.近日发布了一款经过优化的AI聊天机器人,该机器人基于Meta Platforms Inc.的Llama 3.3模型,并引入了图检索增强生成技术,以提高回答的准确性。


微信截图_20250110101118


Diffbot的AI模型与众不同,它并非依赖于庞大的数据库进行训练,而是通过学习如何在公司庞大的知识图谱中搜索信息来工作。这个知识图谱包含超过1万亿个相互关联的事实,并且持续更新。过去八年里,该图谱一直在抓取公共互联网信息,将网页分类为人们、公司、文章和产品等类别,并使用自然语言处理和计算机视觉技术提取最新信息,以保持数据库的时效性。


Diffbot的知识图谱每四到五天更新一次,新增数百万个数据点,这些数据点被用来驱动其最新的AI模型,确保回答基于最新且准确的信息。这与大多数其他大型语言模型(LLM)不同,后者依赖于训练数据中编码的静态信息。


Diffbot认为,其AI模型通过搜索知识图谱中的最新信息并提取相关数据,能够为用户提供更准确且透明的回答。例如,当被问及最近的新闻事件时,该模型会搜索知识图谱中的最新更新,提取最相关数据,并向用户引用信息来源。


Diffbot的创始人兼首席执行官表示,AI行业将向一个更小的模型标准转变,这些模型将拥有大约10亿个参数,而不是当前正在开发的多达数十亿参数的LLM。他认为,试图将最新的知识全部整合到AI模型中是不可持续的,更好的方法是教模型使用必要的工具来搜索外部知识。


Diffbot的AI模型旨在解决所谓的“幻觉”问题,即当AI模型无法回答用户的问题时,不是明确表示不知道,而是编造答案。这种倾向增加了部署AI的风险,而Diffbot的解决方案是将AI系统建立在“可验证的事实”之上。


在测试中,Diffbot的模型在FreshQA基准测试中获得了81%的分数,该测试旨在评估AI模型对实时事实性知识的掌握程度,其表现优于Gemini和ChatGPT。此外,该模型在MMLU-Pro测试中获得了70.36%的分数,该测试评估AI模型的学术知识水平。


Diffbot的模型是开源的,企业可以下载并在自己的机器上运行,并根据自己的需求进行微调。例如,企业可以定制模型以搜索自己的数据库以及Diffbot的知识图谱。这种本地运行的方式也提高了隐私保护。


目前,Diffbot已向Duck Duck Go Inc.、Cisco Systems Inc.和Snap Inc.等企业提供了数据服务,并希望其LLM能被更多企业用于需要高精度和完全责任的工作负载。该模型现已在GitHub上可供下载,并有一个公共演示平台diffy.chat。企业可以选择在单个Nvidia A100图形处理单元上运行的8亿参数版本,或需要两个H100 GPU的70亿参数版本。

文章来源:https://siliconangle.com/2025/01/09/diffbot-boosts-llm-accuracy-tapping-vast-knowledge-graph-date-information/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消