Diffbot推出基于知识图谱的AI聊天机器人，旨在解决“幻觉”问题

2025年01月10日由 daydream 发表 890 0

知识图谱初创企业Diffbot Technologies Corp.近日发布了一款经过优化的AI聊天机器人，该机器人基于Meta Platforms Inc.的Llama 3.3模型，并引入了图检索增强生成技术，以提高回答的准确性。

微信截图_20250110101118

Diffbot的AI模型与众不同，它并非依赖于庞大的数据库进行训练，而是通过学习如何在公司庞大的知识图谱中搜索信息来工作。这个知识图谱包含超过1万亿个相互关联的事实，并且持续更新。过去八年里，该图谱一直在抓取公共互联网信息，将网页分类为人们、公司、文章和产品等类别，并使用自然语言处理和计算机视觉技术提取最新信息，以保持数据库的时效性。

Diffbot的知识图谱每四到五天更新一次，新增数百万个数据点，这些数据点被用来驱动其最新的AI模型，确保回答基于最新且准确的信息。这与大多数其他大型语言模型（LLM）不同，后者依赖于训练数据中编码的静态信息。

Diffbot认为，其AI模型通过搜索知识图谱中的最新信息并提取相关数据，能够为用户提供更准确且透明的回答。例如，当被问及最近的新闻事件时，该模型会搜索知识图谱中的最新更新，提取最相关数据，并向用户引用信息来源。

Diffbot的创始人兼首席执行官表示，AI行业将向一个更小的模型标准转变，这些模型将拥有大约10亿个参数，而不是当前正在开发的多达数十亿参数的LLM。他认为，试图将最新的知识全部整合到AI模型中是不可持续的，更好的方法是教模型使用必要的工具来搜索外部知识。

Diffbot的AI模型旨在解决所谓的“幻觉”问题，即当AI模型无法回答用户的问题时，不是明确表示不知道，而是编造答案。这种倾向增加了部署AI的风险，而Diffbot的解决方案是将AI系统建立在“可验证的事实”之上。

在测试中，Diffbot的模型在FreshQA基准测试中获得了81%的分数，该测试旨在评估AI模型对实时事实性知识的掌握程度，其表现优于Gemini和ChatGPT。此外，该模型在MMLU-Pro测试中获得了70.36%的分数，该测试评估AI模型的学术知识水平。

Diffbot的模型是开源的，企业可以下载并在自己的机器上运行，并根据自己的需求进行微调。例如，企业可以定制模型以搜索自己的数据库以及Diffbot的知识图谱。这种本地运行的方式也提高了隐私保护。

目前，Diffbot已向Duck Duck Go Inc.、Cisco Systems Inc.和Snap Inc.等企业提供了数据服务，并希望其LLM能被更多企业用于需要高精度和完全责任的工作负载。该模型现已在GitHub上可供下载，并有一个公共演示平台diffy.chat。企业可以选择在单个Nvidia A100图形处理单元上运行的8亿参数版本，或需要两个H100 GPU的70亿参数版本。

文章来源：https://siliconangle.com/2025/01/09/diffbot-boosts-llm-accuracy-tapping-vast-knowledge-graph-date-information/

标签：

Diffbot AI 机器人

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌加速AI发展，整合AI服务团队至DeepMind

下一篇埃隆·马斯克呼吁强制拍卖OpenAI股份

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

2024年RAG的年度回顾