突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率
1 月 31 日消息,百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。
项目背景
知识图谱近来在企业领域得到了广泛应用,涵盖法人、注册资本、股东信息等多维度数据。尽管图谱具有很高的实用性,但由于复杂的文本查询和手动探索限制,阻碍有效提取信息。
EICopilot 简介
EICopilot 由百度研究院开发,是一个基于 AI 智能体的解决方案,可简化存储在知识图谱数据库中的企业数据的搜索、探索和摘要,从而有效地获得有关企业的宝贵见解。
EICopilot 处理的数据集包含数亿节点、数百亿边(edges)、数千亿属性以及数百万子图,涵盖国家注册企业、组织和公司等信息。
研究人员收集真实企业相关查询,构建种子数据集,并使用 Gremlin 语言编写搜索脚本,通过系统标注和增强,形成向量数据库,提高搜索精度。
EICopilot 是一个基于 LLM 的聊天机器人,采用创新的数据预处理流程优化数据库查询,利用向量数据库实时生成搜索空间,实现高效的图谱检索和探索。
EICopilot 还具备强大的推理能力,采用思维链(CoT)和上下文学习(ICL)等技术,提供更精准的查询响应。
EICopilot 性能
研究人员使用百度内部数据平台的数据,构建了包含查询和图数据库查询对的数据集,根据查询的遍历长度,将查询分为简单、中等和复杂三类,并采用语法错误率(SyntaxErrorRate)和执行正确率(Execution Correctness)评估 EICopilot 的性能。
实证结果表明,EICopilot 的性能优于基线方法,尤其在速度和准确性方面。Full Mask 版本的 EICopilot 语法错误率低至 10.00%,执行正确率高达 82.14%。
附上参考地址
Baidu Research Introduces EICopilot: An Intelligent Agent-based Chatbot to Retrieve and Interpret Enterprise Information from Massive Graph Databases
EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。