GBase新闻

专注于数据库软件产品和服务,致力于成为用户最信赖的数据库产品供应商

GBASE分享 | 国产关系型数据库与知识图谱的融合

发布时间:2024-01-08

知识图谱(Knowledge Graph)是人工智能的重要分支技术。建立一个知识图谱首先要获得数据,它们可以是一些表格、文本、数据库、音视频、图片等。根据数据的类型可以分为结构化数据、非结构化数据和半结构化数据,需要对它们进行信息抽取才能进一步建立知识图谱。拿到了不同来源的数据时,需要对数据进行知识融合,也就是把代表相同概念的实体合并,将多个来源的数据集合并成一个数据集,在此基础上就可以建立相应的知识图谱了。

在国际上,人工智能领域已经普遍认识到知识图谱技术的应用是实现人工智能从“感知”到“认知”突破的关键因素,而大规模知识图谱的数据管理系统是新一代人工智能重要基础设施亟需的关键共性技术。

知识图谱以图数据库作为存储引擎,南大通用在已有自主可控分布式关系数据库管理系统基础上,研究国产自主可控关系数据库系统与图数据库的集成,从集群管理、元数据管理、存储管理、统一访问接口等模块无缝融合,实现了在统一封装的访问接口服务层进行完全透明的知识图谱查询、管理和应用。

一、主要技术研究

  • 知识图谱统一查询语言接口实现架构

功能支持方言解析器、标准SQL的转换与执行,专属函数管理、数据类型转换等内容,GBase 系统针对图查询语言和SQL查询语言提供统一JDBC、Python API的数据访问接口,在SQL引擎层增加方言语法的识别与支持。

  • 分布式查询计划

GBase 系统对统一查询语言进行语法解析、优化处理并生成查询计划,查询计划由统一的图计算算子组成,可以在图计算引擎上执行并返回结果。

  • GBase 系统支持图数据库

GBase 系统位于应用软件与数据库基础软件之间,起承上启下作用。通过接收用户的命令,分析引擎信息,调用对应的引擎,在不同的数据库系统上执行操作。

二、应用场景

通过国产自主可控关系数据库系统与图数据库的融合,可以在众多应用场景中实现对业务系统的有效支撑。

  • 精准医疗的应用支撑

在智慧医疗场景中应用,将知识图谱集成到南大通用关系型数据库系统中,可以显著提升包括病情检查和住院花费在内的智慧医疗任务精准度,具有重要的临床意义和社会意义。

  • 欺诈检测应用支撑

通过建模,研究大量的交易信息,借助数据分析,可检测出诈骗团伙或其他复杂诈骗行为。

  • 语义解析应用支撑

通过将自然语言转化为知识图谱,存储在数据库中。用自然语言组织的问题可以通过智能问答系统中的语义解析器进行解析并重新组织,然后从知识图谱中检索出问题的可能答案,提供给提问人。

总结

将知识图谱管理系统无缝集成到南大通用关系数据库系统中,以需求导向为研究方向,使信息横向整合,方便可视,让用户在统一封装的访问接口服务层进行完全透明的知识图谱查询、管理和应用,促进了融合的数据库技术发展;融合的系统对海量信息进行智能化处理,利用模型在存储和查询分析的优势为多应用场景提供服务,如智能推荐、智能客服、金融风控、医疗、电商等。GBASE系列产品及技术研究将持续深耕,为各行业大规模知识数据的应用提供技术支撑。