遵化市论坛

注册

 

发新话题 回复该主题

知识图谱简介及典型金融应用场景 [复制链接]

1#
治疗白癜风中药配方 http://m.39.net/pf/a_4769864.html

一、什么是知识图谱

知识图谱(knowledgegraph)的概念最早由Google在年提出,最初Google提出它是为了增强搜索引擎功能和提高搜索结果质量。随着大数据和人工智能的兴起,知识图谱的技术也越来越得到学术和产业界的重视。

尤其是图谱的可视化展示,通过关联图将不同的事物连接展示出来,给人留下了深刻的印象,也吸引了越来越多的人参与图谱的研发和应用。那么到底什么是知识图谱呢?概括地说,知识图谱是一门将事物进行关联分析的技术,它初期通过将不同的事物以实体的形式进行关联形成一个语义网络,比较直观的就如下图一样是把事物通过不同的关系连接表现出来。现在也在往多模态方向发展,融合图片、语音、视频等更多种类型的信息成为多模态知识图谱。

二、知识图谱主要包括哪些技能模块

知识图谱主要包括哪些技能模块呢?我们可以以知识图谱处理一篇文章的场景来概括。基于知识图谱的技术,面对一篇文章,它可以将实体从文章中抽取出来,接着将抽取出的实体和知识库中已有的实体进行匹配对应,然后将有关系的实体进行关联,最后将抽取出来的实体和关系进行存储,而后可以图谱可视化的形式将关联的实体展示出来。这整个流程,基本涵盖了知识图谱的主要技能模块,分别对应了实体抽取、实体链接、关系抽取、图谱存储和图谱可视化的技术能力。

实体抽取(EntityExtraction):此模块也被称为命名实体识别(NamedEntityRecognition,NER),是指将文本中提到的实体从中抽取出来的技术,常见抽取出来的实体类型包括人名、地名、机构名、事件名称、产品名称、数值等,也可以人为根据业务场景来定义专有词汇作为抽取的实体对象,这里需要注意实体可以不是名词,也可以是动词、数值、形容词等词性词汇。

实体链接(EntityLinking):在我们日常生活中,很多词汇有多种表达方式,我们可能简化表达或者用其他词汇代指,比如北大=北京大学,此外还有一些词汇则有多个含义,比如苹果可能指苹果手机也可能指水果苹果,这时在第一步我们抽取了实体后,就需要通过指称识别和实体消歧来把抽取到的实体对应到知识库中标准的实体,以此明确文章中抽取到的实体到底是哪个实体,此技术模块即是实体链接。

关系抽取(RelationExtraction):对于未知的实体关系,我们是否可以通过算法来找到实体间的关系?这即是关系抽取技术,它可以帮我们发掘人与人、人与事物、事物与事物等之间的关系,并以三元组的形式(head,relation,tail)表示这种关系,比如从“湖北的省会是武汉”可以得到(湖北,省会,武汉)。关系抽取技术较简单的可以由模板匹配来实现,比如对省份可以设置(省份,省会,城市)这样的模板来找到实体关系,较复杂的则可以通过深度学习模型来进行抽取。

图谱存储:图谱数据可以由传统的关系型数据库如Mysql来存储处理,也可以由最近几年逐渐火热的图数据库来存储。不同之处在于,图数据库主要由节点和关系两种元素构成,这天然符合三元组数据是关于两个实体的关系构成的数据类型,相比于关系型数据库,图数据库对关系的处理能力更强。比如对“购买过A理财产品的用户还购买过哪些保险产品”这类问题,通过关系型数据库往往要关联几张表来查询,而通过图数据库,只需要通过(A,买家,用户X)和(用户X,购买保险,保险产品Y)两个关系即可快速查询,整体效率得到明显提升。目前常见的图数据库有Neo4j、JanuasGraph、OrientDB、HugeGraph、Trinity等。

图谱可视化:知识图谱的三元组数据可以通过前端展示形成一个网络状关联图,这个关联图可以形象的反映不同实体(节点)之间的关系,往往给人留下直观深刻的印象。这部分主要离不开前端可视化技术,主要由d3.js和echart来实现,其中echart是由百度开源的,上手操作更容易,而d3可实现的效果更丰富个性化。

三、金融场景可以用图谱做什么

金融行业一直是人工智能和大数据应用的热门领域,时至今日,人脸识别、语音识别、数据挖掘技术在金融场景下应用的如火如荼,知识图谱作为一门新技术也逐渐受到金融机构的重视,尤其是在风控、营销、文档智能处理这些具体场景下应用越来越多。

3.1基于知识图谱的风控技术

风险防控一直是金融领域最重要的工作,也是知识图谱在金融领域最适用的场景。通过将借款人的个人信息、社会关系、金融业务进行图谱画像,借款人的情况一目了然,可以帮助金融机构精准快速地进行申请贷款人身份识别核验、人员关系发掘、风险点识别,从而杜绝金融风险。而针对团伙金融诈骗,知识图谱可以将不同的人-信息-事件进行关联分析,从而发现隐藏的人物关系和事件关系,从而对诈骗团伙进行揭露和打击。

如下图是本

分享 转发
TOP
发新话题 回复该主题