ITPub博客

首页 > 人工智能 > 深度学习 > NLPIR在文本信息提取方面的优势介绍

NLPIR在文本信息提取方面的优势介绍

原创 深度学习 作者:ljrj123 时间:2019-09-12 15:10:24 0 删除 编辑


 

构建知识图谱需要满足三项要素要求,分别是实体,关系和属性。文本信息提取,则是在文本中提出三元信息,包括实体和关系的信息,实体和属性的信息,然后将这些关系设置成数据库的过程。

 

进行信息提取的主要环节介绍:

1、确定要进行信息提取的知识本体。

2、为每一个目标知识点设立足够的训练语料,或是抽取足够的编写规则

3、利用机器学习的方法,在训练语料和规则的基础上,建立模型。

 

构建知识图谱最重要的环节,NLPIR平台KGB 知识图谱在文本信息提取的优势:

 

1、能够解析不同格式文档和图片

KGB知识图谱引擎,能够对不同版本和格式的文档进行解析:TXT、DOC、EXCEL、PPT、PDF、XML等,对于图片,OCR可自动识别并抽取图片中的文字信息。

2、对结构化表格数据知识抽取

KGB能够自适应解读并抽取结构化表格数据,实现知识的快速生成。

3、对非结构化文档知识抽取

KGB知识规则引擎,能够快速定位非结构化文档中的关键信息(主体、时间、金额等),进行高效抽取知识。

 

NLPIR大数据语义智能分析平台 ,是基于中文数据挖掘的综合需求, 融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。

 


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31386431/viewspace-2656891/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2016-08-19

  • 博文量
    20
  • 访问量
    6617