在企业协作过程中,往往能产生大量的信息和文档。在项目管理过程中产生的,例如调研报告、实施方案,验收标准等;有企业培训中陆续产生的,例如新成员培训文档;有职业技能提升的,例如销售部成员的销售技巧提升方法文档等;有行业认知类的文档,例如行业分析报告,友商产品评估报告等;有公司举办线下活动的方案;有市场部出品的,例如PR稿;有ceo或高管参加行业大会的演讲稿等。
对这些知识进行提取和整理的效率直接影响企业的生产协同效率,这些文档中包含了大量文本数据,也包含了一写图片,截图形式的内容,对这些内容的整理成为了自动化文档解析中的难题,KGB知识图谱在实现文档解析功能时,其OCR技术在分析图片的优势解决了自动化文档解析中的局限性。
OCR文字识别最为人熟知的应用是在身份证识别的功能,民航与铁路买票都是需要对居民身份信息进行验证的,而手动输入身份证信息太慢且容易出错,所以总是耽误时间。当遇到票源紧张的时候,这些时间耽误可能导致买不到票。
OCR文字识别技术则解决了这个问题。身份证识别SDK利用OCR识别技术,可以自动淡化底纹,二值化处理,自动分析身份证的文字、数字信息,从身份证图片中提取性别、籍贯、出生年月、身份证号等各栏目信息。
kGB知识图谱中的OCR文字识别技术主要是图片转文字作用,除了可以处理身份证信息,做身份证识别工具,还可以处理名片上的信息,做名片识别的工具,还有营业执照识别、证件识别、银行卡识别、护照识别、文本识别等功能,能够识别多种语言。KGB知识图谱能够解析多种格式与版本文档:TXT、DOC、EXCEL、PPT、PDF、XML等。对于图片信息,OCR可自动识别并抽取图片中的文字信息。高效易用、识别率高、支持批量操作、安全可靠的图片转文字软件。
KGB知识图谱在实际的文档处理中具有以下特色:
1、跨领域可扩展:知识图谱加工厂具有通用的图谱构建引擎。知识抽取、知识关联与质量核查过程不依赖特定业务知识,结合用户知识图谱构建的需求,可以快速构建用户领域知识图谱。
2、知识质量智能核查:知识图谱加工厂实现对多种知识错误与冲突的智能核查与校验,并对知识库进行实时自动更新,保证知识图谱准确性。
3、人机结合的服务:知识图谱加工场人机构成:90%机器+10%的人工,只需要提供语料,就可以快速得到对应的知识图谱构建成果。