Browsed by
Category: 机器学习

表格的目标检测 – 利用FPN的Faster R-CNN

表格的目标检测 – 利用FPN的Faster R-CNN

做文档信息提取时,遇到表格的结构,由于它具有结构性,直接将表格中的内容识别出来是不够的,它的行列也相当于信息。需要将表格着重处理。要全面地获取这部分信息,就要识别表格的结构。第一步就是先定位表格,看整个文档图片中是否含有表格,如果有就提取出来再进行后续处理(表格结构识别,即一个表格的行列数)。 如果…

Read More Read More

ICDAR 2019 表格结构识别综述

ICDAR 2019 表格结构识别综述

表格作为一种有效的数据组织与展现方法被广泛应用,也成为各类文档中常见的页面对象。随着文档数目的爆炸性增长,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,成为了一个亟待解决的问题。ICDAR是一个专注于文档分析与识别问题的国际学术会议,已经连续多届设置了表格识别专题。在今年的ICDAR 2…

Read More Read More

[更新中] DeepDeSRT:用于表格结构识别的深度学习框架

[更新中] DeepDeSRT:用于表格结构识别的深度学习框架

表格结构识别是文档重建中比较重要的工作,表格结构如果单纯使用OCR识别其中的内容,那么其结构信息将丢失,为了正确恢复文档,需要把正确定位到表格,并且把表格的行列数都识别出来。DeepDeSRT是一种端到端的用于表格理解的模型,取得了较好的效果