[PaddlePaddle/PaddleOCR]pplabel表格标注问题

2024-05-14 771 views
6

表格标注的表格识别后,为何检测框显示的是ocr检测的检测框结果而不是表格结构识别后合并后的检测框的结果,这样每次表格识别后无论表格识别是否正确,都需要人工将检测框进行合并修改,调整顺序。

回答

6

可以展示一下具体的效果吗

7

2023-02-10 16-13-32屏幕截图 用表格标注按钮识别出来是这样的,正确的标注我觉得应该是这样的 2023-02-10 16-11-38屏幕截图 这个我看了下代码,表格识别后是将ocr单行检测框显示在上面,感觉这个逻辑有问题,应该结合结构识别后的结果将检测框合并后显示在上面,不知道是不是这样。

7

其他图片中同一单元格多行的标注都存在这种情况吗,如果不是可以尝试手动调试标注框

2

这个表格识别的逻辑就是显示的单行检测框,每次碰到有合并的肯定都需要手动合并的,我不确定是不是标注时候需要这么合并检测框,如果确定需要的话,这个改下代码是可以优化的。

7

可以再详细看下这个文档,调用的表格识别模型,不是检测模型,再多测试几张图片。

2

那我确定是标注工具问题了。。 e71a384092564b6d0ebf55e64d7f2d7 pplabel代码里表格显示框显示的就是单行检测框

3

开源版本听说不支持多行检测,只支持单行检测。这样子多行文本需要人工调整检测框的工作量也巨大。

8

开源版本听说不支持多行检测,只支持单行检测。这样子多行文本需要人工调整检测框的工作量也巨大。 那这多行的怎么处理啊

那我确定是标注工具问题了。。 e71a384092564b6d0ebf55e64d7f2d7 pplabel代码里表格显示框显示的就是单行检测框

老哥你这个解决了嘛 ,我现在也遇到和你一样的问题,合并的单元格出来的gt文件里面都在一个td里面

7

那现在是不支持多行文本检测识别?我也有同样的问题