无标题无名氏No.64287737 只看PO
2024-11-04(一)18:21:27 ID:skx2EDK 回应
肥哥们,小肥我现在有一个图像识别的问题。
(;´Д`)
现在是有大量的“纸质签到表”,包括但不限于日常签到和会议签到。表格前几列是打印出来的签到人的信息(包括职位、姓名等),最后一列是手写签名处。
现在的问题就是:识别谁签到了谁没签到。
小肥我是这样想的:先识别表格线,然后识别被格线分割的区域内有没有其他文字或黑色笔画,最后尝试识别打印文字
希望肥哥们帮忙:1、识别流程有没有需要改进的地方; 2、有没有现成的开源的识别打印表格的模型(小肥我之前用过opencv和YOLO)和数据集推荐; 3、其他肥哥们觉得有问题的或者需要我补充的地方
谢谢各位肥哥・゚( ノд`゚)献上祭品
无标题无名氏No.64287875
2024-11-04(一)18:39:42 ID: vNX73Vi
链接https://www.xfyun.cn/services/document_reduction
可以看看能不能行。
无标题无名氏No.64295046
2024-11-05(二)14:33:45 ID: skx2EDK (PO主)
>>No.64287875
谢谢肥哥,但是我最终的目的其实是识别谁签到了谁没有,所以最好是能本地解决
签到表大概长这样
无标题无名氏No.64296028
2024-11-05(二)16:27:08 ID: Gs2SdhS
如果你有显卡,可以考虑用layoutlm之类的vit模型(可能有点overkill)
没有的话好像opencv也有这个功能,github也有很多开源项目