No.64287737 - X岛揭示板

回应模式 - No.64287737

No.64287737 - 技术宅

2024-11-04(一)18:21:27 ID:skx2EDK 回应

肥哥们，小肥我现在有一个图像识别的问题。
(;´Д`)
现在是有大量的“纸质签到表”，包括但不限于日常签到和会议签到。表格前几列是打印出来的签到人的信息（包括职位、姓名等），最后一列是手写签名处。

现在的问题就是：识别谁签到了谁没签到。

小肥我是这样想的：先识别表格线，然后识别被格线分割的区域内有没有其他文字或黑色笔画，最后尝试识别打印文字

希望肥哥们帮忙：1、识别流程有没有需要改进的地方; 2、有没有现成的开源的识别打印表格的模型（小肥我之前用过opencv和YOLO）和数据集推荐; 3、其他肥哥们觉得有问题的或者需要我补充的地方

谢谢各位肥哥･ﾟ( ﾉд`ﾟ)献上祭品

Tips无名氏No.9999999

2099-01-01 00:00:01 ID: Tips

(`ε´ )下面呢

无标题无名氏No.64287746

2024-11-04(一)18:22:12 ID: skx2EDK (PO主)

无标题无名氏No.64287761

2024-11-04(一)18:24:06 ID: skx2EDK (PO主)

无标题无名氏No.64287822

2024-11-04(一)18:32:05 ID: vNX73Vi

科大讯飞和百度有现成的表格识别api，每个月1000次的免费识别次数，可以试试看

无标题无名氏No.64287875

2024-11-04(一)18:39:42 ID: vNX73Vi

链接https://www.xfyun.cn/services/document_reduction
可以看看能不能行。

无标题无名氏No.64295046

2024-11-05(二)14:33:45 ID: skx2EDK (PO主)

>>No.64287875
谢谢肥哥，但是我最终的目的其实是识别谁签到了谁没有，所以最好是能本地解决

签到表大概长这样

无标题无名氏No.64295057

2024-11-05(二)14:35:32 ID: skx2EDK (PO主)

无标题无名氏No.64295065

2024-11-05(二)14:36:39 ID: skx2EDK (PO主)

无标题无名氏No.64296028

2024-11-05(二)16:27:08 ID: Gs2SdhS

如果你有显卡，可以考虑用layoutlm之类的vit模型（可能有点overkill）
没有的话好像opencv也有这个功能，github也有很多开源项目

无标题无名氏No.64296051

2024-11-05(二)16:30:11 ID: DVX7SNo

在打印机自带的扫描仪上把内容输出成PDF或者图片应该能方便很多