回应模式 - No.64287737


No.64287737 - 技术宅


无标题无名氏No.64287737 只看PO

2024-11-04(一)18:21:27 ID:skx2EDK 回应

肥哥们,小肥我现在有一个图像识别的问题。
(;´Д`)
现在是有大量的“纸质签到表”,包括但不限于日常签到和会议签到。表格前几列是打印出来的签到人的信息(包括职位、姓名等),最后一列是手写签名处。

现在的问题就是:识别谁签到了谁没签到。

小肥我是这样想的:先识别表格线,然后识别被格线分割的区域内有没有其他文字或黑色笔画,最后尝试识别打印文字

希望肥哥们帮忙:1、识别流程有没有需要改进的地方; 2、有没有现成的开源的识别打印表格的模型(小肥我之前用过opencv和YOLO)和数据集推荐; 3、其他肥哥们觉得有问题的或者需要我补充的地方

谢谢各位肥哥・゚( ノд`゚)献上祭品

无标题无名氏No.64287746

2024-11-04(一)18:22:12 ID: skx2EDK (PO主)

jp

无标题无名氏No.64287761

2024-11-04(一)18:24:06 ID: skx2EDK (PO主)

jp

无标题无名氏No.64287822

2024-11-04(一)18:32:05 ID: vNX73Vi

科大讯飞和百度有现成的表格识别api,每个月1000次的免费识别次数,可以试试看

无标题无名氏No.64287875

2024-11-04(一)18:39:42 ID: vNX73Vi

链接https://www.xfyun.cn/services/document_reduction
可以看看能不能行。

无标题无名氏No.64295046

2024-11-05(二)14:33:45 ID: skx2EDK (PO主)

>>No.64287875
谢谢肥哥,但是我最终的目的其实是识别谁签到了谁没有,所以最好是能本地解决

签到表大概长这样

无标题无名氏No.64295057

2024-11-05(二)14:35:32 ID: skx2EDK (PO主)

jp

无标题无名氏No.64295065

2024-11-05(二)14:36:39 ID: skx2EDK (PO主)

jp

无标题无名氏No.64296028

2024-11-05(二)16:27:08 ID: Gs2SdhS

如果你有显卡,可以考虑用layoutlm之类的vit模型(可能有点overkill)
没有的话好像opencv也有这个功能,github也有很多开源项目

无标题无名氏No.64296051

2024-11-05(二)16:30:11 ID: DVX7SNo

在打印机自带的扫描仪上把内容输出成PDF或者图片应该能方便很多