写作绅士,读作丧尸 X岛揭示板
 首页版规 |用户系统 |移动客户端下载 | 丧尸路标 | | 常用图串及路标 | 请关注 公众号:【矛盾苇草】| 人,是会思考的芦苇
常用串:·豆知识·跑团板聊天室·公告汇总串·X岛路标

No.64287737 - 无标题 - 技术宅


回应模式
No.64287737
名 称
E-mail
标题
颜文字
正文
附加图片
•程序语言、压制投稿、视频制作以及各计算机领域的技术问题
•我觉得还是CSDN靠谱一点
•本版发文间隔为15秒。

收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-04(一)18:21:27 ID:skx2EDK [举报] [订阅] [只看PO] No.64287737 [回应] 管理
肥哥们,小肥我现在有一个图像识别的问题。
(;´Д`)
现在是有大量的“纸质签到表”,包括但不限于日常签到和会议签到。表格前几列是打印出来的签到人的信息(包括职位、姓名等),最后一列是手写签名处。

现在的问题就是:识别谁签到了谁没签到。

小肥我是这样想的:先识别表格线,然后识别被格线分割的区域内有没有其他文字或黑色笔画,最后尝试识别打印文字

希望肥哥们帮忙:1、识别流程有没有需要改进的地方; 2、有没有现成的开源的识别打印表格的模型(小肥我之前用过opencv和YOLO)和数据集推荐; 3、其他肥哥们觉得有问题的或者需要我补充的地方

谢谢各位肥哥・゚( ノд`゚)献上祭品
Tips 无名氏 2099-01-01 00:00:01 ID:Tips超级公民 [举报] No.9999999 管理
就是说啊
v v v
( ゚∀。)∀。)∀。)
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-04(一)18:22:12 ID:skx2EDK (PO主) [举报] No.64287746 管理
jp
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-04(一)18:24:06 ID:skx2EDK (PO主) [举报] No.64287761 管理
jp
无标题 无名氏 2024-11-04(一)18:32:05 ID:vNX73Vi [举报] No.64287822 管理
科大讯飞和百度有现成的表格识别api,每个月1000次的免费识别次数,可以试试看
无标题 无名氏 2024-11-04(一)18:39:42 ID:vNX73Vi [举报] No.64287875 管理
链接https://www.xfyun.cn/services/document_reduction
可以看看能不能行。
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-05(二)14:33:45 ID:skx2EDK (PO主) [举报] No.64295046 管理
>>No.64287875
谢谢肥哥,但是我最终的目的其实是识别谁签到了谁没有,所以最好是能本地解决

签到表大概长这样
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-05(二)14:35:32 ID:skx2EDK (PO主) [举报] No.64295057 管理
jp
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-05(二)14:36:39 ID:skx2EDK (PO主) [举报] No.64295065 管理
jp
无标题 无名氏 2024-11-05(二)16:27:08 ID:Gs2SdhS [举报] No.64296028 管理
如果你有显卡,可以考虑用layoutlm之类的vit模型(可能有点overkill)
没有的话好像opencv也有这个功能,github也有很多开源项目
无标题 无名氏 2024-11-05(二)16:30:11 ID:DVX7SNo [举报] No.64296051 管理
在打印机自带的扫描仪上把内容输出成PDF或者图片应该能方便很多
无标题 无名氏 2024-11-05(二)16:31:53 ID:DVX7SNo [举报] No.64296063 管理
>>No.64296051
微信自带文字识别,把图片发到微信上点开选择文字就好
无标题 无名氏 2024-11-07(四)15:12:23 ID:WLKEh8X [举报] No.64316832 管理
直接上百度的paddle OCR,权重开放可以本地推理效果好

UP主: