提问者:小点点

使用OCR以键值格式从护照图像中提取数据


我的目标是使用基于OCR服务器的解决方案,以键值格式从护照图像中提取数据,以便数据保留在本地。我尝试了Azure表单识别器容器(认知服务表单识别器API V1预览版)。但结果并不令人满意,因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,也参考了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但没用

你能指导我如何以要求的格式提取数据吗?

或者是否有人知道其他任何在服务器上的产品、库或解决方案在商业上或开源上,甚至是在商业上。Net,它最好能在以下方面提供帮助:;

非常感谢您的帮助,谢谢


共1个答案

匿名用户

你可以考虑这一点:

  1. 收集足够的护照样本数据,比如30张图片,代表你要处理的文件。
  2. 决定要提取哪个字段,使用表单识别器的标记工具来标记

-新(MS表格识别小组)