首页
增强阅读效果用于手写文档图像增强的改进生成对抗网络
返回

增强阅读效果用于手写文档图像增强的改进生成对抗网络

2022-12-19 科技信息 By:佚名
最佳答案用于手写文本识别的文档通常会受到降级的影响。例如,历史文档可能会受到损坏的文本、灰尘或皱纹的影响。不正确的扫描过程或水印和图章也可能导致问题。经典的图像恢复技术试图扭转退化效应。但是,模型可能会在清理图像时使文本质量变差。因此,一组科学家提出了一种深度学习模型,该模型不仅可以...

用于手写文本识别的文档通常会受到降级的影响。例如,历史文档可能会受到损坏的文本、灰尘或皱纹的影响。不正确的扫描过程或水印和图章也可能导致问题。经典的图像恢复技术试图扭转退化效应。但是,模型可能会在清理图像时使文本质量变差。

因此,一组科学家提出了一种深度学习模型,该模型不仅可以从手写图像中学习其参数,还可以从相关文本中学习其参数。它基于生成对抗网络 (GAN),并具有评估恢复图像可读性的识别器。对退化的阿拉伯语和拉丁语文档进行的实验证明了所提出模型的有效性。还表明,从退化域到干净版本逐步训练识别器可以提高识别性能。

由于多种原因,手写文档图像可能会受到严重退化的影响:纸张老化、日常生活场景(皱纹、灰尘等)、扫描过程不良等。这些工件给当前的手写文本识别 (HTR) 算法带来了许多可读性问题,并严重降低了它们的效率。在本文中,我们提出了一种基于生成对抗网络 (GAN) 的端到端架构,以将退化的文档恢复为干净可读的形式。与最知名的文档二值化方法试图提高退化文档的视觉质量不同,所提出的架构集成了一个手写文本识别器,可以提高生成的文档图像的可读性。据我们所知,这是在二值化手写文档时使用文本信息的第一项工作。对退化的阿拉伯语和拉丁语手写文档进行的大量实验证明了将识别器集成到 GAN 架构中的有用性,这提高了退化文档图像的视觉质量和可读性。此外,我们在 H-DIBCO 2018 挑战赛中的表现优于现有技术,在此任务中,我们使用合成降级的拉丁手写图像对我们的预训练模型进行了微调。

猜你喜欢
反正他都不难受他只要自由动画版(反正他都不难受他只要自由)

反正他都不难受他只要自由动画版(反正他都不难受他只要自由)

12-18 0 阅读
邯钢建设项目招标公告(邯钢附企电子招标平台)

邯钢建设项目招标公告(邯钢附企电子招标平台)

12-18 0 阅读
对闺蜜说八个字暖心话搞笑(对闺蜜说八个字暖心话)

对闺蜜说八个字暖心话搞笑(对闺蜜说八个字暖心话)

12-18 0 阅读
海信电视解除待机状态图解(海信电视解除待机状态)

海信电视解除待机状态图解(海信电视解除待机状态)

12-18 0 阅读
godiva中国(关于godiva中国的介绍)

godiva中国(关于godiva中国的介绍)

12-18 0 阅读
如何查看穿越火线cf点消费记录(穿越火线cf点消费记录)

如何查看穿越火线cf点消费记录(穿越火线cf点消费记录)

12-18 0 阅读
热门推荐
反正他都不难受他只要自由动画版(反正他都不难受他只要自由)

反正他都不难受他只要自由动画版(反正他都不难受他只要自由)

12-18 0 阅读
邯钢建设项目招标公告(邯钢附企电子招标平台)

邯钢建设项目招标公告(邯钢附企电子招标平台)

12-18 0 阅读
对闺蜜说八个字暖心话搞笑(对闺蜜说八个字暖心话)

对闺蜜说八个字暖心话搞笑(对闺蜜说八个字暖心话)

12-18 0 阅读
海信电视解除待机状态图解(海信电视解除待机状态)

海信电视解除待机状态图解(海信电视解除待机状态)

12-18 0 阅读
godiva中国(关于godiva中国的介绍)

godiva中国(关于godiva中国的介绍)

12-18 0 阅读
如何查看穿越火线cf点消费记录(穿越火线cf点消费记录)

如何查看穿越火线cf点消费记录(穿越火线cf点消费记录)

12-18 0 阅读
林申老婆杨雨辰跟杨洋(林申老婆)

林申老婆杨雨辰跟杨洋(林申老婆)

02-06 0 阅读
容易腹泻是什么原因导致的(经常腹泻是什么原因造成的)

容易腹泻是什么原因导致的(经常腹泻是什么原因造成的)

12-19 0 阅读
英语配音长视频(英语配音视频短片)

英语配音长视频(英语配音视频短片)

12-18 0 阅读
鱼笼放什么诱饵最好钓鱼(鱼笼放什么诱饵最好)

鱼笼放什么诱饵最好钓鱼(鱼笼放什么诱饵最好)

12-18 0 阅读