Как спарсить текст с картинки? [требует правки]

298
18 октября 2017, 04:58

Есть 1000 картинок 2-х типов: 1) с чёрным текстом и белым фоном 2) инверсия первой(с белым текстом и чёрным фоном)

Какой алгоритм использовать для парса текста в .txt файл?

Answer 1
  1. Логично привести все картинки к одному виду, например все картинки с черным фоном инвертировать и работать только с одним видом картинок, чтобы определить фон можно использовать, например java.awt.image.BufferedImage, где методом getRGB можно получить цвет точки, а с помощью setRGB поменять цвет.

  2. После того как все картинки стали одного формата, задача превращается в классическую задачу распознавания текста. Рекомендую не пытаться написать велосипед, а просто найти и использовать какую-нибудь библиотеку для распознавния текста (можно даже подключить библиотеку на С/С++ и т.п., если особенно не важна кросплатформеность или вообще вызывать любой исполняемый файл программы распознавния текста, передав ему аргументами картинку). Если все-таки хочется руками, то берем что-то вроде java.awt.image.BufferedImage и получая цвет точек методом getRGB пытаемся написать алгоритм (их море, см OCR и алгоритмы распознавния текста), можно даже машинное обучение использовать.

Answer 2

Быть может есть смысл воспользоваться программами распознавания текста? Например тот же файнридер. Сшить эти картинки в один файл изображения (например, в фотошопе) и разом распознать. Сшить тысячу картинок в одну также возможно в автоматическом режиме.

READ ALSO
Java класс для простой работы с датой и временем

Java класс для простой работы с датой и временем

Сейчас в проекте есть класс Date, где хранится day, month и yearТакже есть класс Time в котором hour и minute

222
Организация архитектуры wildcard - интерфейсов

Организация архитектуры wildcard - интерфейсов

Есть интерфейсы (много) такого типа

190
Как вывести текущий объект массива в цикле

Как вывести текущий объект массива в цикле

На входе получаем имя департамента, а на выходе должны быть имена всех рабочих из этого отделаНе могу разобраться с написанием цикла который...

294
Как реализовать класс Date и Calendar [требует правки]

Как реализовать класс Date и Calendar [требует правки]

Определить класс Data и класс Calendar на определённый месяц, использующий объект Data в качестве поляОбъявить массив объектов Calendar на год

210