Есть 1000 картинок 2-х типов: 1) с чёрным текстом и белым фоном 2) инверсия первой(с белым текстом и чёрным фоном)
Какой алгоритм использовать для парса текста в .txt файл?
Логично привести все картинки к одному виду, например все картинки с черным фоном инвертировать и работать только с одним видом картинок, чтобы определить фон можно использовать, например java.awt.image.BufferedImage
, где методом getRGB
можно получить цвет точки, а с помощью setRGB
поменять цвет.
После того как все картинки стали одного формата, задача превращается в классическую задачу распознавания текста. Рекомендую не пытаться написать велосипед, а просто найти и использовать какую-нибудь библиотеку для распознавния текста (можно даже подключить библиотеку на С/С++ и т.п., если особенно не важна кросплатформеность или вообще вызывать любой исполняемый файл программы распознавния текста, передав ему аргументами картинку).
Если все-таки хочется руками, то берем что-то вроде java.awt.image.BufferedImage
и получая цвет точек методом getRGB
пытаемся написать алгоритм (их море, см OCR и алгоритмы распознавния текста), можно даже машинное обучение использовать.
Быть может есть смысл воспользоваться программами распознавания текста? Например тот же файнридер. Сшить эти картинки в один файл изображения (например, в фотошопе) и разом распознать. Сшить тысячу картинок в одну также возможно в автоматическом режиме.
Кофе для программистов: как напиток влияет на продуктивность кодеров?
Рекламные вывески: как привлечь внимание и увеличить продажи
Стратегії та тренди в SMM - Технології, що формують майбутнє сьогодні
Выделенный сервер, что это, для чего нужен и какие характеристики важны?
Современные решения для бизнеса: как облачные и виртуальные технологии меняют рынок
Сейчас в проекте есть класс Date, где хранится day, month и yearТакже есть класс Time в котором hour и minute
На входе получаем имя департамента, а на выходе должны быть имена всех рабочих из этого отделаНе могу разобраться с написанием цикла который...
Определить класс Data и класс Calendar на определённый месяц, использующий объект Data в качестве поляОбъявить массив объектов Calendar на год