Изображение на вход
На выходе должно получится так
Как это реализовать?Какие библиотеки стоит для этого использовать на c# ?
Для решения даной задачи можно использовать Tesseract .NET wrapper. Он имеет более дружелюбный синтаксис, чем оригинальный Tesseract :
using (var engine = new TesseractEngine(pathToLangFolder, "eng", EngineMode.Default))
{
// have to load Pix via a bitmap since Pix doesn't support loading a stream.
using (var image = new Bitmap(fileName))
{
using (var pix = PixConverter.ToPix(image))
{
using (var page = engine.Process(pix))
{
Console.WriteLine(page.GetMeanConfidence() + " : " + page.GetText());
}
}
}
}
Если на всех картинках на входе числа находятся в одном и том же болке, советую обрезать числа именно до размеров этого блока что бы тесеракт не обрабатывал лишнюю инфу. Потом просто через REGEX оставляешь только числа.
Как развивать веб-проекты в 2026 году: технологии, контент E-E-A-T и факторы доверия
Современные инструменты для криптотрейдинга: как технологии помогают принимать решения
Апостиль в Лос-Анджелесе без лишних нервов и бумажной волокиты
Основные этапы разработки сайта для стоматологической клиники