Ocr

  • Автор темы D!m@n
  • Дата начала
D

D!m@n

Добрый день, уважаемые участники!

Скажите, пожалуйста, есть ли бесплатная библиотечка OCR для .NET (или, в крайнем случае, COM)?
Распознавание русского языка не требуется (пока нужно распознавать только цифры).
В поиске был :D

Заранее большое спасибо!
 
D

D!m@n

Под девизом "спасение утопающих - дело рук самих утопающих" откопал, что Microsoft Document Imaging, входящий в состав MS Office, предоставляет COM-интерфейс для распознавания текста.
И, к слову говоря, само распознавание выполняет очень даже не дурно. Конечно, не FineReader, но хотя бы что-то.

Пример использования на C#:
Код:
			OpenFileDialog dlg = new OpenFileDialog();
dlg.DefaultExt = "tif";
dlg.Filter = "TIFF|*.tif";
if (dlg.ShowDialog() == DialogResult.OK)
{
MODI.DocumentClass doc = new MODI.DocumentClass();
doc.Create(dlg.FileName);

doc.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);

MODI.Image modiImg = (MODI.Image)doc.Images[0];
MODI.Layout layout = modiImg.Layout;

doc.Close(false);

string sRecognized = layout.Text;
MessageBox.Show(sRecognized);
}

Предварительно к проекту необходимо подключить библиотеку mdivwctl.dll.
Надеюсь, кому-то пригодится...
 
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!