Как вывести найденные контуры в OpenCV?

Алёна · 16.06.2020

Доброго времени суток читающим, хочу написать распознавалку текста на python при помощи OpenCV, контуры нахожу с помощью canny, после чего стоит задача извлечения каждого символа в отдельное изображение 28x28 (для удобной работы с MNIST); Я рисую прямоугольник вокруг каждого элемета, а затем складирую все буквы в список letters, но, тем не менее, проверяя результат и выводя какие-либо символы, получаю либо пустое окно, либо окно с точкой, либо окно со стрелочкой из нижнего левого угла изображения, но буквы вывести не получается;(
Очень прошу помочь!

renat baidukov · 18.06.2020

Я много раз делал распознавание captcha логика всегда была одинаковая - создаешь базу символов для каждого шрифта который планируешь распознавать. Затем выделяешь строку, строку делишь на символы. Потом перебираеш для кождого квадратика символы из базы для скорости фильтуешь по размеру высоте\ширине. Но я все время делал без OpenCV - банально работаешь с BMP. Любую картинку очищаешь от мусора, превращаешь в чернобелую и потом уже обрабатываешь. Там все сводиться к работе с двумерными массивами. Процес распознавания, с точки зрения логики, сводиться к движению шаблона по выделенной области - квадратику обрамляющему букву. Твой текст прочитать как два пальца об асфальт, по сравнению с капчей.

Алёна · 18.06.2020

renat baidukov сказал(а):
Я много раз делал распознавание captcha логика всегда была одинаковая - создаешь базу символов для каждого шрифта который планируешь распознавать. Затем выделяешь строку, строку делишь на символы. Потом перебираеш для кождого квадратика символы из базы для скорости фильтуешь по размеру высоте\ширине. Но я все время делал без OpenCV - банально работаешь с BMP. Любую картинку очищаешь от мусора, превращаешь в чернобелую и потом уже обрабатываешь. Там все сводиться к работе с двумерными массивами. Процес распознавания, с точки зрения логики, сводиться к движению шаблона по выделенной области - квадратику обрамляющему букву. Твой текст прочитать как два пальца об асфальт, по сравнению с капчей.

Да, но я хочу сделать это с помощью OpenCV, поэтому хочу подробнее понять метод с сохранением каждой буквы, обрамленной в прямоугольник с помощью cv2.boundingrect
Вот и прошу подсказать, как сохранить каждую букву в форме ч/б изображения 28x28

renat baidukov · 18.06.2020

OpenCV хорошо документирован и там полно примеров. Прошло 2 дня и ты не разобрался, вероятно хочешь чтобы кто-то подсуетися за тебя. Попробуй поставить автарку в купальнике - может это поможет

Алёна · 18.06.2020

renat baidukov сказал(а):
OpenCV хорошо документирован и там полно примеров. Прошло 2 дня и ты не разобрался, вероятно хочешь чтобы кто-то подсуетися за тебя. Попробуй поставить автарку в купальнике - может это поможет

Вы о чем?

renat baidukov сказал(а):
OpenCV хорошо документирован и там полно примеров. Прошло 2 дня и ты не разобрался, вероятно хочешь чтобы кто-то подсуетися за тебя. Попробуй поставить автарку в купальнике - может это поможет

И я документацию читала, разобралась с выделением буквы, контурированием объектов, доки про сохранение контуров не нашла

dim222 · 20.06.2020

Алёна сказал(а):
И я документацию читала, разобралась с выделением буквы, контурированием объектов, доки про сохранение контуров не нашла

Здесь посмотри

Алёна · 20.06.2020

dim222 сказал(а):
Здесь посмотри

Я так уже пробовала, там ошибка есть
Контуры надо не с 0 сравнивать, а с -1
Но в любом случае хотелось бы еще вопрос задать: Как я могу находить объекты на фото по разнице цветов между соседними пикселями?
То есть если мне нужно найти объект одного цвета на фоне другого цвета, с помощью какой функции я могу обнаружить этот объект, если на фоне он сильно выделяется?

dim222 сказал(а):
Здесь посмотри

И кстати "w" выводится как "v" и "v", как это можно исправить?

moonz · 21.06.2020

Алёна сказал(а):
Как я могу находить объекты на фото по разнице цветов между соседними пикселями?
То есть если мне нужно найти объект одного цвета на фоне другого цвета, с помощью какой функции я могу обнаружить этот объект, если на фоне он сильно выделяется?

Тебе нужна простая сегментация с помощью цветовых пространств, по этому поводу нашел вот такую

Ссылка скрыта от гостей

Если умеешь на английском читать то вот супер

Ссылка скрыта от гостей

И собственно пример из

Ссылка скрыта от гостей

Petro Goninec · 21.06.2020

Алёна сказал(а):
И кстати "w" выводится как "v" и "v", как это можно исправить?

Я бы заметил, что это не просто "кстати" это один очень сщественных моментов. Особенно если текст скаанираванный или много мусора. могут быть проблемы с 3-8, 5-6, 9-0 и еще дофига всего. В распознавании используется вероявносная логика а не формальная. Оценивается количество точек фона и точек фигуры в шаблоне и объекте распознавания. Я добавлял еще прозрачные токчи - которые игнорируются.

Если вы - ЧЕЛОВЕК - ищете то, что можно тупо передрать, то шансов у вас мало. Нужно, придерживаться какой-то одно концепции распознавания. Придумать свою и эксперементировать или передрать полностью чужую. Кусок своей кусок чужой - толку не будет.

Алёна · 21.06.2020

moonz сказал(а):
Тебе нужна простая сегментация с помощью цветовых пространств, по этому поводу нашел вот такую
Ссылка скрыта от гостей

Если умеешь на английском читать то вот супер
Ссылка скрыта от гостей

И собственно пример из
Ссылка скрыта от гостей

Спасибо, но с первой статьей я знакома, она не подходит, т.к. нужен код, которому заранее не известны цвета, который самостоятельно определяет границы (canny, например), вторая и третья статья не совсем понимаю, как должны помочь
Мне нужно складировать все найденные объекты (символы) в одну переменную (допустим список), затем их вывести именно в том порядке, в котором они встречаются на картинке
И также не очень понятно, как решить проблему с выделением "w" в три прямоугольника

Petro Goninec сказал(а):
Я бы заметил, что это не просто "кстати" это один очень сщественных моментов. Особенно если текст скаанираванный или много мусора. могут быть проблемы с 3-8, 5-6, 9-0 и еще дофига всего. В распознавании используется вероявносная логика а не формальная. Оценивается количество точек фона и точек фигуры в шаблоне и объекте распознавания. Я добавлял еще прозрачные токчи - которые игнорируются.

Если вы - ЧЕЛОВЕК - ищете то, что можно тупо передрать, то шансов у вас мало. Нужно, придерживаться какой-то одно концепции распознавания. Придумать свою и эксперементировать или передрать полностью чужую. Кусок своей кусок чужой - толку не будет.

У меня есть конкретная задача: выделить каждый символ в один отдельный прямоугольник, и я не понимаю, почему целостная буква выделяется аж в три фигуры, поэтому и прошу помощи, как это можно устранить, как сделать так, чтобы алгоритм canny целостные фигуры выделял в один прямоугольник
Или хотя бы понять, почему дабл ю выделяется как несколько разных символов

Petro Goninec · 21.06.2020

Алёна сказал(а):
Или хотя бы понять, почему дабл ю выделяется как несколько разных символов

Скорее всего, в процессе распознавания к объекту распознавания применяются шаблоны которые меньше чем объект по размеру. Это же очевидно. Если ты не можешь управлять процессом распознавания подготавливай объекты так чтобы не было глюков. Почитй на каких принциах там работае распознаване. Это так сказать философия, реально я в вниткать в твой проблемы не хочу.

Все сервисы Codeby

Поиск

Поиск

Как вывести найденные контуры в OpenCV?

Алёна

Well-known member

Вложения

renat baidukov

Алёна

Well-known member

renat baidukov

Алёна

Well-known member

dim222

New member

Алёна

Well-known member

moonz

Petro Goninec

Заблокирован

Алёна

Well-known member

Petro Goninec

Заблокирован

Похожие темы