Распознавание текста и цифр с кассового чека

  • Автор темы John-S
  • Дата начала
Статус
Закрыто для дальнейших ответов.
J

John-S

Описаие проблеммы
Сидит симпотичная девушка на работе и парится часами разбирая гору кассовых чеков.
Каждый чек надо сравнить с базой данны (есть он уже в базе или нет)
и отсортировать в нужную папку. :)

Глянул я на неё и жалко стало!!!!

Может поможем несчастной!!!!!


Описание решения
1 Снимаем изображени чека с камеры (по клику или каждую секунду)
2 Распознаем текст (текст сравниваем с базой что бы указать в какую папку надо этот чек поместить
К примеру это чек за бензин эначит комп кажет папка нермер 2 )
3 Распознаем цыфры
4 дату и сумму чека и номер папки записываем в базу данных

У кого может какие идеи есть по этому поводу или кто может помоч прогу накатать
я сам когдато программировал в delphi но это было 7 лет назад
может кто поможет накидать прогу примерно

я и та несчастная заранее благодарны!!!! :(
 
S

SNike

Накидаешь ты прогу, заработает она. Но есть такие каверзные чеки, у которых, к примеру, слишшшком тускло выбиты буквы-цифры. Вот ошибется твой сканер при распознавании, а потом при проверке, скажем, КРУ, это выявится. Нехорошо получится.
Так что нужна система анализа...

Или вот текст по которому определяется его принадлежность, будет у разных чеков в разных местах... Тоже нужно предусмотреть.

Ситуации много. Простой программкой тут не отделаешься.
ИМХО, вряд ли кто возьмётся за такой проект задаром. А если хочешь конкретного ответа - задавай конкретный вопрос :(
 
J

John-S

конкретный вопрос :)

Как лучше перевести графическое изображение в текст?

(более или менее упорядоченный набор букв и цифр,
чтоб потом этот набор символов анализировать можно было)
 
Z

zubr

А не проще ли в базу данных помещать данные по чекам на стадии вывода чека?
 
S

SNike

<!--QuoteBegin-John-S+14:06:2007, 20:03 -->
<span class="vbquote">(John-S @ 14:06:2007, 20:03 )</span><!--QuoteEBegin-->Как лучше перевести графическое изображение в текст?

[snapback]69442" rel="nofollow" target="_blank[/snapback]​
[/quote]

Возможно, стоит посмотреть на COM-интерфейсы Fine Reader

Идеальный вариант - тот что предложил zubr
 
B

Barmutik

Простой перевод графического изображения в текст с большой процентной вероятностью будет содержать ошибки... а для Вашего приложения это не допустимо...
 
J

John-S

А не проще ли в базу данных помещать данные по чекам на стадии вывода чека?

Невозможно т.к. чеки с разных организаций уже в распечатанном виде поступают.

большой процентной вероятностью будет содержать ошибки

я думаю так сделать
на чеке всегда есть итоговая сумма с НДС и промежуточные они обычно без НДС
т.е. Распознанные цифры надо будет сравнивать математически чтоб все сходилось
сумма = артикль + НДС только тогда зелёный цвет т.е. всё ОК



Fine Reader думаю непоможет
ввод через сканер отпадает очень долго проще тогда по старинке вручную делать

надо чтоб ввод в реальном времени происходил или по нажатию но очень бысторо через камеру (twain драйвер)
 
S

SNike

Для распознавания текста нужно чтобы камера могла передавать изображение соответствующего качества. Fine Reader-ом на мой взгляд пренебрегать не стоит. Раз он умеет преобразовывать изображение в текст - значит есть предназначенные для этого модули, а у них в свою очередь может быть интерфейс которым можно воспользоваться. В противном случае придется самим реализовывать алгоритм распознавания текста
 
B

Barmutik

Для: John-S

Задумка интересная .. ну так обозначайте ТЗ, бюджет и искать толкового програмиста...

Только я думаю что если толковый за это возьмётся(что вообще под вопросом) то стоить это будет очень не мало....
 
S

SNike

100% что даром никто этого делать не станет. Бесплатно - только на уровне советов, почему - думаю объяснять не стоит :)
Т.е. - либо предложенное выше, либо самостоятельная разработка этого ПО
 
C

Coldfate

Если Вам нужна простенькая программка, можете поступить следующим образом: не заморачиваться на нейронных сетях и прочих ухищрениях (скорее всего заколебаетесь, особенно если новичок, по себе знаю), а загоните в массив образцы цифр и символов и ищите их в определенном месте чека. Как найдете первый, значит, все остальные справа. :blink: . Правда, если искомое в разных местах, то это усложняет задачу. Да и вдруг что-нибудь не пропечатается... Способ идиотский, сам знаю.

А если хотите снизить вероятность ошибки, проверьте чек раз 10, но где-нибудь в окрестности номера. Короче, чтобы был случайный элемент.

Или, если такой тупой способ Вам не нравится, зайдите на algolist.manual.ru. Там есть материал по нейронным сетям. Можете написать простую сеть (выйдет строк в 50) а так как размеры символов фиксированы, то получится даже легче чем с массивом. Я даже писал подобное когда-то если найду скину. Там просто распознавание отдельных символов, не текста. Если правильно подобрать параметры, то система распознает символ даже если отрезать у него кусок. :D
Тут, кстати, хорошо работает фишка - "семь раз проверь, семь раз ошибись". :(
 
G

GRLEX

Простенькую прожку явно не получицца сделать )) - это точно, поскольку я сам занимаюсь разработкой системы видеонаблюдения и распознования. Писать такую прогу явно не один месяц, тем более самому.
С ребятами согласен - 100% даром никто делать не будет.
Для John-S: почему выбрал именно DELPHI?
Я б посоветовал тебе попробовать сделать это на Матлабе ( 10ом к примеру). В универе когдато делали курс лабораторок по распознаванию - очень удобно. Тем более там уже куча библиотек и методов, заточенных под это.

Для John-S: И кстати само распознование - сделать можно в матлабе, а потом на делфи дописать работу с базой. Так будет удобнее
 
Статус
Закрыто для дальнейших ответов.
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!