Распознавание символов на картинке в 1С. #580386


#0 by mzelensky
Доброго времени суток! Заказчик выдал "хотелку", по реализации которой я не имею никакого понятия. Задача: Имеется некий pdf файл (кстати тоже сформированный из 1С), в этом файле может быть не ограниченное количество листов. На каждом листе (в определенной области) имеется штрих-код (штрих-код наш, используется чисто для внутреннего документооборота). Нужно чтобы 1С-ка автоматически распознавала этот штрих-код и в зависимости от той информации, которая в него заложена, производила определенные действия. КАК РАСПОЗНАТЬ И ОБРАБОТАТЬ ШТРИХ-КОД из PDF-ФАЙЛА?
#1 by Grusswelle
Неужели внешних компонент таких нету? ЗЫ: Сканером, с экрана! :-))
#2 by Wobland
откуда файл пришёл?
#3 by aleks-id
найти OCR которая работает через СОМ
#4 by mzelensky
ну что-то нашел...но может тут у кого личный опыт есть...чтобы дурные шишки не набивать!
#5 by mzelensky
Это наш файл (например контракт)...например ситуация: мы его сделали, отправили клиенту, тот произвел свои действия и отправил в ответ - нужно распознать и присунуть в определенную папочку!
#6 by aleks-id
во бред! пдф сделан по идее чтобы нельзя было править. что там правит клиент?
#7 by Tatitutu
самое простое и дешево в название файла в конце указать штрихкод и при поступлении обработать эту информацию.
#8 by Tatitutu
Кто тебе это сказал ? Забудь как миф
#9 by mzelensky
да, это логично и просто, но не гарантируется сохранение правильного имени файла.
#10 by mzelensky
ты всем клиентам говоришь - "это бред, так делать я не буду и вам это не надо!". Если просят, значит надо!
#11 by aleks-id
я же написал - по идее. сам прекрасно знаю что редактируется. но какой смысл тогда отправлять в ПДФ???
#12 by aleks-id
ты б задачу то обрисовал полностью - глядишь, и решение бы нашлось. почему бы не отправлять им контракт в ворде?
#13 by mzelensky
вроде есть одна обработка: но что-то больше я не вижу.
#14 by mzelensky
давай без поиска АЛЬТЕРНАТИВ. Задачу я поставил - как можно распознать штрих-код в pdg?!
#15 by Зеленый Кот
захватить скриншот экрана и распознать
#16 by Кириллка
партнеру отдается pdf'ка, в которой доступны для редактирования какие-то поля. Он эти поля заполняет и возвращает файл. Я, как создатель этого файла, не парю голову, что он кроме своих полей, исправил что-то еще.
#17 by sergey yevsenya
Реализовывали такое, если интересно стукнись в аську
#18 by Леха Дум
А что мешает подготовить такой же файл в excel? Вечно геморрой надо придумывать.
#19 by mzelensky
нужно без визуального открытия этого файла! Т.е. чтобы все действия производились в фоновом режиме без дополнительных действий со стороны пользователя.
#20 by Леха Дум
+ или попробовать хранить информацию штрихкода в метаданных документа
#21 by mzelensky
Еще один...я тебе говорю - НУЖНО ИЗ PDF, без лишних вопросов "ЗАчЕМ"!
#22 by aleks-id
конвертишь в ворд, потом ворд парсишь
#23 by aleks-id
а еще проще конвертишь в хтмл
#24 by mzelensky
это уже интересней...немного через одно место конечно....но по крайней мере рабочий механизм.
#25 by mzelensky
единственное ток, что она платная :(
#26 by aleks-id
ты напиши им, узнай почем. OCR вроде как тоже не бесплатные есличо, а модуль конвертации пдф в хтмл там отдельно продается.
#27 by rutony
В MS Office есть пакет OCR Есть еще и бесплатные в том числе. Давненько писал ботов юзал, щас даже не вспомню названия...
#28 by mzelensky
да мне бы примерчик простенький :(
#29 by VVi3ard
Тебе в правильно сказали ищи (или пиши, или заказывай фрилансеру) com компонент который будет распознавать код с картинки. Еще как вариант: Я встречал консольную утилиту которой на вход передается картинка со штрихкодами, на выходе она генерит список штрихкодов с этой картинки. Ну и соответственно не сложно найти консольную утилиту PDF-JPG к сожалению готовым решением поделится не могу т.к. потом задача снялась
#30 by Xapac
а пдф файл большой? а то мож листов 300 это ж на пол дня распознавания
#31 by VVi3ard
Вот кстати вспомнил проект на котором я брал исходники:
#32 by VVi3ard
300 листов на Core2Duo это 5-6 минут работы.
#33 by Sergeyspb13
а сразу записывать в PDF номер штрих кода или прочего текста почему не хочешь? а потом уже другими средствами смотреть этим создавать pdf есть COM ну и найти читалку PDF, которая может прочесть допустим Keywords или Subject из этого PDFa
#34 by mzelensky
может быть большой. Но по задаче распознать нужно лишь 1 штрих-код (скажем с первого листа).
#35 by mzelensky
я уже об этом думал. И действительно, так проще - тем более код (числовой) я пишу под штрих-кодом. Т.е. задача сводится к - распознать текст в определенной области и обработать его.
#36 by mzelensky
я через biopdf их и создаю :)
#37 by Xapac
что то у меня не работает(((
#38 by Sergeyspb13
запиши не на листе, а в свойствах файла ... - например в Keywords а другой прогой читай
#39 by aleks-id
#40 by mzelensky
я еще не пробовал. А что не работает?
#41 by СноваЗдорова
Надо юзать метаданные файла, имхо.
#42 by mzelensky
Вариант хороший, но ситуация: Клиент получает наш контракт (с нашим штрих-кодом). Распечатывает его, ставит свои росписи, печати, сканирует опять и отправляет нам в ответ. Нам нужно автоматом определить этот контракт...в этом случа такая ситуация не прокатит, т.к. файл pdf будет новым!
#43 by artems
это не подойет?
#44 by mzelensky
т.е. привязываться к свойствам файла не получится - нужно привязываться к СОДЕРЖИМОМУ файла
#45 by Sergeyspb13
тогда only OCR и причем еще не факт что клиент отсканит в правильном порядке контракт и страницы будут не перевернуты =)
#46 by Xapac
1с запускает какой-то установщик) потом ругается, что виндовс ничего не смог установить. (видать офис у меня слишком старой)
#47 by mzelensky
тот же автор, что и в . Я посмотрю
#48 by VVi3ard
Блин вот ведь нехорошие люди берут исходники ZXing оборачивают их в ActiveX и продают за деньги.
#49 by mzelensky
порядок значения не имеет - штрих-код повторяется на всех страницах и мне достаточно распознать хотя бы один! А вот с перевернутым это да...лажа будет.
#50 by Sergeyspb13
лучше сразу говорите клиентам, чтоб когда отправляли вам этот файл переименовывали его в номер этого штрих-кода
#51 by VVi3ard
Почему бы самому не скачать исходники под С# скомпилить в COM компоненту и выложить для всех?
#52 by VVi3ard
Истинный подход 1С-ника.
#53 by mzelensky
Действительно, почему бы и нет?!?!? Не хочешь заняться добрым делом????
#54 by pumbaEO
Была другая немного задача. Акты выполненных работ. imagemagick конвертил из pdf в картинку, обрезал для уменьшения распознавания. zbar - есть утилитка определял на картинке штрих-код. Парсил результат. Штрихкод был как uuid документа.
#55 by Sergeyspb13
они распечатают а потом сканят снова, не подходит ну накрайняк если это ответ по эл.почте то в письме могут указывать код
#56 by mikecool
сохранять соответствие файл - лист - штрихкод в РС, потом брать оттуда
#57 by pumbaEO
Еще есть от abby платная программа для определения штрихкодов. Года два назад стоила 500 баксов.
#58 by Леха Дум
злобные клиенты на другом конце могут отсканировать несколько контрактов и засунуть их в один файл пдф
#59 by pumbaEO
Еще раз печатали акт выполненных работ. Отдавали клиенту. Ставил печать, возвращали обратно. Сканируем пакетно, специальные сканеры. Создаются файлики картинки. zbar определили штирхкод на картинке и приложили картинку его к документу.
#60 by Xapac
а я не понял а человек что-ли не может посмотреть и увидеть? или в организации только компьютеры работают. я бы понял здачу если их много, и сложно бла бла. а тут одну циферку в письме разглядеть...
#61 by aleks-id
проверил - нормально конвертит. отдельно распознает картинки
#62 by DenLaDen
Ты же говорил, что в файле несколько листов и на каждом листе штрихкод. Штрихкод же может быть разный? Получается что тебе придется выдирать листы из файла и рассовывать по папочкам?
#63 by mzelensky
их действительно может быть много. На распределение уходит много времени.
#64 by mzelensky
на весь контракт штрих-код ОДИН. Один файл = один контракт =  один штрих код.
#65 by mzelensky
ну значит чуть позже его и попробую.
#66 by DenLaDen
тогда пишите штрихкод в атрибуты файла, клиент их менять не станет
#67 by Rie
PDF изнутри - это просто текстовый файл (возможно, упакованный). Рядом с картинкой (или не рядом, а в некотором определённом месте) можно поместить просто циферки - а потом их оттуда того-с. Можно даже сделать их невидимыми.
#68 by Sergeyspb13
интересно если клиент не подпишет или забудет печать поставить и скинет.. система тогда его примет и скажет все ок... и в день Ч кто будет крайний )))) споросит начальник, почему твоя система не проверила печати и подписи ))))
#69 by mzelensky
ты ветку читал??? вернись к и поймешь почему такой вариант не подходит.
#70 by mzelensky
это уже другой вопрос и другая ситуация...
#71 by aka AMIGO
фотошоп, файнридер, паинт, медиаплеер, ... и всё это в 1с- № 8.. ну когда-ж, наконец, 1с создаст свою операционку, с кнопкой "сделадь всё!"??!!??.. или уж попросить сваять оську наших с вами гуру?.. им не привыкать к запросам страждущих :) ЗЫ. ФайнРидер типа 9 применить еще не предлагали? у меня это очень популярный инструмент, если срочно надо вырезать картинку, сделать текст.. хоть из чего..
#72 by aka AMIGO
+71 это если не так часто надо вырезать..
#73 by mzelensky
последнее время интеграция 1С со всякими сторонними продуктами набирает все больший оборот...раньше я и не представлял ,что можно скрещивать 1С-ку с Корелом , ФайнРидером или какими-то GPS-устройствами/прогами...но народ доказал ,что нет предела совершенству!
#74 by VVi3ard
Хочу и даже займусь, возможно даже на выходных, просто мне в данный момент это не нужна, есть другая работа которую нужно делать. Я так понял что перед тобой задача стоит которую нужно решить было бы логично ее решить.
#75 by VVi3ard
Работать с C# сейчас учат на первом курсе института, инструкция по созданию компонент есть на ИТС потратить 1-2 дня и сделать в чем проблема?
#76 by mzelensky
я просто давно уже не сидел за СИ, да и не люблю я его (в свое время был поклонником Делфи и вообще борландов).
#77 by Jaffar
на мой дилетантский взгляд, прежде чем бежать автоматизировать любую хотелку заказчика - нужно четко понять, для чего это нужно, и какие подводные камни могут всплыть (начиная от того, что клиент при сканировании обрежет ваш штрих-код - нафих он ему для подписания? - до того, что вставит свой штрих-код вместе или вместо вашего). Я бы стремился убедить заказчика решать эти вопросы не автоматом, а мозгами - тогда не будет ситуации, что клиент вернет обратно файл без подписи и печати.
#78 by Jaffar
у меня на прошлой работе тоже одно время дошли до автоматизации учета договоров (правда, там 2 цели преследовали - не только получить их в электронном виде, но и осуществить контроль при платежах по договорам - на 1-м этапе рассматривали только договора с поставщиками, потом планировали перейти к договорам с покупателями), но основные действия в системе зациклили на архивариуса, через которую проходили все договора.
Тэги: 1С 8
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С