#0
by mishaPH
Коллеги, есть задачка. приходят к нам от 7г континента акты о приеме товара в формате pdf. нужно их распарсить и сравнить с накладными отгрузок им. В общем есть некие конверторы с текстовой строкой чтобы его в текстовый файл затащить а далее обработать. А делал ли кто подобное в 7ке. может есть какая компонента чтобы из 7ки рулить или вообще сразу прочитать пдфку. пдф текстовый не картинка.
#0
by mishaPH
Коллеги, есть задачка. приходят к нам от 7г континента акты о приеме товара в формате pdf. нужно их распарсить и сравнить с накладными отгрузок им. В общем есть некие конверторы с текстовой строкой чтобы его в текстовый файл затащить а далее обработать. А делал ли кто подобное в 7ке. может есть какая компонента чтобы из 7ки рулить или вообще сразу прочитать пдфку. пдф текстовый не картинка.
#0
by mishaPH
Коллеги, есть задачка. приходят к нам от 7г континента акты о приеме товара в формате pdf. нужно их распарсить и сравнить с накладными отгрузок им. В общем есть некие конверторы с текстовой строкой чтобы его в текстовый файл затащить а далее обработать. А делал ли кто подобное в 7ке. может есть какая компонента чтобы из 7ки рулить или вообще сразу прочитать пдфку. пдф текстовый не картинка.
#2
by Холст
имхо бесполезняк пытаться полученный текст разбирать ПДФ трансформер (им помоему и в автоматическом режиме можно) разбирать док в эксель файл а потом разбирать эксельку
#3
by trdm
Шмахабра говорил что есть актив-ха который может пдф жевать. Тусуется где то в составе продуктов адоба, это у него спрашивать надо. ПС. за пдф в обмене данных надо топить еще при рождении.
#4
by mishaPH
да попробуй. да ладно обычный даже пдф ридер может сохранять текст в ТХТ да есть конвертеры говорю даже с командной строкой. не проблема завязаться на него. Но интересует ваш опыт.
#5
by ildary
Я делал подобное (добрый человек на мисте делился основой для чтения пдф), но было 2 нюанса - 1) данные в пдф должны быть не в виде картинки 2) хранение в пдф бывает с придурью в тот момент, когда данные не влазят на одну строку.
#6
by Господин ПЖ
чего его парсить... "save as" в xml или еще во что-то вменяемое и читать... полный акробат делать "save as" программно умеет.
#11
by mishaPH
есть такое тормозно. да им если там картинки проще. может. руками. а надо автоматом. если знаешь коммандную строку как сделать. напиши.
#16
by mishaPH
но тут надо автоматом чтобы было. доков очень много и человек участвовать не должен в этом.
#22
by Господин ПЖ
ну банально можно оформить в виде vbs скрипта... из 7.7 через shell.run дергать его с передачей внутрь параметров... или попробовать переписать. Я не помню как 7.7 com объект получать надо для CreateObject("AcroExch.App").
#24
by Господин ПЖ
ну я думаю общий смысл будет тот же. Объекты может быть будет иные... так в SDK и гугле все есть...
#26
by andrewks
было бы просто замечательно, если бы бесплатный ридер поставлял ком-объекты. вопрос, так ли это? надо гуглить
#28
by Злопчинский
в свое время была анлогичная ТС проблема. Все конверторы идут лесом. Если надо конвертнуть текст - то тут можно сказать ОК. Конвертация таблиц и таблицеподобного - практически нулевая, потом практически руками собирать из текста. . так что если пдф можно конвертнуть в иксемель, то это гуд, иксемель парсить ужо легче. другое дело что практически на каждый док или чуть изменилось что-то в доке - придется алгоритм подкручивать... (както так?)
#30
by mishaPH
таблички нафик не нужны. мне нежен текст который я отработаю далее сам. вполне устраивает как это делает пдф ридер когда сохраняешь в тхт
#31
by mishaPH
епть. все осложняется еще и тем, что X5 групп от которой приходит этот пдф, конвертер который с коммандной строкой работает за пдф не принимает. какой то слегка свой формат. Но ридер читает.
#32
by FN
давно уже решил такую проблему. только решение не со всеми файлами проходит. скинь пример файла на почту или файлообменник
#33
by Злопчинский
ну.. х5 с еди работает, вроде как там у них даже есть ответ по еди о приемке - тот самый акт...
#36
by mishaPH
через ЕДИ мы с ними не работаем. работаем с каким-то порталом от них а там только заказы.
#37
by Torquader
В pdf хорошо кладутся отсканированные документы, в которых текста может и не быть - не ваш случай ?
#39
by FN
Функция pdf_ПрочитатьСимвол(Знач Значение="0") Экспорт Функция pdf_ПолучитьСмещение(знач стр) ... и тд
#45
by Сияющий Асинхраль
+ Заодно и в консоли работает, чтобы программно можно было файлы входящие и выходящие задавать...
#46
by Mikeware
И причемм датой полного перехода с портала на EDI объявлена эпическая 11.11.11 Начали с заказов, сейчас ввели подтверждение заказов и подтверждение приемки.
#48
by mishaPH
Я в курсе. но у них ттарифы пипец. там за каждый док охрененных денег требуют. итак только за накладные 50 штук в месяц. попробую. не завтра буду заниматься. да я в курсе. Но на то есть руководство, дадут задачу сделаю. Пока задача освободить человека от проверок соответствия отгруженного с принятым.
#50
by ice777
эти сволочи просто поставили <хеззнаеткакой>pdf принтером и гонят туда печать, вместо того, чтоб мозгом подумать. не уважаю.)
#53
by Smallrat
Делал на УФ: Если пригодится - я могу залить куда-нить zip с утилитками, который в макете обработки.
#55
by Smallrat
тьфу ты блин - щас только прочитал что 7.7, ну да вообщем сам механизм конвертации тот же .
#57
by mishaPH
адоб который стандартный? а как сделать чтобы он захватил подсунутый файл и сохранил его в тексте. из него знаю можно.
#59
by andrewks
"утилитка" в , это проект Xpdf. и нахрена столько кода, непонятно. там всё в три строки можно сделать - вызов экзешника с параметрами
#61
by Smallrat
нуууу... там треть кода это диалог открытия пдф треть - распаковка утилиты из макета и треть затрах с передачей между клиентом и сервером файлов и еще кусочек чтобы сделать так чтобы черных окошек не было и обработка не началась до того как файл сконвертится.
#62
by smaharbA
нет, в самом ридере, подсовывается обычный джабаскриптовый файлик куда надо и ридер сам открывает парсит и сохраняет
#65
by andrewks
насколько я понял после прочтения доков от адобе, метод SaveAs доступен только из API для плагинов. ни сообщениями, ни в активиксе он недоступен
#69
by mishaPH
апнем что-ли. сегодня попробую кучу конвертеров. если есть решение которое позволит стандартным способом и с применением адобридера из 1с проделать это - рассказывай ;)
#70
by mishaPH
В общем проверил все конвертеры присланные и ссылки указанные. эту пдф никто не конвертнул. либо очень коряво. адоб ридер стандартный все корректно в текст сихраняет.
#73
by mishaPH
скриптом не дает. ругается. Говорит невозможно создание объекта контейнером активХ AcroExch.App
#75
by mishaPH
@FN там у тебя в коде ТЗ брось структуру полей какие у тебя были. или там только ТЗ = СоздатьОбъект("ТаблицаЗначений")
#78
by mishaPH
не помню. кучу перепробовал с кем договорится ? с Х5 ? это всеравно что ашану свои условия ставить.
#79
by mishaPH
если ты от абби то он у нас есть. но он 1. тормозной. 2. он не умеет работать без человека
#82
by smaharbA
закинь в [HKEY_LOCAL_MACHINESOFTWAREPoliciesAdobeAcrobat Reader9.0FeatureLockDowncDefaultExecMenuItems] tWhiteList=...|ADBE:SaveAsAccText|SelectAll|Copy к тому что уже есть и в папку усерских скриптов файлик с одной строкой app.setTimeOut('app.execMenuItem("SelectAll");app.execMenuItem("Copy");',3000); и открой какой нибудь пдф - увидишь эффект, далее думай
#85
by mishaPH
в реестр строку |ADBE:SaveAsAccText|SelectAll|Copy добавил к имеющимся. теперь при старте пдфки помоему что-то промелькнуло. но эффекта не вижу
#86
by smaharbA
Да и просто открой какой нибудь пдф интерактивно (конечно содержащий текст, страниц 10 хотя бы)
#90
by mishaPH
при открытии накладной эффекта нет кроме мелькающего окошка, при открытии счета от билайна получается выделенным весь текст. но в буфер не копирует. Это отдельным файликом скрипта или встроить в какой.или имя у него должно быть определенное
Тэги: 1С 7.7 и ранее
Ответить:
Комментарии доступны только авторизированным пользователям
Похожие вопросы 1С
- v7: v7 : НДС при возврате
- v7: Что нужно чтоб подключить ККМ Меркурий 112F к 1с V7 Торговля + склад
- v7: v7.7 премещение элемента справочника
- v7: Загрузка выписки банка из txt
- v7: v8: v7: Кто-нибудь сумел скачать комплект отчетности за I квартал 2007 года
- v7: 1С V7.7 в сети
- v7: 1C:V7 starter program (for SQL) - обнаружена ошибка
- v7: Печать PDF файлов
- v7: Перенос данных Бухгалтерия из v7 в v8
- v7: v7 Перехват глобального события ПриЗаписи() или ОбработкаПроведения()
В этой группе 1С
- Получение почты через IMAP 1С 8.2 (14 релиз)
- Как вынуть блок проявки из Canon IR 1020?
- v8: Ошибка базы Общепит: "OpenKey: Access violation"
- Проведение Расчета себестоимости выпуска в УПП 1.3
- функция print <<<HERE не работает в PHP
- 8.2 Как программно выполнить общую команду?
- v8: 8.2 Не удалось сформировать внешнюю печатную форму!
- Характеристики номенклатуры по значениям свойств
- v8: Обмен ЗБУ и БГУ, нет отбора по организации и дате
- СКД: Ограничение доступности параметров
- как не дать программно отменить проведение документа ?
- v8: Технические хар-ки файловой версии 1С 8?
- Как вывести отчет в табличное поле?
- Как включить возможность редактирования типовой 1с 8.2
- Перевод на ЗУП
- Как в управляемом приложении создать документ и открыть его форму?
- как поставить консоль администрирования серверов для платформы 8.2.14.519
- закрытие 44 счета
- Область табличного документа - АвтоВысотаСтроки
- Понизить версию клиента удаленного рабочего стола