Как преобразовать PDF в PDF с возможностью поиска программно? #563176


#0 by le_
ABBYY PDF Transformer есть возможность преобразовать PDF в PDF с возможностью поиска, выделения текста и т.п. Такая же возможность есть в Adobe Acrobat, подозреваю, что в Fine Reader и других подобных программах, умеющих распознавать текст. Посоветуйте что-нибудь, что можно было бы использовать посредством OLE или командной строки. Нужно преобразовать сохраненный на диске PDF в PDF с возможностью поиска (Searchable PDF).
#1 by el-gamberro
А зачем нужен поиск? В MS SQL реализован полнотекстовый поиск, в том числе и пдф. Подойдет?:)
#2 by Ёпрст
pdftransformer умеет.
#3 by Ёпрст
чорт.. сам сабж не прочитал.
#4 by aka AMIGO
Fine Reader готовит в PDF, но с поиском или нет - не знаю
#5 by le_
Конфа "1С: Документооборот". В справочнике файлов множество документов в различных форматах, в том числе в PDF. Для работы пользователям нужно, чтобы во всех файлах, с которыми они работают, была возможность выделения текста, копирования его и поиска. Во первых, нужно перелопатить все то, что там уже есть, а далее, перед добавлением PDF-ки в базу его нужно будет описанным образом изменять. Исключить добавление в базу таких PDF-ок нереально. Вот и нужна какая-нибудь штуковина с COM-интерфейсом или с поддержкой командной строки...
#6 by Живой Ископаемый
то есть нужно из ПДФ без текстового слоя, только с графическоим получить путем распознования ПДФ с текстовым слоем? я вроде находил только проги командной строки которые могли из ПДФ с уже текстовым слоем вытаскивать сам текст в другой формат - txt или doc или rtf
#7 by GenV
Насколько знаю там сделано извлечение текста для таких случаев. И полнотекстовый поиск по извлеченному тексту.
#8 by GenV
7+ проверил - извлекает.
#9 by le_
Мне нужно изменить файл. Чтобы они могли открыть его, найти нужный текст, выделить его мышкой, скопировать и вставить в другой файл (как текст).
#10 by Господин ПЖ
>Такая же возможность есть в Adobe Acrobat ну и проблема тогда в чем? открыл в акробате, пересохранил
#11 by le_
Хотелось бы автоматически это делать. Сохранять файл из базы, открывать его в Acrobat, распознавать, сохранять и засовывать обратно в базу вручную  - не оч. удобно...
Тэги:
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С