Парсинг сайта средствами 1С #743125


#0 by alexsandrinia
Как осуществить извлечение нужной информации с сайта путём 1С? Подскажите пошаговую инструкцию. Правильно ли я понимаю, что сначала сайт сохраняется по указанному мною пути и потом из сохранённого сайта ищется информация?
#1 by KrabCore
думаю тебе более чем хватит
#2 by alexsandrinia
я хочу сам научиться, понять смысл где что происходит.
#3 by Звездец
ну так скачай, посмотри, задай конкретные вопросы
#4 by sapphire
Включить мозг; Получить страницу с сайта в виде текста; Вставить первой строкой текст:<?xml version="1.0"?> Если включить мозг = Истина Тогда    разобрать документ средствами xml КонецЕсли;
#5 by ДенисЧ
Не все html являются xml-валидными
#6 by DmitrO
и вперед шариться в ДокументHTML как через DOM модель.
#7 by alexsandrinia
ИмяHTMLФайла предварительно скачать нужно?
#8 by DmitrO
да, например через HTTPСоединение
#9 by alexsandrinia
Соединение = Новый HTTPСоединение(Сервер); а дальше как сохранить?
#10 by DmitrO
#11 by DmitrO
не так, сори, не оттуда скопипастил :)
#12 by dk
можно без сохранения страницу парсить
#13 by alexsandrinia
как?
#14 by DmitrO
+ короче лениво мне декомпозицию кода делать HTTPЗапрос создай
#15 by dk
я вот эту поделку переделывал
#16 by alexsandrinia
да, я её смотрел. но тут страница на форму прогружается - получается, тратится на это память?
#17 by Serginio1
#18 by DmitrO
ПолеHTMLДокумента - это немного другая песня.. я бы даже сказал что это уже не просто песня это песня с танцем. (замечание по ходу: до 8.3.6 танец будет с бубном). И я бы не сказал что это "без сохранения".
#19 by DmitrO
можно сделать на сервере, а это только на клиенте.
#20 by dk
зато не паришься с контекстом например корзину с инет магазина попробуй по другому распарсить
#22 by DmitrO
ну это да, смотря для чего мы это парсим, и что не мало важно, смотря что мы парсим. Возможно даже применение комплексного подхода: используя ПолеHTMLДокумента интерактивно переходим на сайт, проходим авторизацию (все java-события и прочие редиректы отрабатывают штатно на клиенте), потом выдергиваем нужные данные из DOM-объекта элемента управления для целевого запроса, делаем программный запрос через НТТPСоединение, получаем файл, отправляем его на сервер, и там парсим раскладывая данные уже по своей базе.
Тэги: 1С 8
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С