2 Парсинг html #667922


#0 by TOlikRx
На нужной странице сайта есть блоки вида: <div class="thumb"><a href="/tradein/996/"><img src="/files/image/tradein/hyundai/996_Hyundai_Sonata_2010_1_1370436546.jpg" class="lazy" data-original="/files/image/tradein/hyundai/996_Hyundai_Sonata_2010_1_1370436546.jpg" align="center" style="display: inline;"></a></div> <div class="name"><a href="/tradein/996/" class="more">HYUNDAI SONATA</a></div> <div class="price">850 000р.</div><div class="run">2010 г.в., 61 000 км пробег.</div> ... ... Как мне из каждого такого блока "tradein" получить 1) href="/tradein/996/" 2) src каринки 3) название машины и 4) цену ? Делал так: Если выводить содержимое Узел0, то внем как раз все блоки "tradein". А вот как дальше пройти по всем таким блокам не понял ?
#1 by Asmody
Смотри xpath
#2 by TOlikRx
А пример можно ?
#3 by viktor_vv
Я примерно так делал, попробую накопипастить тут рекурсией по всем дочерним объектам проходим. Функция мСписокВсехОбъектов(УзелHTML,ТипЗначения,СписокОбъектов)    Для каждого Узел ИЗ УзелHTML.ДочерниеУзлы Цикл Я уже точно не помню почему именно так, но выбрать надо было ссылки на видео из <object height="350" width="425" data="http://www.youtube.com/v/TwEF4FxvJ3I" type="application/x-shockwave-flash"> <param name="src" value="http://www.youtube.com/v/TwEF4FxvJ3I" /> </object>
#4 by viktor_vv
То есть так
#5 by viktor_vv
А, ну да, как раз в моем случае Тип("ЭлементОбъектHTML") и соотвествовал <object height="350" width="425" data="http://www.youtube.com/v/TwEF4FxvJ3I" и т. д.
#6 by anddro
Кхм... ИМХО правильный ответ в , а в это закат солнца вручную
#7 by viktor_vv
Не спорю, может быть. Не силен в этих html, а нужна была разовая обработка.
#8 by quest
не мучайся, а заюзая xslt - сразу получишь все что нужно и преобразуешь к нужному виду
Тэги: 1С 8
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С