#0
by xmk_okda
Всем привет. Есть сайт, при прогулке по нему не меняется адрес в адресной строке. Я так понял, что данные подгружаются ajax'ом. Большая проблема еще в том, что для входа на сайт в нем обязательно еще нужно залогиниться. Подскажите пожалуйста, что можно почитать по данной теме и вообще как это работает.
#8
by trdm
Да, как-то сайт с анекдотами распарсить пытался. эта херня реально раздражает. особенно гугловский обфускатор.
#9
by Fragster
нет, в нормальных сайтах меняется URI, как минимум после #, как максимум - подставляется нормальный действующий урл без перезагрузки страницы.
#17
by mistеr
Логин это по любому HTTP запрос, как и подгрузка данных. Запросы и куки смотришь в браузере (инструменты разработчика), постом повторяешь в коде в той же последовательности. P.S. Если там что-то ценное и сайт специально препятствует парсингу, ковыряться будешь долго. Узнай, может там есть API. Может платный.
#19
by spock
Тогда запасаемся терпением и: - python (мой совет), хотя можно на многом другом; - selenium: ; - chrome (интерактивный режим, будет открываться хром и повторять действия пользователя) или phantomjs (чисто программный режим); - немного кода. По шагам: Берем сайт, смотрим его кишки (в Хроме через Ctrl+Shift+I), ищем нужные последовательности тегов (через Ctrl+Shift+C, встал на нужный элемент, в консоли открылся тот участок кода, который отвечает за это место), там же можно Copy XPath or Copy Selector, пишем чуток кода, вставляем скопированное, радуемся. Все не сложно :) А почему так заморочено, спросите вы? А потому что современный web enterprise работает на динамике. Т.е. html код рисуется на лету. Или по другому - по наступлении какого-либо события (в рун-тайм) изменяется DOM.
#20
by spock
+19 и самое главное - через selenium + chrome/phantomejs эмулируется движок браузера. Т.е. отрабатывает javascript в коде страницы, как будто живой человек открыл через браузер сайт.
#22
by mistеr
>Все не сложно :) Да уж, не сложно... В данном случае DOM нам нафиг не нужен, нам нужны только данные.
#23
by Serginio1
Угу Angular 2 делали дураки? Single Page Application набирает большую популярность. Кроме того например Может работать и без поддержки JS для сбора статистики. Можно попробовать отключить использование JS
#24
by spock
Ещ раз почитай, дом рисуется динамически. Страницу открыл, а тебе еще пол-страницы нарисовалось в доме. И без джавыскрипт этого не получить.
#25
by Serginio1
Вообще мы можем получить адрес и сами без браузера обращаться за данными. Либо через код, любо через инструменты разработчика или фиддлер
#27
by spock
Так можно и руками перенести с сайта. Вопрос ведь в реализации инструмента, который в автомате будет подстраиваться под изменения.
#29
by Serginio1
Спасибо! Я TypeScript ом балуюсь. На самом деле проще разобрать код. И не дожидаться когда DOM построится. Но это уже на любителя. Из поддержки JS использовал Силениум. Там есть поддержка JQuery для парсинга. В принципе развивается и Jint Который можно прикрутить к AngleSharp Давно этим не занимался.
#30
by spock
Мы может про разные сайты говорим, но мне бывало сложно обфусцированные скрипты разбирать.
#33
by Serginio1
Ну так или иначе запросы идут через форму. Всегда можно посмотреть какие запросы идут через средства разработчика или фиддлер. Всегда можно распарсить код и посмтреть где какие клики. Понятно, что сайт сайту рознь. Иногда приходится и Silenium с JQuery использовать
#34
by spock
На секундочку, я не говорю, что есть только мой один единственный путь. Я предложил свой конкретный способ. Каждый выбирает свой дзен. Нравится изучать обфусцированные скрипты? - вперед.
#36
by Torquader
Нет, а что вам не нравится, если не меняется адрес страницы при изменения на ней ? Просто, если меняется адрес, то для браузера - это переход, и кто-то может попытаться открыть сразу несколько разных страниц, просто копируя адрес - для некоторых сайтов это оказывается очень даже критично. А если у вас одна страница и её состояние в Cookie задано, то при повторной загрузке загрузится именно то, что нужно. P.S. Просто, иначе получается, что можно открыть отдельно корзину интернет-магазина, а отдельно справочник и добавить товар в корзину - и очень редкие магазины сразу перерисуют корзину.
Тэги: 1С 8
Ответить:
Комментарии доступны только авторизированным пользователям
Похожие вопросы 1С
- Парсинг строки
- ЗиК падает при загрузке. Без сообщений. Без переиндексации.
- Создаем ВК "без программирования",получаем задержку в N-сек без 100% загр.
- Как закрыть форму документа, без сохранения и без запроса на сохранение
- Парсинг HTML (данные в таблице)
- Парсинг HTML страницы
- Парсинг данных сотового оператора
- Парсинг сайтов средствами 1С
- Изменения реквизита булева в форме списка документа без открытия документа.
- Парсинг выписки из Клиент-Банка по нескольким счетам
- Парсинг сайта... ПолучитьЭлементПоИдентификатору - как заставить его работать?
- Парсинг сайта средствами 1С
В этой группе 1С
- Где скачать установочные пакеты АИС-БП электронное казначейство
- Дистрибутивы к АИС-БП
- Обычные формы, нужна карта России, что лучше leaflet или Яндекс карты
- СКД Нарастающий итог по Группировке
- Скд итоги по вертикали и горизонтали
- Управленческий баланс 1с8 УПП
- Как установить реквизит при открытии " НДС в Сумм", "Ндс Сверху", "Не выдел
- Обособленный учет по видам запасов по поставщикам в ут 11.3
- Расчет стоимости при разукомплектации
- Розница, редакция 2.2 + МАССА-К: Драйвер R - 1C
- Простой вопрос по обмену УТ и БП
- хочу сделать ценообразование на основе стороннего сайта
- Цикл по предопределенным элементам
- 8.3.8 Самописка Регистрация конфигурации в центре. Недоступен центр лицензирования
- Как передать в отбор результат запроса?
- Откуда подставляются руководитель и главный бухгалтер в РТУ УТ 11.1?
- ЗУП 2.5 в ЗУП 3.1 с "чистого листа"
- Формат даты при выгрузке из 1С в SQL
- Переход с РАУЗ на партионный учет
- v7: ошибка "изменение ТА не выполнено" 1с 7.7