#0
by zhenek1984
Доброе времени суток. Подскажите кто сталкивался, как можно закачать сайт в 1с. т.е. номенклатуру с картинками и краткой информацией и ценой. Причем цены нужно обновлять раз в неделю. Есть ли какие то обработки, может даже платные. Мы открыли интернет магазин компьютеров (железо, переферия) хотим ориентироваться на цены другого известного дискаунтера. Также интересны механизмы как полученные цены потом обрабатывать (накладывать формулы, коэффиценты и т.д.). У нас конфигурация УНФ 1.6. Буду рад любой помощи, заранее спасибо.
#1
by Jonny_Khomich
я однажды парсер делал для сбора данных с 2гис, брал наименование фирмы, телефон и адрес. это долго и муторно. и вряд ли есть готовый универсальный механизм.
#2
by Юрий Лазаренко
А позиций номенклатуры, для которых надо брать цены, много? Брать надо с одного сайта или с нескольких?
#3
by zhenek1984
я просто читал что делают парсеры на xpath и через java. но они все не на 1С (на C# и т.д.). просто хоть бы какую зацепку, понятно что сайты все разные. ну пока один сайт в последствии возможны ещё добавяться
#8
by zhenek1984
спасибо кое какая-то ниточка появилась да вот здесь как раз xpath используется, интересно. но платно, хотя скупой платит дваждый. попрошу демку у этих разработчиков. спасибо
#9
by zhenek1984
а что такое Мерлион? сайт? или тут относительно универсально? мне другой сайт нужен просто )
#10
by Maniac
На нормальных сайтах - особенно имеющих цену - не идоты сидят) И запросто блокируют тех кто пытается их читать. А в отдельных случаях видя что их без конца парсят (или вы думаете что какой то дурак позволит чтобы у него воровали инфу) можэет выдавать таким ботам - неверную инфу чтобы запороть выдачу данных. Например совершенно левые цены. и так далее.
#11
by Maniac
Все крупные поставщики имеют защиту от таких парсеров, поэтому они в большинстве случаев просто не рабочие. А остальные крупныки, дистрибьюторы - обычно предоставляют веб-сервисы партнерам. Но реальным партнерам. С доступом и прочим. Но для этого надо иметь партнерское соглашение и реальные обороты
#13
by zhenek1984
согласен не попробуешь не узнаешь. если информация в открытом доступе, грех ей не воспользоваться.
#14
by Юрий Лазаренко
Да нормально обходятся эти блокировки. Не надо долбиться на сайт с одного IP, не надо грузить много данных за короткий промежуток времени.
#17
by Maniac
если только данных не 30 000 страниц с товарами Попробуйка не пропарсить и быть не замеченным)
#18
by Maniac
На сайте вводится блокировка не более 300 хитов за 20 минут. И будешь ты парсить 30 000 - неделю.
#20
by zhenek1984
не пугайте так ). Нам не нужно 30000 парсить, у нас маленький магазин региональный. Максимум 1000 товаров будет.
#22
by Maniac
может быть вечной. Может быть временной. как настроишь. Условий там полно можно задать. Все от админа зависит
#25
by Юрий Лазаренко
Женя, ну ты же умный и ты в курсе, что у интернет-магазинов почти в 100% случаев кроме карточек товара есть еще списки групп товаров с ценами. Не открывай 30000 страниц с полными данными товаров, открой 300 страниц с группами товаров и пропарсь их.
#26
by lubitelxml
еще лет 12 назад была прога которая автоматом меняет прокси через определенное количество времени. Бесплатная причем была.
#27
by Maniac
Ты наверное про список товаров на странице без входа на саму страницу? Ну там считаешь только название и цену. может быть 1 картинку если будет. Свойства обычно держат внутри. Ну и на страницах со списками обычно 10-15 товаров. Не я не говорю что задача не выполнима. Выполнима если что то простое и таргетируемый сайт не представляет из себя ничего особенного. Крупные дистрибьюторы вообще на своих сайтах не держат список и даже не продают в розницу. Внутренние базы данных для своих партнеров.
#28
by Юрий Лазаренко
Ну дык для получения актуальных цен этого достаточно. Ясен пень, что для первоначального заполнения свойств надо будет пройтись по карточкам, но за это время антибот вряд ли сможет заблокировать, если по-умному заходить.
#30
by ttk
если этот известный дискаунтер выкладывает прайс на яндекс-маркет, то можно воспользоваться апи.яндекса и цены быстро и без парсинга поиметь
#31
by Maniac
Ну в данном случае как автор заявил про небольшой бизнес в 1000 товаров. то скорее всего и заморачиваться не о чем.
#33
by trdm
> а что такое Мерлион? Мерлион - это поставщик эскпортер всякой мути. У нас корпоративный отдел с ним часто работает.
#35
by Юрий Лазаренко
Ну это ты зря. У нас как-то один клиент заморочился из-за 30 позиций, чтобы автоматически делать свои цены на 1 рубль ниже, чем у конкурентов. Так он в яндекс маркете обеспечил себе топ в выдаче.
#39
by zhenek1984
с яндексом сотрудничает крупняк в основном нам не потянуть наверно. тем более торговать мы будем в розницу
#40
by zhenek1984
в общем выбрал 2 разработки для тестирования по одной автор уже дал демо доступ (настройки у автора для этого сайта уже были), по второй тоже обещали настроить дать доступ. по результатам тестирования отпишусь. решил брать платную, с бесплатными дольше и дороже выйдет. всем спасибо за быструю подачу информации.
Тэги:
Ответить:
Комментарии доступны только авторизированным пользователям
Похожие вопросы 1С
В этой группе 1С
- Простой вопрос по обмену УТ и БП
- парсинг сайта без изменения url
- Где скачать установочные пакеты АИС-БП электронное казначейство
- Дистрибутивы к АИС-БП
- Обычные формы, нужна карта России, что лучше leaflet или Яндекс карты
- СКД Нарастающий итог по Группировке
- Скд итоги по вертикали и горизонтали
- Управленческий баланс 1с8 УПП
- Как установить реквизит при открытии " НДС в Сумм", "Ндс Сверху", "Не выдел
- Обособленный учет по видам запасов по поставщикам в ут 11.3
- Цикл по предопределенным элементам
- 8.3.8 Самописка Регистрация конфигурации в центре. Недоступен центр лицензирования
- Как передать в отбор результат запроса?
- Откуда подставляются руководитель и главный бухгалтер в РТУ УТ 11.1?
- ЗУП 2.5 в ЗУП 3.1 с "чистого листа"
- Формат даты при выгрузке из 1С в SQL
- Переход с РАУЗ на партионный учет
- v7: ошибка "изменение ТА не выполнено" 1с 7.7
- Печать двух экземпляров на странице с линией разрыва
- v7: Документы: ВыбратьПоЗначению