Загрузка...
Задача
0%
Добавление конкурента
Используйте {query} как плейсхолдер
По одному URL на строку.
Сбор ссылок на товары Выберите метод(ы) обнаружения товарных URL для этого сайта
Обходит страницы каталога, собирает ссылки на товары. Поддерживает пагинацию.
Парсит sitemap.xml для получения списка товарных URL. Если URL не указан — ищет автоматически.
CSS-селектор для <a> ссылок на товары на странице каталога. Если пусто — авто-определение по эвристикам.
CSS-селектор для ссылок пагинации. Если пусто — авто-поиск.
URL-параметр для пагинации (?page=2). Если пусто — авто-перебор.
Лимит страниц пагинации на один каталог.
Подсказка: Откройте каталог сайта, кликните на кнопку «Далее» и посмотрите URL — параметр будет виден (?page=2, ?PAGEN_1=2 и т.д.)
Custom Extraction — Настройки парсинга Укажите CSS-селекторы, XPath-выражения или Regex для извлечения данных со страниц этого сайта. Если оставить пустым — будут использоваться стандартные селекторы. Справка
CSS-селекторы:
[itemprop="price"] — микроразметка
.product-price — класс
h1.title — тег + класс
meta[property="og:image"] — мета-тег
XPath:
//span[@itemprop='price']
//meta[@itemprop='price']/@content
//h1
//meta[@property='og:image']/@content
Regex:
"price":\s*(\d+) — из JSON
itemprop="price" content="(\d+)"
<h1[^>]*>(.+?)</h1>
Откройте страницу товара в браузере → Ctrl+U → скопируйте весь код
Формат: http://user:pass@gate.smartproxy.com:7777. Резидентные прокси: IPRoyal, Smartproxy, Bright Data
Отмена