Загрузка...
Задача
0%
Редактирование: hausdorf
Используйте {query} как плейсхолдер
По одному URL на строку.
Сбор ссылок на товары Выберите метод(ы) обнаружения товарных URL для этого сайта
Обходит страницы каталога, собирает ссылки на товары. Поддерживает пагинацию.
Парсит sitemap.xml для получения списка товарных URL. Если URL не указан — ищет автоматически.
Custom Extraction — Настройки парсинга Укажите CSS-селекторы, XPath-выражения или Regex для извлечения данных со страниц этого сайта. Если оставить пустым — будут использоваться стандартные селекторы. Справка
CSS-селекторы:
[itemprop="price"] — микроразметка
.product-price — класс
h1.title — тег + класс
meta[property="og:image"] — мета-тег
XPath:
//span[@itemprop='price']
//meta[@itemprop='price']/@content
//h1
//meta[@property='og:image']/@content
Regex:
"price":\s*(\d+) — из JSON
itemprop="price" content="(\d+)"
<h1[^>]*>(.+?)</h1>
Откройте страницу товара в браузере → Ctrl+U → скопируйте весь код
Формат: http://user:pass@gate.smartproxy.com:7777. Резидентные прокси: IPRoyal, Smartproxy, Bright Data
Отмена