Хочу скачать картинки с одного сайта с одеждой. Поставил на закачку весь сайт. На сайте много разных способов отображения товаров: по цвету, фирме, цене, размеру и т.д. Уже скачалось очень много страниц, но в очереди их ещё невероятно много и продолжает расти чуть ли не в геометрической прогрессии. Можно ли как то оптимизировать закачку и не скачивать все страницы?
Да, Вы можете использовать Фильтры URL для определения что скачивать, а что пропускать.
Best regards,
Oleg Chernavin
MP Staff
Но я не знаю что фильтровать - могу ли я быть уверен в том, что убрав несколько лишних сортировок ничего не потеряю.
И я не совсем понял как создавать фильтр. В чём разница между фильтром "Pricerange" и "link:Pricerange". И как работает опция "Загружать только файлы с начальным именем файла"? Я устанавливаю все эти настройки, но страницы с этими словами в адресах продолжают скачиваться. Возможно это работает только для добавленных вновь страниц?
Напишите мне примеры того, что нужно скачивать и что не нужно. Таким образом будет проще продемонстрировать.
Олег.
Например я пытаюсь отфильтровать страницы http://site/page.aspx?size=8 и скачать только http://site/page.aspx. Я установил настройки фильтрации("size" и "link:size") - после перезагрузки очереди всё заработало как положено и лишние файлы из очереди удалились. Хотелось бы теперь только разобраться в указаных настройках: чем отличается фильтр "size" от "link:size" и как работает опция "Загружать только файлы с начальным именем файла"(я предпологаю что она удаляет все параметры загрузки)?
Разница тут простая. Вот тег со ссылкой в HTML коде:
<a href="page.aspx">Web Link</a>
Просматривая страницу в браузере виден подсвеченный текст "Web Link". При наведении на него в строке статуса видна ссылка http://www.server.com/dir/page.aspx
Если указать в маске префикс link: то он будет отфильтровывать не по ссылке, а по ее тексту - видимой части - Web Link в данном случае.
Олег.