Как уменьшить количество страниц?

Author Message
Baz 12/27/2011 07:32 pm
Хочу скачать картинки с одного сайта с одеждой. Поставил на закачку весь сайт. На сайте много разных способов отображения товаров: по цвету, фирме, цене, размеру и т.д. Уже скачалось очень много страниц, но в очереди их ещё невероятно много и продолжает расти чуть ли не в геометрической прогрессии. Можно ли как то оптимизировать закачку и не скачивать все страницы?
Oleg Chernavin 12/28/2011 04:44 am
Да, Вы можете использовать Фильтры URL для определения что скачивать, а что пропускать.

Best regards,
Oleg Chernavin
MP Staff
Baz 12/28/2011 11:26 am
Но я не знаю что фильтровать - могу ли я быть уверен в том, что убрав несколько лишних сортировок ничего не потеряю.
Baz 12/28/2011 03:27 pm
И я не совсем понял как создавать фильтр. В чём разница между фильтром "Pricerange" и "link:Pricerange". И как работает опция "Загружать только файлы с начальным именем файла"? Я устанавливаю все эти настройки, но страницы с этими словами в адресах продолжают скачиваться. Возможно это работает только для добавленных вновь страниц?
Oleg Chernavin 12/28/2011 04:16 pm
Напишите мне примеры того, что нужно скачивать и что не нужно. Таким образом будет проще продемонстрировать.

Олег.
Baz 12/29/2011 02:03 pm
Например я пытаюсь отфильтровать страницы http://site/page.aspx?size=8 и скачать только http://site/page.aspx. Я установил настройки фильтрации("size" и "link:size") - после перезагрузки очереди всё заработало как положено и лишние файлы из очереди удалились. Хотелось бы теперь только разобраться в указаных настройках: чем отличается фильтр "size" от "link:size" и как работает опция "Загружать только файлы с начальным именем файла"(я предпологаю что она удаляет все параметры загрузки)?
Oleg Chernavin 12/30/2011 06:01 am
Разница тут простая. Вот тег со ссылкой в HTML коде:

<a href="page.aspx">Web Link</a>

Просматривая страницу в браузере виден подсвеченный текст "Web Link". При наведении на него в строке статуса видна ссылка http://www.server.com/dir/page.aspx

Если указать в маске префикс link: то он будет отфильтровывать не по ссылке, а по ее тексту - видимой части - Web Link в данном случае.

Олег.