unreal666
Gold Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору AnTul Цитата: - спасибо. Т.е. я должен включить "текст", а в "других" уже указать конкретно то, что мне надо? Я так понял? | сейчас потренируюсь конкретно на этом сайте и скажу что-надо минимум включить просто там даже ссылки на сами fb2, epub, pdf и mobi не имеют как такового расширения. Они его получают только после запроса самой ссылки. Т.е., к примеру, если смотреть на запрос одной из ссылок: Код: +++GET 2045+++ GET /library/ebook/2363/epub HTTP/1.1 User-Agent: Opera/9.80 (Windows NT 6.1; WOW64) Presto/2.12.388 Version/12.15 Host: lib.pravmir.ru Accept: text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/webp, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1 Accept-Language: en Accept-Encoding: gzip, deflate Connection: keep-alive +++RESP 2045+++ HTTP/1.1 200 OK Server: nginx Date: Thu, 16 May 2013 15:30:01 GMT Content-Type: application/epub+zip Content-Length: 163074 Connection: keep-alive X-Powered-By: PHP/5.3.16 Content-Disposition: attachment; filename="Porfiriy_Kavsokalivit_Bairaktaris_Avtobiografiya.epub" +++CLOSE 2045+++ | Добавлено: AnTul потестил. Как вариант в твоем случае: - уровень - вообще снять галку, чтобы мозги не пудрить - Типы файлов: "Другие" (остальное отключить) - Фильтры URL => Сервер => Загружать фалы только с начального сервера - Имя файла => Разрешенные: Код: /fb2$ .fb2$ /epub$ .epub$ /library/cat/* /library/cat/*/* /page/biblia | В таком варианте должны сохраниться только default.html файл главной страницы + все epub/fb2 файлы. Сами страницы хоть и скачиваются+анализируются, но при отключенном типе "Текст" они почему-то не сохраняются. OlegChernavin Несколько вопросов. 1. А почему не сохраняются сами страницы при раскладке выше (выделил цветом)? 2. Почему в фильтрах URL не работает ключевое слово [/], т.е., к примеру, /pub$, как выше, работает, а вот [/]pub$ уже ни фига. | Всего записей: 6671 | Зарегистр. 14-02-2005 | Отправлено: 19:24 16-05-2013 | Исправлено: unreal666, 20:51 16-05-2013 |
|