Работа со списком

Punisher

Client
Регистрация
27.12.2014
Сообщения
43
Благодарностей
4
Баллы
8
Всем привет. Кто может подсказать решение такой задачи:
При переходе на определенный сайт, мне нужно сымитировать 2-3 перехода, внутри этого сайта, при этом записывая на каких страницах я побывал.
Как пытался делать я:
С помощью команды DOM и рег выражения, собирал все ссылки на странице, помещал их в список, а потом начинал чистку списка, от ссылок ведущих на картинки иконки итд. Так же что бы почистить список от левый ссылок вроде вк, гугла итд., удалял строки не содержащие домен этого сайта, но тут возникла еще одна проблема, много ссылок вида - ../stranica. То-есть это ссылки как-раз на внутренние страницы, но они не содержат домена сайта, как их проще определять?
Зенку купил давно, но только недавно решил ею заняться, может есть способы намного проще, для внутренних переходов по сайту, чем я тут накрутил через списки?
 

Mutant

Client
Регистрация
19.09.2014
Сообщения
187
Благодарностей
36
Баллы
28
А почему бы просто не собирать ссылки не содержащие http://
или собирать только ссылки вида ../
Как раз и останутся только внутренние страницы.
Ну, возможно, еще добавить и графические файлы, потому как тоже могут иметь локальный путь.
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 605
Благодарностей
4 596
Баллы
113
в конструкторе действий href всегда имеет домен. Накрути регулярку такого href'a, которая будет отсекать картинки, скрипты и к ней будет прикручен домен сайта. И кликай по рандомной ссылке с таким атрибутом href
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)