Спарсить IP c хитрого кода?

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
Здравствуйте! Помогите новичку спарсить такой кусок кода с таким хитро запрятаным IP.
Вернее это IP и порт, ну с портом то не сложно
Вот кусок кода:
HTML:
    <td>
        <span>
          <style>
.cfUP{display:none}
.Fl5n{display:inline}
.dSfo{display:none}
.Td5X{display:inline}
.ZF2W{display:none}
.TNVA{display:inline}
</style><span></span><div style="display:none">109</div><span class="TNVA">110</span>.<div style="display:none">36</div><span style="display: inline">81</span><span class="dSfo">177</span><div style="display:none">177</div><span class="194">.</span><span style="display: inline">238</span><span class="137">.</span><span class="234">173</span>        </span>
    </td>   
    <td>
        8088    </td>
И еще дело в том, что таких кусков кода много
и стили такого типа
HTML:
          <style>
.cfUP{display:none}
.Fl5n{display:inline}
.dSfo{display:none}
.Td5X{display:inline}
.ZF2W{display:none}
.TNVA{display:inline}
идут все время с разными именами в других местах вхождения.
Просто понятно что не по именам должно быть.
Их надо заносить в переменные или списки по признакам none и inline

По идее если я правильно понимаю спарсеныый правильный IP должен быть такого вида:
110.81.238.173
Кстати даже эту конструкцию занеся в дреамвивер, отображает лишнюю цифру 177, а когда пробуешь IP скопировать в окне дизайна то еще и цифру 36 подставляет.
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 328
Благодарностей
5 431
Баллы
113
Еще нужен порт, они бывают разные. чаще всего 4 значное число после двоеточия.
1) вариант парсить не DOM, а TEXT
2) вариант с помощью экшена операции с файлом замена, заменить части кода на точки.

110.81.238.173:8080
Вот так выглядит прокси
 

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
Еще нужен порт, они бывают разные. чаще всего 4 значное число после двоеточия.
Там разные и двузначные и 4х и 5и значные.
1) вариант парсить не DOM, а TEXT
Текстом попробовал вот что выдает:
Код:
91 91 120 125 235 235 237 237 237 240 . 26 121 198 . 233 . 23 23 49 49 121 121 141 168 168 211

9 9 65 65 105 113 122 124 180 186 186 186 202 . 117 . 15 21 21 141 141 176 249 . 80 90 90 90 138 145 145 145 160 160 220
Это другие ипишки не из первого поста.
2) вариант с помощью экшена операции с файлом замена, заменить части кода на точки.
А при чем здесь файл? весь DOM можно держать в переменной наверное.

А как правильно писать прокси я знаю :-)
 

CSS

Client
Регистрация
22.05.2010
Сообщения
1 327
Благодарностей
663
Баллы
113
  1. Очень часто все эти защиты лишены напрочь смысла так как на соседнем сайте валяются те же самые паблик прокси задаром
  2. Одна из топорных идей - фотать эту область экрана и распознавать её посредством капмонстера предварительно обучив на этой выборке цифр, должно работать быстро и гладко. Шрифты и размеры они там вряд ли будут менять поэтому идея должна работать долго и надёжно.
  3. Никто не задумывался откуда вообще этот паблик берётся? А если задумывались - то вы можете взять его там же без всяких посредников. Это просто поверхностная идея для пытливых умов, я думаю тут должны быть на форуме ребята кто может по этой теме подсказать (мне на ум сразу приходит товарищ @7make), например прокси можно самому сканить - а кто подкованней тому и до своего ботнета недалеко.
 

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
  1. Очень часто все эти защиты лишены напрочь смысла так как на соседнем сайте валяются те же самые паблик прокси задаром
  2. Одна из топорных идей - фотать эту область экрана и распознавать её посредством капмонстера предварительно обучив на этой выборке цифр, должно работать быстро и гладко. Шрифты и размеры они там вряд ли будут менять поэтому идея должна работать долго и надёжно. @7make), например прокси можно самому сканить - а кто подкованней тому и до своего ботнета недалеко.
1) Так как я тока учусь была интересна сама задача - решить средствами логики.
Интересно было решить в лоб! Это просто как интересный пример для отработки навыков в проге ЗП.
2) Нету топора, пока на демке учусь :-)
Кстати эмуляцией мыши и копи-пастом тоже наверное можно сделать?
Просто я изначально парсил GET запрос и изучаю регулярные выражения - потому и тренируюсь.
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 880
Баллы
113
1) Так как я тока учусь была интересна сама задача - решить средствами логики.
Интересно было решить в лоб! Это просто как интересный пример для отработки навыков в проге ЗП.
2) Нету топора, пока на демке учусь :-)
Кстати эмуляцией мыши и копи-пастом тоже наверное можно сделать?
Просто я изначально парсил GET запрос и изучаю регулярные выражения - потому и тренируюсь.
Это похоже на HMA. От туда пытаетесь получить данные?
Когда то давно качал с этого сайта прокси, прятали они их там хорошо, в итоге закончилось всё на том, что и сейчас осталось - скрытые данные внутри строки с прокси.
Нужно просто получать все строки с прокси, получать айди скрытых элементов и отталкиваясь от этого чистить строку.
Если интересно, пишите в личку, договоримся по поводу шаблона для обучения.
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 328
Благодарностей
5 431
Баллы
113
Прям такой хороший сайт??
Я лично по началу регал ключи хид ми на сутки, выставлял параметры парсера ихнего и парсил целые сутки. Потом этот список в чекер.
 

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
Это похоже на HMA. От туда пытаетесь получить данные?
Когда то давно качал с этого сайта прокси, прятали они их там хорошо, в итоге закончилось всё на том, что и сейчас осталось - скрытые данные внутри строки с прокси.
Ну да c HideMyAss . Здесь на форуме была тема и там был шаблон на GET запросах и использования регулярок.
http://zennolab.com/discussion/threads/parser-proksej-s-hidemyass.21256/
Вот его и разбирал и пытался научится.
Но видимо ХМА усложнили защиту с тех пор и шаблон не рабочий, но интересный.

Нужно просто получать все строки с прокси, получать айди скрытых элементов и отталкиваясь от этого чистить строку.
Если интересно, пишите в личку, договоримся по поводу шаблона для обучения.
Так вот это то понятно, просто строки (вернее названия стилей с такими строками) для каждого такого блока нужно заносить как полагаю в разные списки.
Код:
{display:inline}
{display:none}
И потом уже парсить по display:none удалять цыфру, а по {display:inline} брать ее.
В общем я учился лет этак 24 назад на програмера в ту пору когда IBM 286,386,486 были (вспомню молодость) и алгоритм состряпать могу, проблема в реализации , типа на чем лучше делать - списки или чтото другое - может таблица?
Плюс это все дело цикличное, потому что такой цикл разбора нужно делать для каждого IP.
Напишу в личку
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 328
Благодарностей
5 431
Баллы
113
У меня был шаблон, я зашел посмотреть как же я парсил, и увидел этот маленький скрин который дает ответы на все вопросы...

2016-04-08_213418.jpg

P.S. На сайте все реализовано.
Приложил шаблон, прикрути списки сам. Помню он работал нормально.
 

Вложения

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
Спасибо, я просто ангоязычный сайт пытался парсить и без авторизации.
Ваш шаблон очень интересный! Ну что-же подход с другой стороны! Спасибо еще раз!
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 328
Благодарностей
5 431
Баллы
113
Да ладно, я его написал в первые дни пользования зенкой, ему нужно еще регистратор мыл, ну или руками регистрируй сам на маил.
 

Bigi

Client
Регистрация
31.03.2016
Сообщения
21
Благодарностей
1
Баллы
3
Да ладно, я его написал в первые дни пользования зенкой, ему нужно еще регистратор мыл, ну или руками регистрируй сам на маил.
Да мне не столь важно получить сами эти прокси листы... Мне пока что интересны разнообразие методов (подходов) к решению задачи!
Разбор как работают регулярки, куда ложатся данные, временные пнременные списки и как с этим работают люди.
Т.е. я учусь пока и нацелен не на результат, а на методы и способы достижения цели!
Мне задача показалась не очень сложной, но интересной для своего первого шаблона!
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)