Как извлечь Email со страницы?

zenno60

Пользователь
Регистрация
09.05.2016
Сообщения
99
Благодарностей
1
Баллы
8
Get запрос загружает загружает "Заголовки и содержимое" в переменную "PageDom".
Из "PageDom" с помощью "Парсим страницу" пробую спарсить.

Получаю ошибку "Парсинг страницы Не найдены элементы по заданным параметрам".
Пробовал регулярными выражениями. Тоже не получается.

Как спарсить "Email"?

https://rabota.by/resume/view/356739/
Логин - [email protected]
Пароль - Ym3LDp1FPs
 

Вложения

doc

Client
Регистрация
30.03.2012
Сообщения
8 613
Благодарностей
4 601
Баллы
113
регулярку вставлять в экшн работы с текстом. Парсинг страницы работать не может, потому что страницы нет, есть просто текст. Страница браузера - нечто большее
 
  • Спасибо
Реакции: zenno60

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 545
Баллы
113
E-mail создаётся на странице JavaScript'ом, а при выполнении запросов, он не выполняется.

В данном случае почтовый адрес лежит здесь:
JavaScript:
<script type="text/javascript">eval(unescape('%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b'))</script>
Парсим вот эту часть:
JavaScript:
unescape('%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b');
И выполняем её в JavaScript экшене (на текущей странице):


Но для этого браузер должен быть включён.

Если планируете работать с отключенным браузером, то Вам поможет такой C# сниппет:
C#:
string email = "%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b";
return System.Net.WebUtility.UrlDecode(email);
 
Последнее редактирование:

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 545
Баллы
113
Для закрепления :-)
 

Вложения

  • Спасибо
Реакции: zenno60

zenno60

Пользователь
Регистрация
09.05.2016
Сообщения
99
Благодарностей
1
Баллы
8
Всё работает.
Спасибо.

Но для этого браузер должен быть включён.
Я правильно понимаю, что для эффективности(чтобы парсер работал быстрее) лучше использовать GET запросы?
 

one

Client
Регистрация
22.09.2015
Сообщения
6 793
Благодарностей
1 264
Баллы
113
E-mail создаётся на странице JavaScript'ом, а при выполнении запросов, он не выполняется.

В данном случае почтовый адрес лежит здесь:
JavaScript:
<script type="text/javascript">eval(unescape('%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b'))</script>
Парсим вот эту часть:
JavaScript:
unescape('%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b');
И выполняем её в JavaScript экшене (на текущей странице):


Но для этого браузер должен быть включён.

Если планируете работать с отключенным браузером, то Вам поможет такой C# сниппет:
C#:
string email = "%64%6f%63%75%6d%65%6e%74%2e%77%72%69%74%65%28%27%3c%61%20%68%72%65%66%3d%22%6d%61%69%6c%74%6f%3a%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%22%20%3e%69%6e%66%6f%40%62%61%72%73%75%6b%6f%76%2e%62%79%3c%2f%61%3e%27%29%3b";
return System.Net.WebUtility.UrlDecode(email);
Блин, когда то мне такое ух как надо было.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)