Как взять содержимое определенного html тега без браузера ?

Регистрация
31.03.2020
Сообщения
58
Благодарностей
1
Баллы
8
При использовании браузера можно легко спарсить/взять любой элемент, но если выключить браузер, то приходится получить полный html старницы и с помощью регулярки вырезать оттуда нужную инфу. Как брать нужную инфу не регуляркой, а например с помощью C# сниппета типа. Регуляркой "вырезать" ну очень думаю непрофессионально, должен быть легкий и адекватный способ парсить определенную часть контента страницы.
 

discus

Client
Регистрация
21.09.2020
Сообщения
87
Благодарностей
43
Баллы
18
Xpath - то что ты ищешь. Подробно объясняется на странице по первой ссылке, там же есть шаблон с C# экшенами.
Код:
https://zennolab.com/discussion/threads/obzor-zennoposter-xpath-na-primere-jandeks-marketa.37497/
https://zennolab.com/wiki/ru:xpath
https://zennolab.atlassian.net/wiki/spaces/RU/pages/862093419/XPath
https://zennolab.atlassian.net/wiki/spaces/RU/pages/483426337/XPath
https://zennolab.atlassian.net/wiki/spaces/RU/pages/534315390/X+JSON+Path
https://yandex.ru/search/?text=site%3Azennolab.com%20Xpath
 
  • Спасибо
Реакции: виктораш и djaga

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 694
Баллы
113
Xpath , верно заметили выше.
Но тебе надо еще поискать не просто Xpath , а парсинг из строки, через Xpath
 
  • Спасибо
Реакции: виктораш

nicanil

Client
Регистрация
06.03.2016
Сообщения
2 242
Благодарностей
1 807
Баллы
113
Экшен Парсить страницу может принимать данные для парсинга из переменной.
Делаете запрос на сайт => Получаете исходный код => Парсите с помощью выше упомянутого экшена.
 
  • Спасибо
Реакции: виктораш
Регистрация
31.03.2020
Сообщения
58
Благодарностей
1
Баллы
8
Экшен Парсить страницу может принимать данные для парсинга из переменной.
Делаете запрос на сайт => Получаете исходный код => Парсите с помощью выше упомянутого экшена.
спасибо за наводку, не замечал этой функции, буду уже разбираться
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)