Как парсить данные...?

art22

Client
Регистрация
24.06.2016
Сообщения
484
Благодарностей
68
Баллы
28
Добрый день. Подскажите как спарить данные из таблицы?

C#:
                                                        <div class="sic-card_featureTitle">Регион</div>
                            <div class="sic-card_featureValue">Краснодарский край</div>
есть такой код. нужен спарсить Краснодарский край, пытался так . >Регион</div>.*?<div*?>(*?)</div> но почему то не работает, в другом проекте такая схема работает
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 607
Благодарностей
4 598
Баллы
113
>Регион</div>\s*<div[^<>]*>([^<>]+)</div>
 

art22

Client
Регистрация
24.06.2016
Сообщения
484
Благодарностей
68
Баллы
28
>Регион</div>\s*<div[^<>]*>([^<>]+)</div>
в таком случай весь код парсит

и еще, в место Региона еще есть Регион (77) в таком случай не парсит пытался убрать скобки \s* не убирает
 
Последнее редактирование:

doc

Client
Регистрация
30.03.2012
Сообщения
8 607
Благодарностей
4 598
Баллы
113

bizzon

Client
Регистрация
08.09.2015
Сообщения
1 089
Благодарностей
126
Баллы
63
нужен весь DOM страницы или дай ссылку на сайт
 

viol2021

Client
Регистрация
12.01.2021
Сообщения
481
Благодарностей
179
Баллы
43
Шлите ссылку
 

art22

Client
Регистрация
24.06.2016
Сообщения
484
Благодарностей
68
Баллы
28
ну так и твоя регулярка парсит всё. И если верить тебе же, то в другом проекте она работает так, как тебе надо
так хотелось бы чтобы только сам регион спарсил а не весь код) буду благодарен)

сайт не смогу дать к сожалению так как закрытая страница, там таблица...

C#:
                                                        <div class="sic-card_featureTitle">Регион</div>
                            <div class="sic-card_featureValue">Краснодарский край</div>

                                                        <div class="sic-card_featureTitle">Регион (99)</div>
                            <div class="sic-card_featureValue">Москва</div>
                        
                            
                                ....
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 607
Благодарностей
4 598
Баллы
113
(?<=>Регион[^<>]*</div>\s*<div[^<>]*>)[^<>]+
быстрой такая регулярка не будет
 
  • Спасибо
Реакции: art22

Ахилес

Client
Регистрация
11.11.2020
Сообщения
846
Благодарностей
344
Баллы
63
для парсинга html верстки, специально был придуман xpath... но все продолжают мучатся с регулярками :ap:
 
  • Спасибо
Реакции: bizzon

bizzon

Client
Регистрация
08.09.2015
Сообщения
1 089
Благодарностей
126
Баллы
63
для парсинга html верстки, специально был придуман xpath... но все продолжают мучатся с регулярками :ap:
Так до сих пор не определился с инструментом для составления и теста xpath, а совет правильный.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)