Вопрос по REGEX, данные в двух строках

DevOps

Client
Регистрация
30.11.2020
Сообщения
495
Благодарностей
311
Баллы
63
Добрый день форум. Забуксовал на одном нюансе (хоть убей не могу вспомнить как делается)
Пишу парсер под один сайт, все строки, точнее данные расположены в одну целую строку, но есть блок кода (указан ниже) в котором неменого иначе
Подскажите образец регулярки для таких случаев
HTML:
<div>
<div class="fw-bold mb-1">Дата регистрации</div>
<div>28 октября 2002 года</div>
</div>
    
    
    
<div>
<div class="fw-bold mb-1">Основной вид деятельности</div>
<div><a href="/companies?by=activity&code=85.41">Образование дополнительное детей и взрослых</a></div>
</div>
    
<div>
<div class="fw-bold mb-1">Юридический адрес</div>
<div>649100, республика Алтай, Майминский район, с. Майма, ул. Советская, д. 36
</div>
</div>

<div>
<div class="fw-bold mb-1">Организационно-правовая форма</div>
<div>Муниципальные бюджетные учреждения</div>
</div>
    
<div>
<div class="fw-bold mb-1">Форма собственности</div>
<div>Муниципальная собственность</div>
</div>
Спасибо
 

Alexmd

Client
Регистрация
10.12.2018
Сообщения
1 021
Благодарностей
1 383
Баллы
113
Добрый день форум. Забуксовал на одном нюансе (хоть убей не могу вспомнить как делается)
Пишу парсер под один сайт, все строки, точнее данные расположены в одну целую строку, но есть блок кода (указан ниже) в котором неменого иначе
Подскажите образец регулярки для таких случаев
HTML:
<div>
<div class="fw-bold mb-1">Дата регистрации</div>
<div>28 октября 2002 года</div>
</div>
   
   
   
<div>
<div class="fw-bold mb-1">Основной вид деятельности</div>
<div><a href="/companies?by=activity&code=85.41">Образование дополнительное детей и взрослых</a></div>
</div>
   
<div>
<div class="fw-bold mb-1">Юридический адрес</div>
<div>649100, республика Алтай, Майминский район, с. Майма, ул. Советская, д. 36
</div>
</div>

<div>
<div class="fw-bold mb-1">Организационно-правовая форма</div>
<div>Муниципальные бюджетные учреждения</div>
</div>
   
<div>
<div class="fw-bold mb-1">Форма собственности</div>
<div>Муниципальная собственность</div>
</div>
Спасибо
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
1676707146014.png
 
  • Спасибо
Реакции: DevOps

DevOps

Client
Регистрация
30.11.2020
Сообщения
495
Благодарностей
311
Баллы
63
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
Посмотреть вложение 103428
Большой спасиб и лайк!
 
  • Спасибо
Реакции: Alexmd

DevOps

Client
Регистрация
30.11.2020
Сообщения
495
Благодарностей
311
Баллы
63
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
Посмотреть вложение 103428
Черкани в личку
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)