Не получается подобрать регулярку

pazuofo

Client
Регистрация
20.04.2019
Сообщения
45
Благодарностей
17
Баллы
8
Нужно настроить парсинг email. Регулярку взял с форума \b[a-zA-Z0-9._%+-]+@[a-z0-9.-]+\.[a-z]{2,4}\b
Помимо сбора ящиков, также собирает мусор: [email protected], [email protected], [email protected] и в таком духе
Пробовал убирать мусор регуляркой через обработку текста - заменить на пустоту, не выходит.

Вот строка из которой берет мусор: style="background-image:url(https://yastatic.net/zen-logos/files/domain-letters/ru/[email protected]);background-color:
Регулярка, которую сделал в конструкторе: (?<=style="background-image:url\(https://yastatic\.net/zen-logos/files/domain-letters/ru/).*(?=\);background-color

Подскажите, пожалуйста, как решить проблему?
 

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 328
Благодарностей
5 431
Баллы
113
Подскажите, пожалуйста, как решить проблему?
У почт как правило домены. Нужно собрать все домены, сделать из них регулярку и потом читсить список.
Пример
Удалить строки не соответствующие регулярному выражению
C#:
(\.ru|\.com)
 

n0n3mi1y

Client
Регистрация
08.03.2017
Сообщения
1 128
Благодарностей
486
Баллы
83
Или наоборот, соответствующие и засунуть туда всё с .png
 

pazuofo

Client
Регистрация
20.04.2019
Сообщения
45
Благодарностей
17
Баллы
8
Благодарю за помощь!
Вопрос решил другим путем. В конце шаблона поставил кубик "Операция над таблицей" - удалить строки содержащие текст.

Непонятным осталось только одно, почему замена текста не сработала. В переменную возвращался тот же текст, которые был изначально.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)