Регулярные выражения на все случаи жизни

Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Можно вот так попробовать
C#:
(https:|http:).*?(?=/\d{1,10}.{1,10})
регулярка.png
Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема
 
  • Спасибо
Реакции: TRUMP

TRUMP

Client
Регистрация
12.06.2014
Сообщения
19
Благодарностей
2
Баллы
3
  • Спасибо
Реакции: Сибиряк

TRUMP

Client
Регистрация
12.06.2014
Сообщения
19
Благодарностей
2
Баллы
3
Можно вот так попробовать
C#:
(https:|http:).*?(?=/\d{1,10}.{1,10})
Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема
Странно, почему то он не взял 2 строчку
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Странно, почему то он не взял 2 строчку
Что бы не упарываться в сложность регулярки, проще парсить несколькими регулярками и в вписке удалять дубли.
C#:
(https:|http:).*(?=\/\d{1,50}.{1,50}) - для строк с цифрами
^(?!.*\/\d{1,50}.{1,50}$).*$ - для строк исключающие конструкцию /123какие-то-символы
 
  • Спасибо
Реакции: TRUMP

strcn

Client
Регистрация
08.07.2017
Сообщения
71
Благодарностей
45
Баллы
18
Други мои, нужна регулярка для

HTML:
    17,456


    678


    83
Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 430
Благодарностей
8 669
Баллы
113
Други мои, нужна регулярка для

HTML:
    17,456


    678


    83
Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
"Обработка текста - Замена (Text)" -> заменить {-String.Enter-}{-String.Enter-} на пустоту.
Потом "Обработка текста - Trim".

Либо "Обработка текста - В список".
Потом "Операции над списокм - Удалить строки - Содержащие только пробельные символы".
Потом "Операции над списокм - Объединить элементы списка" (в переменную).
 
Последнее редактирование:
  • Спасибо
Реакции: strcn

cardelis

Новичок
Регистрация
03.09.2019
Сообщения
9
Благодарностей
6
Баллы
3
Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался
Код:
(?<=(страницы|группы):\ ).*?(?=</td>)
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался
Код:
(?<=(страницы|группы):\ ).*?(?=</td>)
На будущее. Приводите пример кода который надо парсить.
 

obi_zdec

Новичок
Регистрация
10.05.2020
Сообщения
1
Благодарностей
0
Баллы
1
Подскажите, где можно еще кроме зенно постера тестера, без запуска зеннопостера, по тестировать выражения?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 430
Благодарностей
8 669
Баллы
113
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63

Alexmd

Client
Регистрация
10.12.2018
Сообщения
1 021
Благодарностей
1 383
Баллы
113
C#:
// Текст для обработки
string text = project.ExecuteMacro(project.Variables["get"].Value);
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();
Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 430
Благодарностей
8 669
Баллы
113
C#:
// Текст для обработки
string text = project.ExecuteMacro(project.Variables["get"].Value);
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();
Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.
Попробуйте экранировать (продублировать) двойные кавычки в регулярке в 3-ей строке.
C#:
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name=""cookieuser""\ value="").*?(?="")", "0")[0].FirstOrDefault();
 
  • Спасибо
Реакции: Alexmd

Alexmd

Client
Регистрация
10.12.2018
Сообщения
1 021
Благодарностей
1 383
Баллы
113
Да, подчеркивать перестал, но и выполняться тоже не хочет.
Такое сообщение в логе:
Выполнение действия CSharp OwnCode: Индекс за пределами диапазона. Индекс должен быть положительным числом, а его размер не должен превышать размер коллекции.
Имя параметра: index

НИ фига не понял, но решение найдено) https://zennolab.com/discussion/threads/indeks-za-predelami-diapazona-indeks-dolzhen-byt-polozhitelnym-chislom.71959/post-489909
 
Последнее редактирование:

Unipostmaster

Client
Регистрация
19.01.2014
Сообщения
20
Благодарностей
3
Баллы
3
Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.
Текст в списке построчно и фильтровать через регулярку
Например такую
C#:
[\.\-_A-Za-z]{3,200}
или
[\.\-_А-ЯЁа-яё]{3,200}
Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.
 

Dobriyk0t

Client
Регистрация
28.12.2016
Сообщения
65
Благодарностей
14
Баллы
8
Други мои, нужна регулярка для

HTML:
    17,456


    678


    83
Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
(?<=\ ).*[0-9] потом убираешь двойные пробелы
 
  • Спасибо
Реакции: strcn

Dobriyk0t

Client
Регистрация
28.12.2016
Сообщения
65
Благодарностей
14
Баллы
8
Может кому понадобится убрать пробелы в начале текста, то вот регулярка для получения текста: (?<=\ ).*[а-яА-Я]
 
  • Спасибо
Реакции: strcn

Unipostmaster

Client
Регистрация
19.01.2014
Сообщения
20
Благодарностей
3
Баллы
3
Текст в списке построчно и фильтровать через регулярку
Например такую
C#:
[\.\-_A-Za-z]{3,200}
или
[\.\-_А-ЯЁа-яё]{3,200}
Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.
Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке
Если вот так?
В списке построчно находится текст
C#:
^[\d\W\ \;\:\,\(\)\–\.\-_А-ЯЁа-яё]+$
регулярка.png
 

Tvister

Client
Регистрация
09.09.2010
Сообщения
250
Благодарностей
33
Баллы
28
Есть строка dfgdfgd567;dfgdfgd565reter;457fgd567et;353dfgdfgd567erfw;34534dfgddfgddfg;dfgdfg654;

Как заменить первую ; на : ?
 
Последнее редактирование:
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
  • Спасибо
Реакции: Tvister

heks

Client
Регистрация
01.10.2013
Сообщения
1 078
Благодарностей
256
Баллы
83
есть строка переменой как ниже 1 строка 1 переменная
[email protected]:123123
[email protected]:23453465
[email protected]:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 430
Благодарностей
8 669
Баллы
113
есть строка переменой как ниже 1 строка 1 переменная
[email protected]:123123
[email protected]:23453465
[email protected]:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423
Обработка текста - Split, можно перечислить разделители.

56913


Если нужен именно C# код, то можно этот кубик сконвертирвоать в C# через ПКМ.
 
Последнее редактирование:
  • Спасибо
Реакции: doc, masterLomaster и heks

heks

Client
Регистрация
01.10.2013
Сообщения
1 078
Благодарностей
256
Баллы
83
сприт точно забыл про него совсем
 
Регистрация
26.05.2020
Сообщения
459
Благодарностей
163
Баллы
43
любой текст в html, потом хренак <br> перенос
Как получить на выходе любой текст в html, потом хренак - перенос?
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
Регистрация
26.05.2020
Сообщения
459
Благодарностей
163
Баллы
43
Можно попробовать заменять <br> на \n
мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
371
Баллы
63
мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя
тогда \n меняете на то что надо
 
Регистрация
26.05.2020
Сообщения
459
Благодарностей
163
Баллы
43

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)