Бесплатно напишу регулярное выражение. Часть 2.

surrealmix

Client
Регистрация
07.03.2013
Сообщения
715
Благодарностей
409
Баллы
63
Подскажите пожалуйста универсальную (вне зависимости от атрибутов тега <a>) регулярку для парсинга анкоров ссылок.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
  • Спасибо
Реакции: surrealmix
Регистрация
02.07.2010
Сообщения
387
Благодарностей
101
Баллы
43
Подскажите регулярку чтобы парсились строки с не более чем 2 точками:
пример текста для обработки:
ddd.ddddd
d.ddddddd.dd
dddddd.dd.dd.dd
dd.d.ddd.dd.dd.dddd

чтобы выдавало только первый и второй результат, т.е. в которых не больше 2 точек включительно
Спасибо.

Upd.
Накостылил \w+\.\w+\.\w+
 

Master

Client
Регистрация
03.05.2010
Сообщения
17
Благодарностей
2
Баллы
3
Ребята выручайте!)

Есть такой кусок кода который весь в 1 строку в html:
PHP:
...<div class="card cbox"><a href="/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst" class="sclnk"><div class="ccard nopt">...
надо выдернуть все ссылки с подобным кодом:
PHP:
/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst
где bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin и 3993 меняются у ссылок на страницы
 

surrealmix

Client
Регистрация
07.03.2013
Сообщения
715
Благодарностей
409
Баллы
63
регулярка
Код:
/dk\?st\.cmd=userMsgs&amp;st\.chatWith=.*?&amp;_prevCmd=userDlgs&amp;tkn=.*?#lst
 

Svyat

Client
Регистрация
10.04.2012
Сообщения
97
Благодарностей
8
Баллы
8
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
 

surrealmix

Client
Регистрация
07.03.2013
Сообщения
715
Благодарностей
409
Баллы
63
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
Странный вопрос, потому что в Зенно есть конструктор регулярных выражений и у Вас простая регулярка.
Указываем в конструкторе рег. выражений текст кторый есть до нужного нам значения, затем указываем тот, который есть после нужного значения и ставим галочку "Самое короткое совпадение".
В данном случае:
Текст до href="
Текст после "

Скриншот: http://clip2net.com/s/5ci64J
 

finista

Client
Регистрация
10.10.2012
Сообщения
361
Благодарностей
57
Баллы
28
По возможности, прошу подсказать

Есть div <div id="group_contacts" class="module clear page_list_module"> между ним и закрывающим его тегом </div>, много еще чего. Как правильней спарсить DOM тега? Т.е все что внутри его

Сама страница https://vk.com/ya_ego_a_on_aaa, раздел контакты

Спасибо
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
  • Спасибо
Реакции: finista

finista

Client
Регистрация
10.10.2012
Сообщения
361
Благодарностей
57
Баллы
28
спасибо
 

ibelieve

Client
Регистрация
24.12.2012
Сообщения
248
Благодарностей
96
Баллы
28
Пожалуйста, помогите отловить строку с адресом блога. Простая задача на первый взгляд, но ничего не выходит (версия Zenno 4.5.0.2). Конструктор Рег.Выр. то ничего не видит, то выхватывает пол страницы кода. Вот здесь сам код страницы http://yadi.sk/d/WVCLc-ly61wUT А вот нужная строчка href="http://ousporniva.blogspot.com/">View blog</a> из которой нужно выпарсить URL блога.
 

tonic

Client
Регистрация
07.08.2011
Сообщения
103
Благодарностей
50
Баллы
28
если страница всегда на англ. языке попробуйте так
(?<="\ href=")http://.*?(?=/">View\ blog)
 
  • Спасибо
Реакции: ibelieve

ibelieve

Client
Регистрация
24.12.2012
Сообщения
248
Благодарностей
96
Баллы
28
Спасибо огромное!!! Это то, что нужно! :-)
Понял свою ошибку. Мне нужно было вставлять в "Перед искомым тестом всегда есть" символы " href=" включая не только пробел, но и кавычки с предыдущей строки кода.

Ещё раз спасибо, очень помогли!
 

VovanSam

Client
Регистрация
18.02.2013
Сообщения
1
Благодарностей
1
Баллы
3
Есть строка:
Найден 4 241 человек
Подскажите как выбрать все числа в одну строку без пробела? Если \d{1,} то он берет 4 и 242 в две строки.
 
  • Спасибо
Реакции: LightWood

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 880
Баллы
113
(?<=Найден\ ).*?(?=\ человек)
Ребята, пользуйтесь конструктором регулярных выражений. Он поможет решить вопросы с такими простыми регулярками.
 

dynamix

Client
Регистрация
28.12.2012
Сообщения
28
Благодарностей
1
Баллы
3
Есть текстовый файл, нужно регуляркой дергать из него куски текста до 10.000 символов. В конструкторе регулярок не нашел ничего об ограничении по количеству символов, прошу подсказать знающих.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
.{10000}
Но это ровно для 10000 символов.
 
  • Спасибо
Реакции: dynamix

dynamix

Client
Регистрация
28.12.2012
Сообщения
28
Благодарностей
1
Баллы
3
ок, а до 10000 можете написать?
 

propipes

Client
Регистрация
20.02.2012
Сообщения
13
Благодарностей
4
Баллы
3
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 880
Баллы
113
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>
Находите нужный текст регуляркой чтото вроде этой http.*">.*
вставляете полученный текст в переменную (к примеру text)
Дальше через Операции над текстом - замена, заменяете переменную {-Variable.text-} на <a href="{-Variable.text-}</a>
 

igorello

Новичок
Регистрация
14.07.2013
Сообщения
1
Благодарностей
0
Баллы
1
Как обрезать количество символов (беру всего 1 строку из файла)?
http://yandex.ru, а нужно yandex.ru
 

sdrem71

Client
Регистрация
09.09.2012
Сообщения
7
Благодарностей
0
Баллы
0
Подскажите регулярное выражение, чтобы искало все, что оканчивается на 2 именно в конце строки.
 

diomidov

Client
Регистрация
13.07.2011
Сообщения
38
Благодарностей
3
Баллы
8
  • Спасибо
Реакции: sdrem71

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
  • Спасибо
Реакции: sdrem71

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Последнее редактирование:

sdrem71

Client
Регистрация
09.09.2012
Сообщения
7
Благодарностей
0
Баллы
0

sdrem71

Client
Регистрация
09.09.2012
Сообщения
7
Благодарностей
0
Баллы
0
Спасибо. Все работает, просто скопировал с пробелом на конце!:D
 

СТЕПАН

Moderator
Регистрация
17.03.2013
Сообщения
951
Благодарностей
352
Баллы
63
Доброго времени!

Столкнулся с задачей

<span class="row_title">Группа:</span>
<span class="row_data">Пользователь</span>

<span class="row_title">Email:</span>
<span class="row_data">[email protected]</span>

<span class="row_title">ICQ:</span>
<span class="row_data">123123123</span>
Подскажите рег выр для парсинга только одного слова "Пользователь" <span class="row_data"> эти границы </span> повторяются как до так и после и в каждом случае количество их разное
 

СТЕПАН

Moderator
Регистрация
17.03.2013
Сообщения
951
Благодарностей
352
Баллы
63
Понимаю что всегда перед искомым тексто будет это

<span class="row_title">Группа:</span>
<span class="row_data">

а после всегда это

</span>

но какой символ (оператор использовать тут)

<span class="row_title">Группа:</span>
<span class="row_data">

не могу понять так как получается две строки а рег выр пишется в одну подскажите что нужно написать вот сюда чтоюы оно разаботало?

(?<=Группа:</span>ВОТ сюда<span class="row_data"> )[\w\W]*?(?=</span>)
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)