Помогите регулярку составить

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Привет, что-то не получается регулярку составить, помогите пожалуйста :-)
Есть следующий текст
'param pam pam', '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>'
Нужно выпарсить это - ' но только которые находятся в <p> </p>
 
Последнее редактирование:

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 254
Благодарностей
220
Баллы
63
Привет, что-то не получается регулярку составить, помогите пожалуйста :-)
Есть следующий текст
'param pam pam', '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>'
Нужно выпарсить это - ' но только которые находятся в <p> </p>
А обычная регулярка на <p> </p> и взять несколько совпадений в список не пойдет?
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
А обычная регулярка на <p> </p> и взять несколько совпадений в список не пойдет?
Не очень понял :-)
Такую подобрал (?<=[a-z])'.*?(?=[a-z]) с выше указанным текстом норм работает но в оригинале что-то не так... щас попробую пример выложить...
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Хотя и выше указанная регулярка тож не работает как надо )
Вот сбор символов еще заковыристие
Код:
'param pam pam',  '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>' i', '', 'param pam pam', '<p></p> 'publish', 'publish',
Вот с ниво нужно поробовать вытащить то что нужно по условию в первом посте.
 
Последнее редактирование:

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Код:
(?<=<p>).*?(?=</p>)
В состав Project Maker'a входит конструктор регулярных выражений.

Пользуйтесь поиском, - на форуме подобные вещи обсуждались бесчисленное количество раз: http://zennolab.com/discussion/threads/reguljarnoe-vyrazhenie.18824/#post-121041
)))) Вы немного не правильно прочитали 1-ый пост нужно выпарсить одинарный кавычки из <p></p> а не текст :-)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
я до сих пор не понимаю что нужно
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
нет.
выпарсить это значит удалить что ли?
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113
:-)
Нужно выпорсить все одинарные кавычки из текста которые находится в следующих html тегах <p></p>
Понятно? :-)
Нет. Непонятно.
Проблема в том, что непонятна цель подобной задачи.
А значит налицо ошибки или логики, или терминологии.
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
нет.
выпарсить это значит удалить что ли?
:-)
Нужно обработать регулярным выражением следующие
Код:
'param pam pam',  '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>' i', '', 'param pam pam', '<p></p> 'publish', 'publish',
что бы получить все одинарные кавычки в html тегах <p></p>
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Нет. Непонятно.
Проблема в том, что непонятна цель подобной задачи.
А значит налицо ошибки или логики, или терминологии.
Вы далеко заглядываете, здесь не та задача где требуется дальновидность.

Нужно просто обработать регулярным выражением строку и в результате работы регулярного выражения получить результат.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
вы будете смеятся, но понятнее не стало.
мне кажется если бы в первом посте написали что дано и что желаете получить (конкретно а не на словах), то никаких дополнительных объяснений было бы не нужно.
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113
Если делать как вы описали, то сначала нужно спарсить блоки <p>.*?</p> со страницы, а потом уже в них парсить ' в список. И брать количество элементов.

Но не факт, что вы правильно объяснили, а я - правильно понял суть задачи.

Телепаты в отпуске :-)
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
вы будете смеятся, но понятнее не стало.
мне кажется если бы в первом посте написали что дано и что желаете получить (конкретно а не на словах), то никаких дополнительных объяснений было бы не нужно.
вы прикалываетесь ))))
Я понял урок :-) спасибо. Буду стараться в будущем отделять писанину от кода )
Здесь задачу надеюсь понятно описал http://zennolab.com/discussion/threads/pomogite-reguljarku-sostavit.18862/#post-121358
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
пример понятной описанной задачи:

Код:
дано: total 23 apples
нужно выпарсить: 23 apples
при этом цифры всегда меняются.
вот тут сразу понятно что надо.
может @zortexx угадал?)
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Если делать как вы описали, то сначала нужно спарсить блоки <p>.*?</p> со страницы, а потом уже в них парсить ' в список. И брать количество элементов.

Но не факт, что вы правильно объяснили, а я - правильно понял суть задачи.

Телепаты в отпуске :-)
Они всегда в отпуске :-)
Нет, такой вариант решения проблемы не подходит т.к есть список и его нужно почистить от одинарных кавычек - это апострофы которые находятся в html тегах <p></p>
Вот из списка пример одной строчки:
Код:
'param pam pam',  '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>' i', '', 'param pam pam', '<p></p> 'publish', 'publish',
ZP и PM я не собираюсь использовать для решения выше описанной задачи, мне подходит обычный notepad.
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
пример понятной описанной задачи:

Код:
дано: total 23 apples
нужно выпарсить: 23 apples
при этом цифры всегда меняются.
вот тут сразу понятно что надо.
может @zortexx угадал?)
Блина ))))))))))))))))))) да ну вас )))))))))))))))) :-)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
я правда не шучу)
давайте)
я прям онлайн и обновляю страницу)
помогу как пойму чего надо) обещаю) прям сразу)
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
пример понятной описанной задачи:

Код:
дано: total 23 apples
нужно выпарсить: 23 apples
при этом цифры всегда меняются.
вот тут сразу понятно что надо.
может @zortexx угадал?)
Хотя :-)

Условие:

дано:
Код:
'param pam pam',  '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>' i', '', 'param pam pam', '<p></p> 'publish', 'publish',
нужно выпарсить: '
при этом нужно выпарсить апострофы которые находятся в html тегах <p></p>.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
выпарсить это значит удалить? или собрать в список? зачем? посчитать? я спрашивал уже выше.
потому что выпарсить и удалить это разные вещи, но у меня прям ощущение что это имеете ввиду.
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113
Они всегда в отпуске :-)
Нет, такой вариант решения проблемы не подходит т.к есть список и его нужно почистить от одинарных кавычек - это апострофы которые находятся в html тегах <p></p>
Вот из списка пример одной строчки:
Код:
'param pam pam',  '<p>I just can't. Bob's your uncle.</p><p>I'm not.</p>' i', '', 'param pam pam', '<p></p> 'publish', 'publish',
ZP и PM я не собираюсь использовать для решения выше описанной задачи, мне подходит обычный notepad.
Ну, значит @rostonix угадал:
upload_2015-3-24_17-49-19.png

То есть, вам нужно просто в Notepad++ при помощи регулярных выражений удалить знак одинарных кавычек ' (или апостроф) встречающийся между тегами <p></p>. Так?
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
ааааа .
ну тогда никак наверное. я хз как регулярку такую подобрать чтобы она не брала ничего вне <p></p> блоков
вот так не пашет, что логично.
(?<=<p>.*?)'(?=.*?</p>)
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
выпарсить это значит удалить? или собрать в список? зачем? посчитать? я спрашивал уже выше.
потому что выпарсить и удалить это разные вещи, но у меня прям ощущение что это имеете ввиду.
Ну, значит @rostonix угадал:
Посмотреть вложение 7621

То есть, вам нужно просто в Notepad++ при помощи регулярных выражений удалить знак одинарных кавычек ' (или апостроф) встречающийся между тегами <p></p>. Так?
У меня значит не понятно :-) а у это человека сразу понятно :-)



upload_2015-3-24_13-57-34.png


При обработки регулярным выражением мне нужно получить результат как на скрине :-)
upload_2015-3-24_14-0-42.png
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
тогда это не соответствует задаче
на скрине берутся кавычки в том числе и те которые лежат вне блоков <p>
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
тогда это не соответствует задаче
на скрине берутся кавычки в том числе и те которые лежат вне блоков <p>
да это просто пример что нужно получить при обработке регуляркой :-)
 

botovod

Client
Регистрация
04.04.2014
Сообщения
170
Благодарностей
126
Баллы
43
Не знаю зачем вам это, попробуйте это рег выр.
(?<=<p>[^<>]*)'
 
  • Спасибо
Реакции: Aleksandr и rostonix

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)