Удалить все кроме [regex]

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Привет всем )
Помогите пожалуйста составить регулярное выражения для текста
<h1>t</h1><p>text</p><-!kdsjflsj-><b>kkjfdk</b>
Нужно удалить из текста все кроме: <h1>t</h1> <p>text</p>

Как-то так [^А-яё ]+ но это регулярное выражение удаляет только все кроме текста
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 241
Благодарностей
5 847
Баллы
113
(<h1>.*?</p>)
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Спасибо за отзывчивость, но немного нето) составленная вами рег. выражение находит текст, начиная с h1 и заканчивая </p>
Воспринимайте, буквально задачу - удалить все кроме.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Замена (?<=</p>).* на пустоту
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Замена (?<=</p>).* на пустоту
к примеру указанному в первом посте подходит ) непонятно правда почему такое рег. выр. текст <b></b> не удаляет, непонятно... а так да, работает спасибо ) не думал что будет такой вариант ) к оригинальному тексту просто не подходит )
я думал будет что-то типо [^А-яё<p></p><h1>и т.д что захочется ]+ правда когда я так попробовал он за место тегов удаляет все кроме символов.
Может знаете как что-то подобное сделать? :-)

Оригинальный текст
HTML:
<h1>рррррр</h1>
<p>pppppppppppppp</p>

<p>okokokok</p>
<p>jkhjhjhk</p>

<p>ihyg</p>
<br>
<table class="tbl" width="100%">
  <tbody>
    <tr>hjjhj</tr>
   </tbody>
</table>
<br>
<br>
<noindex>
<!-- Яндекс.Директ -->
<script type="text/javascript">
yandex_partner_id = ;
yandex_site_bg_color = 'FFFFFF';
yandex_stat_id = 1;
yandex_ad_format = 'direct';
yandex_font_size = 1.2;
yandex_direct_type = 'horizontal';
yandex_direct_limit = 1;
yandex_direct_title_font_size = 3;
yandex_direct_title_color = '000000';
yandex_direct_url_color = 'D3D3D3';
yandex_direct_text_color = '000000';
yandex_direct_hover_color = '000000';
yandex_direct_favicon = true;
yandex_no_sitelinks = true;
</noindex>
<br>
<p>ллррлр</p>
<p>kjkjk<b>lolok</b> po0ioijjjkk</p>
 
Последнее редактирование:

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
а мне вот тоже подскажите по регулярке: нужно удалять из текста все символы: (){}[]^@!~#%^&*+-_|\/"':;.,=?>< (кроме букв и цифр) ??
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
а мне вот тоже подскажите по регулярке: нужно удалять из текста все символы: (){}[]^@!~#%^&*+-_|\/"':;.,=?>< (кроме букв и цифр) ??
Вот такая должна работать [^А-я0-9 ]+
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
у меня работает upload_2015-4-6_17-53-53.png
может как-то грязно регулярку скопировали ) ну там пробел или еще что приклеилось
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 241
Благодарностей
5 847
Баллы
113
[^А-Яа-яA-Za-z0-9\s]+
 

wizard

Client
Регистрация
04.10.2011
Сообщения
990
Благодарностей
585
Баллы
93
я бы добавил еще букву ё так как в стандартный набор А-я буква ё не входит
[^А-яA-z0-9ё\s]+
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 241
Благодарностей
5 847
Баллы
113

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28

kolya1983

Новичок
Регистрация
09.01.2016
Сообщения
7
Благодарностей
0
Баллы
1
подскажите как удалить все теги кроме тега <br> :(
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
если не подскажут регулярку, можно сначала <br> заменить на [BREAKBREAK] например)
потом регуляфркой удалить все теги, потом заменить [BREAKBREAK] обратно на <br>

Так, на всякий))
 

kolya1983

Новичок
Регистрация
09.01.2016
Сообщения
7
Благодарностей
0
Баллы
1
если не подскажут регулярку, можно сначала <br> заменить на [BREAKBREAK] например)
потом регуляфркой удалить все теги, потом заменить [BREAKBREAK] обратно на <br>

Так, на всякий))
тоже вариант , спасибо ,,,
 

kolya1983

Новичок
Регистрация
09.01.2016
Сообщения
7
Благодарностей
0
Баллы
1
подскажите еще какой регуляркой можно удалить все ссылки из текста
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 469
Благодарностей
8 691
Баллы
113
если не подскажут регулярку, можно сначала <br> заменить на [BREAKBREAK] например)
потом регуляфркой удалить все теги, потом заменить [BREAKBREAK] обратно на <br>

Так, на всякий))
так же решаю подобные задачи.. :-)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 469
Благодарностей
8 691
Баллы
113
подскажите еще какой регуляркой можно удалить все ссылки из текста
регулярка <[^>]*> удаляет все теги, в том числе и ссылки..
вернее не удаляет, а ищет, соответсвенно ее надо использовать через Замену на пустоту..
Обработка текста -> Замена (Regex)
 
  • Спасибо
Реакции: axiles и Sheikh

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)