Бесплатно напишу регулярное выражение. Часть 2.

Severip

Client
Регистрация
17.10.2013
Сообщения
346
Благодарностей
98
Баллы
28
Просьба еще помочь с регуляркой.
Задача: по концу предложения разделить исходный текст регулярками на анонс (около 600 символов) и основную часть, т.е. сделать два текста без повторяющихся предложений.
Вот что у меня получилось:
Первая регулярка (вроде работает): \A[\w\W]{1,600}\w\.
Вторая: (?<=\A[\w\W]{1,600}\w\.)[\w\W]*\Z
начинает брать текст с "В администрации", т.е. тексты пересекаются.
Как исправить вторую, чтобы брало со слов "В сентябре" ???

Вот исходный текст:
---------------------------------

Солдат израильской армии запускает беспилотник Фото: REUTERS 2015
О срыве сделки агентству анонимно рассказал израильский чиновник, который не был уполномочен обсуждать этот вопрос под запись.
2 --> В администрации премьер-министра Нетаньяху, Минобороны Израиля и компании IAI, изготовителе БПЛА, отказались от комментариев.
Агентство пишет, что в октябре 2014 года во время визита в Израиль главы украинского МИДа Павла Климкина он заявил местным журналистам, что его страна очень заинтересована в поставках израильских беспилотников, чтобы мониторить соблюдение перемирия с ополченцами. <-- 1
? --> В сентябре
, напоминает агентство, второй канал израильского телевидения сообщал, что компания IAI договорилась о продаже Украине беспилотников, однако сделка была сорвана под давлением ее противников в правительстве Израиля.
СМИ сообщали, что сделку заблокировал МИД Израиля, опасающийся испортить отношения с Россией.
По словам научного сотрудника Института исследований национальной безопасности в Тель-Авиве Сары Файнберг, Израиль воздерживался от поставок вооружений Киеву в надежде, что Россия не будет поставлять ЗРК С-300 Ирану, но теперь собирается пересмотреть свою позицию.
Источник агентства в Израиле полагает, что Россия отказывалась поставлять зенитно-ракетные комплексы Ирану, чтобы не сорвать закупку израильских беспилотников, но, получив первые образцы этой технологии, перестала рассматривать эту сделку как сдерживающий фактор...
 

Severip

Client
Регистрация
17.10.2013
Сообщения
346
Благодарностей
98
Баллы
28
В принципе решил через автозамену, но хотелось бы, если кто знает регулярку рабочую увидеть, для общего развития.
Спасибо.
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 943
Благодарностей
4 352
Баллы
113
Не пойму почему, но регулярки
Код:
.*(?=\ )
и
Код:
(?<=\ ).*
не вырезают email из строки типа мыло@mail.ru:пароль
Мне просто нужно получить мыло (до @) и пароль.
 

Severip

Client
Регистрация
17.10.2013
Сообщения
346
Благодарностей
98
Баллы
28
Код:
.*(?=@)
(?<=:).*
 
  • Спасибо
Реакции: Astraport

kornell

Client
Регистрация
15.05.2015
Сообщения
94
Благодарностей
2
Баллы
8
Привет всем,кто может помочь с регуляркой для wordstat, точнее что бы парсить только левую колонку. У меня получается только парсить все ключи с двух колонок. Кто может помочь?
 

Gfoblin

Client
Регистрация
30.05.2013
Сообщения
4 519
Благодарностей
991
Баллы
113
Как получить каждую вторую/третью/десятую?
Есть такой список хочу удалить каждую вторую (пхп поэтому буду юзать preg_replace)
Подскажите, есть регулярки которые выдергивают только каждое второе/третье и т.д. совпадение?
<a href="/page1.html" title="page1" style="font-size:1.3em">page1</a>
<a href="/page2.html" title="page2" style="font-size:1.4em">page2</a>
<a href="/page3.html" title="page3" style="font-size:1.0em">page3</a>
<a href="/page1.html" title="page1" style="font-size:1.3em">page1</a>
<a href="/page2.html" title="page2" style="font-size:1.4em">page2</a>
<a href="/page3.html" title="page3" style="font-size:1.0em">page3</a>
<a href="/page2.html" title="page2" style="font-size:1.4em">page2</a>
<a href="/page3.html" title="page3" style="font-size:1.0em">page3</a>
<a href="/page2.html" title="page2" style="font-size:1.4em">page2</a>
<a href="/page3.html" title="page3" style="font-size:1.0em">page3</a>
<a href="/page1.html" title="page1" style="font-size:1.3em">page1</a>
<a href="/page2.html" title="page2" style="font-size:1.4em">page2</a>
<a href="/page3.html" title="page3" style="font-size:1.0em">page3</a>
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Номер совпадения используйте в экшене Операции с текстом - Regex
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Не пойму почему, но регулярки
Код:
.*(?=\ )
и
Код:
(?<=\ ).*
не вырезают email из строки типа мыло@mail.ru:пароль
Мне просто нужно получить мыло (до @) и пароль.
1. получить мыло до собаки
.*(?=@)
2. получить пароль
(?<=:-).*
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Просьба еще помочь с регуляркой.
Задача: по концу предложения разделить исходный текст регулярками на анонс (около 600 символов) и основную часть, т.е. сделать два текста без повторяющихся предложений.
Вот что у меня получилось:
Первая регулярка (вроде работает): \A[\w\W]{1,600}\w\.
Вторая: (?<=\A[\w\W]{1,600}\w\.)[\w\W]*\Z
начинает брать текст с "В администрации", т.е. тексты пересекаются.
Как исправить вторую, чтобы брало со слов "В сентябре" ???

Вот исходный текст:
---------------------------------

Солдат израильской армии запускает беспилотник Фото: REUTERS 2015
О срыве сделки агентству анонимно рассказал израильский чиновник, который не был уполномочен обсуждать этот вопрос под запись.
2 --> В администрации премьер-министра Нетаньяху, Минобороны Израиля и компании IAI, изготовителе БПЛА, отказались от комментариев.
Агентство пишет, что в октябре 2014 года во время визита в Израиль главы украинского МИДа Павла Климкина он заявил местным журналистам, что его страна очень заинтересована в поставках израильских беспилотников, чтобы мониторить соблюдение перемирия с ополченцами. <-- 1
? --> В сентябре
, напоминает агентство, второй канал израильского телевидения сообщал, что компания IAI договорилась о продаже Украине беспилотников, однако сделка была сорвана под давлением ее противников в правительстве Израиля.
СМИ сообщали, что сделку заблокировал МИД Израиля, опасающийся испортить отношения с Россией.
По словам научного сотрудника Института исследований национальной безопасности в Тель-Авиве Сары Файнберг, Израиль воздерживался от поставок вооружений Киеву в надежде, что Россия не будет поставлять ЗРК С-300 Ирану, но теперь собирается пересмотреть свою позицию.
Источник агентства в Израиле полагает, что Россия отказывалась поставлять зенитно-ракетные комплексы Ирану, чтобы не сорвать закупку израильских беспилотников, но, получив первые образцы этой технологии, перестала рассматривать эту сделку как сдерживающий фактор...
ну так у вас предшествующий текст лежит в диапазоне от 1 до 600 символов, регулярка находит ближайшее к 1це совпадение всех условий.
например, можно увеличить этот момент, подогнав к 600. (?<=\A[\w\W]{500,600}\w\.)[\w\W]*\Z - в вашем тексте будет брать то, что надо.
вообще, не очень понятное задание, если поточнее бы написали тз было бы проще.
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Привет всем,кто может помочь с регуляркой для wordstat, точнее что бы парсить только левую колонку. У меня получается только парсить все ключи с двух колонок. Кто может помочь?
исходник страницы выложите, тогда можно будет подсказать
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Привет всем,кто может помочь с регуляркой для wordstat, точнее что бы парсить только левую колонку. У меня получается только парсить все ключи с двух колонок. Кто может помочь?
посмотрел, там верстка одинаковая на обоих колонках, значит просто надо брать совпадения от 0 до 49 включительно, это будет только левая колонка
 

kornell

Client
Регистрация
15.05.2015
Сообщения
94
Благодарностей
2
Баллы
8
посмотрел, там верстка одинаковая на обоих колонках, значит просто надо брать совпадения от 0 до 49 включительно, это будет только левая колонка
Спасибо за помощь:-)
 

Mutant

Client
Регистрация
19.09.2014
Сообщения
187
Благодарностей
36
Баллы
28
... ибо туплю уже пол дня
Есть число в формате 123,456 нужно получить в итоге 123456, т.е. убрать запятую если она есть.
Запятой может и не быть, поэтому вариант просто умножить число на 1000 не подходит
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Операции с текстом - Замена
Что заменить: запятая
На что: пустота
Тип поиска text
Регулярки не нужны тут
 

DenisBY

Новичок
Регистрация
15.08.2014
Сообщения
29
Благодарностей
3
Баллы
3
Есть рандомное число из 11 символов. Надо взять от 2 до 9 символа.
т.е из 1234567891011, надо получить 23456789
 

Bot_Sculptor

Client
Регистрация
11.06.2012
Сообщения
787
Благодарностей
237
Баллы
43
  • Спасибо
Реакции: DenisBY

j1231

Client
Регистрация
25.12.2014
Сообщения
253
Благодарностей
23
Баллы
18
Выручайте с контактом не могу получить регуляркой число подписчиков вернее могу но когда число меньше трех символов если например 999 все ок
<span class="fl_r thumb"></span><span class="fl_r">10</span>Подписчики(10 подписчиков) сама регулярка (?<=<span\ class="fl_r">).*?(?=</span>Подписчики)
Но как только подписчиков становится тысячи число на странице разбивается
<span class="fl_r">3<span class="num_delim"></span>398</span>Подписчики(3398 подписчиков) результат обработки 3<span class="num_delim"> </span>398. Помогите у меня ах голова разболелась :-))
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Так потом просто обработайте еще операциями с текстом - Замена. И удалите пробелы и <.*?> По регулярке
 
  • Спасибо
Реакции: j1231

j1231

Client
Регистрация
25.12.2014
Сообщения
253
Благодарностей
23
Баллы
18
Кароче во ваще я тупняк в верхнем поле обработка текста забыл указать переменную со спаршеным результатом по регулярке. Rostonix вездесущий ты наш :-) чеб я без тя делал.
 

j1231

Client
Регистрация
25.12.2014
Сообщения
253
Благодарностей
23
Баллы
18
Всем еще раз привет хотел узнать можно ли в в своем коде С#
присвоить уже созданную переменную допустим есть DOM cо спаршеным по регулярке
текстом и помещенным в переменную test
Можно ли так прописть в соем коде
string text = '{-Variable.test-}' присвоится ли значение переменной text
 
Последнее редактирование:

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Код:
string text = project.Variables["test"].Value;
 
  • Спасибо
Реакции: j1231

LightWood

Moderator
Регистрация
04.11.2010
Сообщения
2 382
Благодарностей
915
Баллы
113
Хай, гайз.
Что-то туплю.
Вот регулярка:
(?<=src=").*?\.jpg(?=_)

Собственно всем понятно что она делает. Но мне нужно чтобы парсились только ссылки на картинки которые не содержат текст "nophoto".
есть такой атрибут (?!nophoto).
Воткнуть что-то правильно его никак не получается. Или как тут лучше поступить?
Хелп.
 

LexxWork

Client
Регистрация
31.10.2013
Сообщения
1 190
Благодарностей
786
Баллы
113
для строки src="nophoto.jpg подойдет такой вариант (?<=src=")(?!nophoto)\w+\.jpg
 

LmPopo

Client
Регистрация
06.12.2012
Сообщения
299
Благодарностей
136
Баллы
43
(?<=src=")((?!nophoto)\w)+\.jpg
 

Letun777

Client
Регистрация
05.07.2010
Сообщения
17
Благодарностей
1
Баллы
3
подскажите регулярку, надо удалить начиная с третьей точки
было
20.225.D0860.302
20.230.Е0780.107
стало
20.225.D0860
20.230.Е0780
 

botovod

Client
Регистрация
04.04.2014
Сообщения
170
Благодарностей
126
Баллы
43
\.\d+(?=\r\n|$)
 

Letun777

Client
Регистрация
05.07.2010
Сообщения
17
Благодарностей
1
Баллы
3

major555

Client
Регистрация
27.09.2014
Сообщения
62
Благодарностей
6
Баллы
8
Подскажите пожалуйста, как взять первый шесть символов (числа) из строки. Очень нужно. Пробую по разному, но не получается что-то. Да-да, знаю, что это должно быть элементарно. Стыжусь)
 

evgen_po

Client
Регистрация
27.08.2013
Сообщения
848
Благодарностей
528
Баллы
93
Подскажите пожалуйста, как взять первый шесть символов (числа) из строки. Очень нужно. Пробую по разному, но не получается что-то. Да-да, знаю, что это должно быть элементарно. Стыжусь)
Если там точно будет число, то можно и так
.{6}
если непонятно что, а нужно брать только из цифровой строки, то должно так работать
\d{6}
 
  • Спасибо
Реакции: major555 и ZennoScript

major555

Client
Регистрация
27.09.2014
Сообщения
62
Благодарностей
6
Баллы
8
Спасибо. Еще вот такая тема сработала ^[0-9]{6}
 
  • Спасибо
Реакции: LightWood

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)