Регулярные выражения работа с текстом

reyDD

Client
Регистрация
05.11.2013
Сообщения
85
Благодарностей
4
Баллы
8
Всем привет. Есть задача подготовить текстовку для дорвея. Сделал почти все, есть затык с двумя моментами:

1) заменить текст, где после запятой сразу идет текст без пробела (типа ,текст ---- на , текст)
2) Удалить из списка предложений те предложения, внутри которых встречается два и более русских слова с большой буквы (не вначале предложения, потому что оно и так начинается с большой буквы).

Может кто знает, как сделать или видел готовые решения в нет? Я просидел 3 часа и понял, что так могу еще неделю экспериментировать :-)
 

kirl0g

Client
Регистрация
19.02.2016
Сообщения
67
Благодарностей
14
Баллы
8
Всем привет. Есть задача подготовить текстовку для дорвея. Сделал почти все, есть затык с двумя моментами:

1) заменить текст, где после запятой сразу идет текст без пробела (типа ,текст ---- на , текст)
2) Удалить из списка предложений те предложения, внутри которых встречается два и более русских слова с большой буквы (не вначале предложения, потому что оно и так начинается с большой буквы).

Может кто знает, как сделать или видел готовые решения в нет? Я просидел 3 часа и понял, что так могу еще неделю экспериментировать :-)
По первой я бы сначала нашел все запятые с пробелом и заменил бы их на просто запятые
А потом заменил бы все запятые на запятые с пробелом)
 
  • Спасибо
Реакции: reyDD

reyDD

Client
Регистрация
05.11.2013
Сообщения
85
Благодарностей
4
Баллы
8
Шикарно, спасибо. Сейчас так и сделаю :-)
 

kirl0g

Client
Регистрация
19.02.2016
Сообщения
67
Благодарностей
14
Баллы
8
А со второй как вариант брать текст брать текст от точки до точки, загружаем в переменную А
Там брать слова (поиск от пробела до пробела) - Переменная Б
Если переменная А содержит две переменных Б , первая буква которой заглавная - ищем новую переменную А
Если содержит только одну - записываем в файл

Код для проверки на содержания букв верхнего регистра
(?=.*?[A-Z])
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 607
Благодарностей
4 599
Баллы
113
А со второй как вариант брать текст брать текст от точки до точки, загружаем в переменную А
Там брать слова (поиск от пробела до пробела) - Переменная Б
Если переменная А содержит две переменных Б , первая буква которой заглавная - ищем новую переменную А
Если содержит только одну - записываем в файл

Код для проверки на содержания букв верхнего регистра
(?=.*?[A-Z])
не думаю, что такая рега потянет
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)