Как очистить текст от html тегов

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
Привет, друзья )
Подскажите пожалуйста как можно очистить файл с текстом напарсиным со страниц поиска яши от html тегов?
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
891
Баллы
113
удалить все по регулярке <.*?>
 

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43
удалить все по регулярке <.*?>
Да, но каким экшеном воспользоваться? Пробовал через "удалить строки" через баттон "удалить элементы удовлетворяющие регулярному выражению" но как ни странно он удаляет сроки )) Ткни пальцем пожалуйста какой экшен использовать
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Операции с текстом - Замена
 
  • Спасибо
Реакции: Krang, bitport и Aleksandr

Aleksandr

Client
Регистрация
04.01.2014
Сообщения
206
Благодарностей
113
Баллы
43

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Готов поспорить что был :D:az:
 
  • Спасибо
Реакции: Aleksandr

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
891
Баллы
113
Котикоаватарцы не лгут))) Говорит не было - значит не было)))))
 
  • Спасибо
Реакции: seodamage и Aleksandr

TechSavvy

Новичок
Регистрация
28.04.2014
Сообщения
11
Благодарностей
1
Баллы
3
Тьфу, а я стараюсь-пишу вопросы на английском. Сори за офтоп - какой-то сервис для разгадывания капчи встроен или можно интегрировать что-то?
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
  • Спасибо
Реакции: TechSavvy

TechSavvy

Новичок
Регистрация
28.04.2014
Сообщения
11
Благодарностей
1
Баллы
3
о! то, что нужно, спасибо!
если можно, уточню, какие из них какие

это ручные: Antigate, DeathByCaptcha, ImageDecoders
это OCR: оставшиеся 2

Поправьтесь, если ошибаюсь, пожалуйста.

Если не сможете поправить - тоже не беда, разберусь, главное - основное подсказали. Хорошего вам дня, братюни-разработчики!
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Все модули связаны с платными сервисами по распознаванию.
MonkeyEnter.dll модуль это ввод каптч вручную пользователем.
 
  • Спасибо
Реакции: TechSavvy

TechSavvy

Новичок
Регистрация
28.04.2014
Сообщения
11
Благодарностей
1
Баллы
3
Спасибо!
 

TechSavvy

Новичок
Регистрация
28.04.2014
Сообщения
11
Благодарностей
1
Баллы
3
Вообще, так, добавлю - "Ручные" это я имею в виду те, за которыми живые люди сидят. А OCR - по сути, насколько я понимаю, тот же софт. Как DeCaptcher, например. Тут спросил на всякий случай - всё-таки это вопрос уже к разрабам самого сервиса. Пока не все ответили мне просто. А вам ещё раз спасибо за помощь!
 

Prodvigay

Client
Регистрация
23.05.2015
Сообщения
37
Благодарностей
5
Баллы
8
  • Спасибо
Реакции: kolya1983

bitport

Client
Регистрация
15.10.2016
Сообщения
118
Благодарностей
14
Баллы
18

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 478
Благодарностей
8 692
Баллы
113
а как будет выглядеть регулярка которая удалит все теги кроме двух, например: <p> и </p>
может кто подскажет?:-)
<(?!p|/p|br|img).*?>
находит все теги, кроме <p></p><br><img ...>
модернизируйте эту регулярку под свои нужды..
использовать также, через Замена..
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)