Локальная работа с любыми email базами: извлечение, сбор, чистка, валидация

NetCat

Client
Регистрация
16.09.2015
Сообщения
67
Благодарностей
21
Баллы
8
Предлагаю идею шаблона для упорядочивания email баз на диске. У всех полно различных спарсенных баз, как своих так и чужих. Такой шаблон найдет и "вытащит" email

Функционал.
1. Извлечение e-mail адресов из любых локальных файлов (указание директории/диска). Минимум текстовые файлы, в идеале *.csv, *.doc, *.docx, *.txt, *.xls, *.xlsx
2. Удаление из списка по своему блеклисту (по нахождению слова в email | домен). Нужно для удаления одноразовых почт, служебных адресов и т.п.)
3. Удаление дубликатов
4. Проверка синтаксиса написания email адреса
5. Опциональные выделение в списки по маске, чтобы можно было сразу выделить домены или целые зоны

В идеале если бы еще было (с подключением списка прокси):
- проверка домена почтового адреса на существование
- проверка email адреса- поиск соответствующего домену SMTP-сервера и проверка существования учетки пользователя на нем.


По итогу шаблон позволит привести в порядок любые почтовые базы, удалив явный мусор.
-
 

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 690
Баллы
113
хех... однако.
чекер почт на домен SMTP , Порт, SSL стоит 350$, а тут бесплатно хотят :-)
особенно классно выглядит запрос на удаление дублей, один стандартный кубик из арсенала зенки *lol*
ох уж эта тяга к халяве :-)
 

NetCat

Client
Регистрация
16.09.2015
Сообщения
67
Благодарностей
21
Баллы
8

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 690
Баллы
113
Ну так тут запросы, не пройдет- не будет. И smtp это не самое главное, верно?
конечно, конечно.
самое важное это удаление дублей = 1 кубик в зенке :-)
отбор по маске = 1 кубик с регуляркой :-)
проверка синтаксиса емаил = 1 кубик с регуляркой :-)
удаление по маске = ну тут конечно сложно, придется искать по форуму снипет :-) = 1 кубик c#
ну первый пункт даже места не займет, 1 строчка во входных настройках :-)
такой сложный шаблон из 4-х кубиков будем ждать год-два :-)
ладно, проголосую за этот шаблон, ускорю создание :-)
 
  • Спасибо
Реакции: NetCat

NetCat

Client
Регистрация
16.09.2015
Сообщения
67
Благодарностей
21
Баллы
8
конечно, конечно.
самое важное это удаление дублей = 1 кубик в зенке :-)
отбор по маске = 1 кубик с регуляркой :-)
проверка синтаксиса емаил = 1 кубик с регуляркой :-)
удаление по маске = ну тут конечно сложно, придется искать по форуму снипет :-) = 1 кубик c#
ну первый пункт даже места не займет, 1 строчка во входных настройках :-)
такой сложный шаблон из 4-х кубиков будем ждать год-два :-)
ладно, проголосую за этот шаблон, ускорю создание :-)
Да верно. Я начинающий, частично я уже сделал (есть на форуме статьи,и даже частично шаблоны по функциям), но не все. Кроме того что такой шаблон интересен в плане изучения работы профессионала (как должно быть правильно организованно). Но такой файл будет еще и полезен другим клиентам, кто не делает шаблоны.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)