у меня есть рандомизатор PDF, на днях добавил к нему генерацию мета-данных:Заголовок,Автор,Тема,Ключевые слова,Создан,Изменен,Приложение,Производитель.
Теперь с одной группы собирает не более 2000 почт.
В крайнем update v.1.12 добавил режим "собрать активных участников" - парсинг с постов в группе тех, кто лайкнул или оставил комментарий. Можно выбирать временной интервал, когда была опубликована запись: за сутки, неделю, месяц...
Также вынес...
//дата создания
System.IO.File.SetCreationTime(@"c:\file.txt", new DateTime(2016, 3, 25));
//дата изменения
System.IO.File.SetLastWriteTime(@"c:\file.txt", new DateTime(2016, 3, 25));
Всем отписал.
Для тех, кто еще не может писать в лс тут на форуме, есть другие контакты:
skype: vebposter, telegram: @Vebposter, e-mail:[email protected]
Актуальна. Ответил в ЛС.
Все, кто еще не может писать в лс тут на форуме, есть другие контакты:
skype: vebposter, telegram: @Vebposter, e-mail:[email protected]
Такой возможности в парсере нет. Есть отдельная программка для разбиения полученного файла-csv по словарю имен.
Отдам вместе с парсером. При желании можно самим пополнять словарь с женскими и мужскими именами.
Программа-парсер объявлений по любым поисковым ссылкам (с поддержкой любых критериев).
Основные возможности
Многопоточность — есть возможность парсить страницы каждой "поисковой ссылки" параллельно в несколько потоков, что увеличивает скорость сбора данных.
Поддержка прокси (http/socks5)...
2 разных прогона по одной большой группе дадут результаты немного отличающиеся. Это происходит из-за следующего. Если даже через браузер зайти несколько раз в группу больше 500к, например, то кол-во участников будет разное. Соответственно распределение по страницам периодически меняется. Кто-то...