Email парсер
Не имеет значения способ реализации, это может быть как косольный/десктопный, так и веб парсер. Главное чтобы скорость обработки была приемлимая (как минимум 100 тыс строк за 1 минуту).
Парсер из трех частей.
1)
На входе список email:password (1 строка = 1 емейл:пас)
Нужно оставить в списке только те строки, в которых есть емейлы, домены первого уровня которых подходят по вайт-листу.
Этот вайт-лист можно выполнить в виде текстовика, в каждой строке которого будет домен первого уровня (.com .org .co.uk и тд), сделать его редактируемым.
Сделать выбор при сохранении результатов: либо готовым списком емейл:пас, либо списком доменов этих готовых емейлов (после символа '@ ') удалив при этом пароли, и дубли доменов, если такие есть.
пример.
Список емейл:пас
123123@ qweasd.co.kr:Gfhruvd12
47345@ fghhhh.hhh.jp:konami573
yubao@ asdfff.com:yubao198726
navarro@ network.net:Jlfdvc46
feeeweg@ asdfff.com:yrhj!er43v
zxc@ ghghghgh.com:sssss!er43v
Вайт-лист
.com
.net
результат парсинга #1
yubao@ asdfff.com:yubao198726
navarro@ network.net:Jlfdvc46
feeeweg@ asdfff.com:yrhj!er43v
zxc@ ghghghgh.com:sssss!er43v
результат парсинга #2
asdfff.com
network.net
ghghghgh.com
2)
На вход подается файл, каждая строка которого выглядит как:
домен страна (через TAB)
Домен как раз тот, который мы получили экспортировав результаты из 1 части. А страна - это Гео, в которой находится хостинг привязанный к этому домену.
Нужно оставить в списке только те строки, в которых есть домены, подходящие по вайт-листу.
Вайт-лист в виде списка стран, которые мы хотим видеть в результатах парсинга (Russia, India, Germany, и тд.; 1 строка = 1 страна); сделать его редактируемым.
Результат сохранять как список "домен страна".
пример.
Список "домен страна"
asdfff.com United States
network.net Brazil
ghghghgh.com India
Вайт-лист
United States
Russia
India
результат парсинга
asdfff.com United States
ghghghgh.com India
3)
На входе 2 файла: список email:password (1 строка = 1 емейл:пас), и Список "домен страна" (он будет выступать "вайт-листом" в этом случае)
Сравнивая домены емейлов с доменами "вайт листа", в результате нужно получить список емейл:пас, оставляя в нем только необходимые.
пример.
Список емейл:пас
yubao@ asdfff.com:yubao198726
navarro@ network.net:Jlfdvc46
feeeweg@ asdfff.com:yrhj!er43v
zxc@ ghghghgh.com:sssss!er43v
Список "домен страна"
asdfff.com United States
ghghghgh.com India
результат парсинга
yubao@ asdfff.com:yubao198726
feeeweg@ asdfff.com:yrhj!er43v
zxc@ ghghghgh.com:sssss!er43v