RESTful сервис для извлечения текста из PDF файлов на python
Pdf файл и извлекается в плоский обычный текст, с разбиением на страницы потом вызывается сервис для индексирования документа в базу данных.
При индексировании используется морфология для приведению слов к начальной форме, затем делается статистика, считается количество слов в документе и на каждой странице.
Создается общая база в которой написано сколько встречается слов в тексте
Необходимо выполнить на python в виде рест сервиса
К часам 10 у меня будет Исходник программы которая достает текст
Координаты сервиса который индексирует
И описание рест апи этого сервиса
Можете предложить свою цену за проект!