Нужна программа для скачивания файлов и сохранения текстового слоя.
В папке имеются архивы с html файлами страниц сайтов, на страницах есть ссылки с текстовыми документами pdf, doc, docx rtf, csv, xls, xlsx, в том числе ссылки на файлы на гугл\яндекс диске.
Нужно скачать файл, выдернуть из него текст и сохранить в архиве в виде txt файла.
Подробно о задаче: На диске есть папки, в них еще папки, в папках zip архивы, в архивах скачанные html страницы, страница содержат ссылки на файлы следующих форматов: pdf, doc, docx, rtf, csv, xls, xlsx. Читать дальше...