Парсинг сайта Last.fm
Информация нужна в следующем виде:
Фото из профиля - main_.jpg, index.html и файл json:
Структура:
|_folder_name_user
| |_ file index.html
| |_ file main_.jpg
| |_ file info.json
| |_ source: last.fm
| |_ url: link profile
| |_ name: name
| |_ info: info
| |_ dob: YYYY-MM-DDT00:00:00 (для людей) (если есть)
| |_ dod: YYYY-MM-DDT00:00:00 (дата смерти, для людей)
| |_ years active: YYYY-YYYY (для групп и людей)
| |_ born In: city (для людей)
| |_ born In: state/region (для людей)
| |_ born In: country (для людей)
| |_ founded In: city (для групп)
| |_ founded In: state (для групп)
| |_ founded In: country
| |_ social: [
{
name: 'instagram',
href: 'http://instagram.com/username123'
}, {
name: 'facebook',
href: 'http://facebook.com/other_username'
}, {
name: twitter',
href: 'http://twitter.com/other_username'
}
]
| |_ links: [url1, url2, ...]
Для каждой анкеты отдельная папка - "имя+id" (для избежания несохранения одинаковых имен).
Перечень исполнителей берется с сайта https://www.discogs.com/ru/search/?ev=em_rs&type=artist - берется название (имя) и ищется на ласт.фм. Из выдачи берется первый результат. Нужно обойти всех исполнителей. Если есть возможность спарсить всех исполнителей без сторонних сайтов - ок.
Все фото исполнителя из галереи профиля сохраняем в ту же папку. Исполнителей без фото не трогаем.