Tout a changé et nos habitudes musicales ne pourraient pas être différentes.
Quarantaine et musique
Environ deux milliards de personnes sont maintenant en quarantaine et tous les aspects de notre vie ont changé à cause du virus. Le divertissement ne pourrait pas être différent des autres.
Netflix a connu son pic historique; les gens utilisent Zoom pour faire la fête et les médias recommandent la mise en quarantaine des listes de lecture Spotify. La couverture des playlists de quarantaine n’est pas une coïncidence. J’ai contribué à quelques-unes d’entre elles et en ai repéré des dizaines sur mon flux de médias sociaux. Les gens font beaucoup de playlists sur le thème du Coronavirus. Tout cela m’a rendu curieux. Qu’est-ce que nous écoutons pendant les périodes de Coronavirus ?
J’ai décidé de collecter des données à partir des listes de lecture Spotify contenant des termes liés à la pandémie et de les analyser. Je voulais découvrir la fréquence des chansons les plus populaires et comparer leurs caractéristiques musicales à ce que nous écoutions avant la quarantaine.
Heureusement, Spotify dispose d’une API utile. Ici, je vais décrire le processus de collecte des données et d’intégration du code.
Tout d’abord, nous allons utiliser l’API pour collecter toutes les listes de lecture qui contiennent les termes que nous voulons. J’ai recherché quatre termes, en essayant d’être aussi inclusif que possible. Les termes que j’ai utilisés pour collecter les données sont « COVID », « corona », « Quarantaine 2020 » et « Coronavirus ». La recherche a donné 7940, 9322, 9383 et 2830 résultats, respectivement. Mais le premier problème est apparu ici. Nous ne pouvons obtenir que deux mille résultats par recherche avec l’API Spotify.
La mauvaise nouvelle est que nous n’obtiendrions qu’une partie des données en raison de la limitation. Donc, tout ce dont nous parlerons sera un échantillon des données.
La bonne nouvelle est que les chiffres précédents se chevauchent, de sorte que le nombre total unique réel n’est pas si élevé, et l’échantillon sera adéquat.
Après quatre demandes, nous obtenons 7085 playlists uniques.
Regardons les playlists. En moyenne, une playlist comporte 103 chansons et un nom très créatif. Ok, peut-être que le dernier n’est pas exactement prouvé scientifiquement.
La plus grande liste de lecture contient 8846 chansons, et il n’y a aucune chance que quelqu’un les écoute toutes, la plus petite liste de lecture comprend 3 chansons.
Nous voulons maintenant utiliser l’API pour collecter des données sur les listes de lecture. Nous aimerions obtenir les chansons qu’elles contiennent et des données sur la chanson.
Après avoir exécuté le code, nous découvrons que les listes de lecture contiennent 725 824 pistes et 275 316 chansons uniques. Cela fait beaucoup de chansons et la plupart d’entre elles ne se trouvent que dans quelques listes de lecture, ce qui indique qu’elles ne sont pas pertinentes dans la situation.
Je voulais ajouter un filtre pour les données que je vais analyser plus en détail. J’ai décidé qu’un bon premier filtre serait qu’une chanson soit au moins dans 10 listes de lecture ; cela m’a donné environ 10K chansons, donc j’ai seulement rassemblé des métadonnées pour ces chansons. Les métadonnées étaient principalement des caractéristiques audio.
Une analyse plus approfondie que nous pourrions faire est de comparer les caractéristiques audio de ces chansons avec une ligne de base. J’ai décidé d’utiliser les métadonnées de la playlist Top Tracks Of 2019 à écouter sur de bonnes enceintes. Il s’agit d’un petit échantillon de ce que nous écoutions avant la crise.
J’ai utilisé des box plots pour comparer les principales caractéristiques audio de trois ensembles de données, le Top 2019, les 100 meilleures chansons de nos données et les 10 meilleures chansons de nos données.
L’ensemble de données Top 10K est massif et trop large, les dernières chansons sont seulement dans 10 listes de lecture à partir du 7k, il est donc logique d’avoir un éventail de valeurs plus large et d’être moins informatif.
Bilan ?
Nos données ont une acoustique plus faible et une énergie légèrement plus élevée, nous sommes peut-être en quarantaine, mais nous essayons de ne pas être en panne !
L’analyse de la fréquence des chansons et des caractéristiques audio a permis de découvrir des modèles très intrigants… Il semble que nous utilisions la musique pour nous aider à être positifs tout en vivant une expérience remarquablement difficile.