Diversité & Originalité du Rap FR

On a classifié 958 artistes de rap et rnb français selon l'originalité et la diversité de leur vocabulaire

2023-11-17

Rap FR

Plusieurs études ont été faites sur l’étendue de la diversité de vocabulaire des rappeurs français, on se devait d’avoir la notre, et pour celle là on a vu grand : On a classifié 958 artistes de rap et rnb français selon leur originalité et la diversité de vocabulaire.

👉 Passe ta souris sur le graph pour dévoiler le nom des artistes, recherche ton artiste préféré, et double clique pour accéder à leur page genius

Pour ceux qui nous suivent depuis longtemps, ces mesures vont vous être assez familières, pour les autres on vous explique tout ça

📊 Les données

On a premièrement attribué ses lyrics à chaque artiste. Ça peut paraitre facile, mais la tâche s’avère difficile quand il s’agit de featurings, ou si l’artiste fait partie d’un ou plusieurs groupes.

Les lyrics sont ensuite traités par des algorithmes pour réduire tous les mots à leur racine (de pluriel à singulier, de conjugué à infinitif). Ainsi les mots “chanté” “chantera” “chantes” seront tous compté sous le même verbe “chanter”

Les déterminants (le, la) et pronoms (je, tu) on ensuite été supprimés, car peu intéressants dans le cadre de l’étude du vocabulaire


🌎 La Diversité

La diversité est mesurée comme la proportion de mots uniques parmi les 7000 derniers mots (traités) de chaque artiste.

Pourquoi 7000 ? Parce que ça représente en moyenne 30-40 morceaux, cela nous permet d’intégrer un grand nombre d’artistes. Pourquoi les derniers mots ? Pour comparer les artistes sur la partie la plus récente de leur carrière. Pourquoi pas directement le faire sur les 30 derniers morceaux ? Pour éviter le biais induit par la longueur des morceaux : un morceau long aura inévitablement une plus grande variété de vocabulaire qu’un petit.

⬅️ On retrouve à gauche les artistes à répétition, à refrains

➡️ Et à droite les artistes à couplet, à textes


⭐ L'Originalité

Ici c’est un peu plus complexe. L’originalité est définie comme la proportion de mots originaux parmi les 500 mots qui caractérisent le plus chaque artiste.

Qu’est-ce qu’un mot original ? Simplement un mot qui n’est pas compris dans les 500 mots caractérisants le plus le rap français. On a pu calculer ces derniers à partir de tous les artistes de l'étude.

Par exemple dans ces mots caractéristiques de SCH :

mathafack, mère, puto, scélérat, glock, fric


3 sont originaux :

mathafack, puto, scélérat

Et 3 font parti des mots classiques du rap fr :

mère, glock, fric


⬆️ On retrouve en haut les artistes à vocabulaire atypique

⬇️ Et en bas les artistes aux lyrics classiques


⚠️ Disclaimer

Ce classement n’est pas un jugement de valeur, mais plutôt une visualisation chiffrée de différents modes d’écriture. Il représente des tendances, mais le classement exact peut changer selon la méthode utilisée.

💡 Interprétation

En jouant avec le curseur de date, on se rend compte assez facilement que les générations récentes se déportent dans coin supérieur gauche du graphique. La production de morceaux plus entrainant, les morceaux qui rétrécissent, et les artistes qui privilégient l'improvisation en studio, ou encore la volonté de se démarquer peuvent expliquer cette dynamique.

🖊️ Rédigé et développé par Robin Petite & Max Minerz
⬇️ Partager cet article :

_______

Rejoins notre équipe de rédacteurs !

Message reçu ! On revient vers toi très vite
Oops! Something went wrong while submitting the form.