¿No te pasa que solo por el nombre de un grupo de música ya te imaginas su estilo? En un grupo de black metal, por ejemplo, se presupone un nombre que inspire miedo y oscuridad. En cambio, en uno de pop, se espera un tono más alegre, despreocupado y pegajoso. En una banda clásica de power pop, la primera palabra será the. Por lo general los artistas de música electrónica suelen ser individuos conocidos por su nombre y apellido, o como mucho su apodo. En cambio, los psicodélicos suelen tener nombres artísticos más largos, complejos, evocadores.
¿Será mi hipótesis cierta? ¿Podría el nombre de un grupo de música decirnos algo de su estilo? ¿O será que estoy generalizando demasiado? Recurramos a los datos que, en un principio, no deberían engañar. Analicemos los nombres de los 5.267.649 discos y 2.336.700 artistas registrados en mi base de datos.
La idea es generar un corpus a partir de los nombres de los artistas y discos. Luego, con una herramienta de procesamiento de lenguaje natural, analizar la frecuencia de las palabras y las combinaciones de palabras más comunes. De esta manera, podríamos inferir si hay una relación entre el nombre de un grupo de música y su estilo.
Para ello, primero necesitamos limpiar los datos, añadiendo al conjunto de palabras vacías (_stop words_), vocablos extras, como featuring, edition, remastered, los nombres de los sellos discográficos, los nombres de los productores o años de publicación. Ha sido con diferencia la tarea que más tiempo me ha llevado, requiriendo de varias iteraciones. Luego, con la ayuda de un script de Python, he generado un corpus con los nombres de los artistas y discos. Por último, con la librería NLTK, analizo la frecuencia de las palabras y las combinaciones de palabras más comunes.
Estos son los géneros que he escogido para el análisis:
- Indie
- Rock
- Electronic
- Pop
- Punk
- Folk
- Blues
- Metal
- Country
- Latin
- Psychedelic
- Reggae
- Hip-hop
- Power pop
Al final del artículo encontraréis adjuntados los datos en formato CSV. Aquí os dejo algunos análisis, tras lo cuales propondré algunos nombres de artistas y discos inventados a partir de los resultados obtenidos.
Palabras más comunes en los nombres de artistas independientemente del género
Nota: es llamativo que los resultados de las columnas de total géneros para las palabras más comunes en los nombres de artistas y discos sean iguales. He revisado los datos y el código y no encuentro error alguno.
Palabra | Total géneros |
---|---|
the | 14 |
band | 13 |
black | 12 |
club | 12 |
little | 11 |
love | 11 |
new | 11 |
john | 10 |
young | 10 |
blue | 9 |
Resumen de palabras por género en nombres de artistas
Género | Número de palabras | Palabras exclusivas | Porcentaje de palabras exclusivas |
---|---|---|---|
Latin | 50 | 32 | 64.0 |
Reggae | 50 | 23 | 46.0 |
Metal | 50 | 20 | 40.0 |
Power pop | 50 | 14 | 28.0 |
Hip-hop | 50 | 13 | 26.0 |
Palabras más comunes en los nombres de discos independientemente del género
Palabra | Total géneros |
---|---|
the | 14 |
love | 13 |
no | 12 |
time | 12 |
one | 11 |
you | 11 |
night | 11 |
new | 10 |
day | 10 |
blue | 9 |
Resumen de palabras por género en títulos de álbumes
Género | Número de palabras | Palabras exclusivas | Porcentaje de palabras exclusivas |
---|---|---|---|
Latin | 50 | 41 | 82.0 |
Reggae | 50 | 18 | 36.0 |
Metal | 50 | 15 | 30.0 |
Psychedelic | 50 | 15 | 30.0 |
Blues | 50 | 8 | 16.0 |
Artistas y discos inventados (seguro que alguno ya existe)
- Indie
- Artista: Ghost Moon
- Disco: Wild Bear
- Rock
- Artista: The Green Machine
- Disco: The Little Summer House
- Electronic
- Artista: DJ Van Daniel
- Disco: Future Sound Dream
- Pop
- Artista: Young Boys Project
- Disco: Come to the Lost Dance
- Punk
- Artista: Dead Eyes Youth
- Disco: Fuck the War
- Folk
- Artista: Little Jim Family
- Disco: Long Road to the Sea
- Blues
- Artista: Johnny King
- Disco: Baby got the Boogie
- Metal
- Artista: Beyond the Dead Dawn
- Disco: Shadows of Nothing
- Country
- Artista: Brown Mountain Trio
- Disco: Last American Town
- Latin
- Artista: Conjunto Torres
- Disco: En Vivo por la Vida
- Psychedelic
- Artista: Electric Mind
- Disco: Space Theater
- Reggae
- Artista: Mighty King Winston
- Disco: Black Babylon
- Hip-hop
- Artista: Fresh Money Gang
- Disco: Get da Pack
- Power pop
- Artista: The City Boys
- Disco: Lost Days
Insights interesantes:
Ocurrencias por temática
Estaciones:- Summer: 8 ocurrencias
- Winter: 2 ocurrencias
- Spring: 0 ocurrencias
- Autumn: 0 ocurrencias
- Fall: 1 ocurrencia
- New: 22 ocurrencias
- Old: 5 ocurrencias
- Young: 6 ocurrencias
- Good: 14 ocurrencias
- Bad: 4 ocurrencias
- Life: 15 ocurrencias
- Death: 9 ocurrencias
- Dead: 11 ocurrencias
- Alive: 0 occurrencias
«Verano» es la estación más popular mencionada, siendo «Invierno» y «Otoño» mucho menos comunes. «Primavera» y «Otoño» no aparecen en absoluto. Tanto «Caliente» como «Frío» se mencionan por igual, y «Cálido» y «Frío» no aparecen. Por lo visto «Nuevo» es significativamente más común que «Viejo» y «Joven», y «Bueno» se menciona con mucha más frecuencia que «Malo», mientras que «Mejor» y «Peor» no se aparecen. Aunque «Vida» es más común que «Muerte», «Muerto» también se menciona con frecuencia. «Vivo» no aparece en absoluto curiosamente.