Los países tienen afinidades/intereses etc… que pueden condicionar las votaciones de Eurovisión. El “prestigioso” diario Marca se hace eco aquí de esta hipótesis. En el artículo se cita a @picanumeros que ha trabajado el tema. Puedes ver su análisis en este hilo de twitter.
Una imagen de WikiCommons de la 3ª edición del festival en la que aparece Domenico Modugno
Figure 1: Domenico Modugno
Por mucho que me empeñe yo cuesta incorporar ecuaciones a un informe sobre Eurovision, pero aquí tenemos una ecuación inline, \(A(L)=(I_{K}-A_{1}L^{1}- ... -A_{p}L^{p})\) , más abajo una ecuación independiente:
Antes de iniciar el análisis cargamos los paquetes de R que usaremos, solo que no vas a ver el chunk en el output final porque hemos puesto #| include: false.
Descargamos datos de Eurovision con este chunk de código:
Rows: 56312 Columns: 8
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (6): semi_final, edition, jury_or_televoting, from_country, to_country, ...
dbl (2): year, points
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Análisis
La verdad es que con esos datos se podrían hacer algún análisis más, por ejemplo tenemos el orden de aparición: igual el orden en el que cantas influye en las votaciones; pero vamos a replicar el análisis de @juliasilge@fosstodon.org
Vamos a utilizar técnicas de clustering implementadas en el paquete widyrSupondremos que hay 4 clusters.
#- clustering -----set.seed(234)eurovision_clusters <- eurovision_votes %>%# dimensionality reduction with SVD: https://www.youtube.com/watch?v=UyAfmAZU_WI widyr::widely_svd(from_country, to_country, points, nv =24) %>%#- combination of SVD and k-means: https://www.researchgate.net/publication/284617182_Combination_of_Singular_Value_Decomposition_and_K-means_Clustering_Methods_for_Topic_Detection_on_Twitter widyr::widely_kmeans(from_country, dimension, value, k =4)