1. Introducción

Vamos a utilizar R como una aplicación GIS (Sistemas de información geográfica); es decir, lo vamos a utilizar para almacenar, manipular, analizar y presentar datos geográficos o geoespaciales. GIS es un área enorme, por ejemplo, aquí tienes un listado de herramientas y paquetes para trabajar con datos espaciales en R. Hay muchísimas!!!, es un área de conocimiento en sí misma, así que sólo voy a intentar hacer una pequeña introducción a GIS con R.

Durante este tutorial usaremos distintos data.frames con geometrías de:

  • países del mundo (world)
  • CC.AA españolas (CCAA)
  • provincias españolas (Provincias)
  • municipios españoles en 2020 (municipios_2020)
  • ríos españoles (rios_espanya)
  • 4 ríos relacionados con el río Ebro (rio_ebro_4)
  • localización (longitud, latitud) de los municipios españoles (IGN_nomencla_muni)

Venga, vamos a hacer mapas con ellos!!! Sí, enseguida!! A todos nos gustan los mapas y hacer mapas con R es easy … bueno, no tan fácil, pero vamos a ello!!

Más que mapas lo que vamos a hacer es visualizar datos geoespaciales. Unos datos no se pueden considerar geoespaciales si no vienen acompañados de un CRS (Coordinate Reference System) de forma que las aplicaciones GIS puedan manipular y mostrar correctamente esos datos. Los CRS utilizan un modelo matemático para conectar los datos, las coordenadas de un objeto, con su posición física en la superficie terrestre. Un sistema de referencia de coordenadas geográficas permite que todos los puntos de la tierra puedan ser descritos como un conjuntos de coordenadas (como latitud, longitud y altitud). Diversos sistemas se utilizan para representar la tierra tridimensional en un plano o mapa bidimensional.

Los datos geoespaciales representan lugares geográficos de la Tierra y para poder representar la posición de un objeto en la Tierra necesitamos dos cosas:

  • las coordenadas del objeto

  • un sistema de referencia (CRS) para conectar esos datos con la superficie terrestre.

Un CRS consiste en modelo geométrico elipsoide de la superficie terrestre y un datum que identifica el origen y orientación de los ejes y también las unidades de medida.

Como sabéis la Tierra no es esférica y esto complica la utilización de un único CRS, de forma que se han creado unos cuantos para tratar de representar la superficie terrestre de forma adecuada.

Además, hay dos tipos de CRS: CRS geográficos y proyectados. En los sistema geográficos, el marco de referencia es el globo terráqueo y cuantos grados norte o este, está el objeto; mientras que en los sistemas proyectados, el marco de referencia es una representación plana de la Tierra (o de parte de ella). Si te interesa el tema, aquí y aquí tienes dos posts divulgativos.

Proyecciones

Como la Tierra es esférica, para hacer un mapa bidimensional (o plano) de ella, se tiene que usar algún tipo de proyección, por lo que las áreas se mostrarán más o menos distorsionadas. Por ejemplo:

p1 <- ggplot(CCAA,  aes(fill = ine_ccaa) ) + 
          geom_sf() +
          scale_fill_viridis_d(guide = "none") +
          labs(title = "Coord. geográficas")

p2 <- ggplot(CCAA,  aes(fill = ine_ccaa) ) + 
           geom_sf() + coord_sf(crs = 2154, datum = sf::st_crs(2154)) +
           scale_fill_viridis_d(guide = "none") +
           labs(title = "Lambert 93")

p1 + p2

Datos espaciales

Para poder representar adecuadamente datos espaciales, estos deben contener la información de su CRS y algunas veces hay que convertir entre CRS’s; de forma que la estructura tradicional de datos en R (los data.frames) no es adecuada para almacenar datos espaciales1. Piensa además que los datos espaciales más simples (los puntos) serían fáciles de almacenar en dos columnas de un data.frame, pero piensa en objetos espaciales más complejos como lineas, polígonos, polígonos con huecos etc… hace que para almacenar datos espaciales en R se utilicen estructuras de datos más complejas que un data.frame.

Además, para complicar un poco más las cosas, hay dos tipos fundamentales de datos geográficos: raster y vectoriales. En el curso solo vamos a ver (un poquito) los datos espaciales vectoriales.

  • Los datos ráster se almacenan como una cuadrícula de valores que se representan en un mapa como píxeles. Cada valor de píxel representa un área en la superficie de la Tierra. Los datos ráster son datos pixelados (o cuadriculados) en los que cada píxel está asociado a una ubicación geográfica específica. El valor de un píxel puede ser continuo (por ejemplo, elevación) o categórico (por ejemplo, uso del suelo). Un ráster geoespacial solo es diferente de una foto digital en que está acompañado de información espacial que conecta los datos a una ubicación en particular. Esto incluye la extensión y el tamaño de celda del ráster, el número de filas y columnas y su sistema de referencia de coordenadas (o CRS)

  • Las estructuras de datos vectoriales representan posiciones específicas en la superficie de la Tierra.

sp versus sf

En R hay 2 formas alternativas de almacenar (y de manipular) datos geográficos vectoriales: el paquete sp y el paquete sf. Las principales diferencias entre los paquetes sp y sf se derivan de la manera en que las clases sp y sf almacenan información sobre CRS, distinguen entre puntos, líneas y polígonos, y cómo conectan estos datos espaciales con datos no espaciales.

Cuando se usan estos paquetes, tanto sp como sf, proporcionan enlaces a potentes bibliotecas SIG de código abierto, como GDAL (Geospatial Data Abstraction Library: es una biblioteca de software para la lectura y escritura de formatos de datos geoespaciales, publicada bajo la MIT License por la fundación geoespacial de código abierto (Open Source Geospatial Foundation), GEOS (Geometry Engine Open Source: para operaciones de topología en geometrías) y PROJ (PROJ es una biblioteca que proporciona métodos para transformar entre sistemas de referencia de coordenadas diferentes y operaciones de proyección). Por eso cuando cargamos el paquete sf nos aparece el siguiente mensaje en la consola: Linking to GEOS 3.9.1, GDAL 3.3.2, PROJ 7.2.1

Muchos paquetes R para GIS utilizan la metodología/arquitectura proporcionada por sp, pero por varias razones la metodología implementada por el paquete el paquete sf ya es prácticamente el estándar.

Las principales razones son 4:

  1. El paquete sf implementa el estándar abierto “simple feautures” para la representación de datos geográficos vectoriales en R. Simple features es un estándar, un conjunto común de reglas, para representar las geometrías espaciales de objetos del mundo real en un ordenador, en las que se define desde cómo se almacenan los datos en el ordenador hasta qué operaciones geométricas se pueden aplicar.

  2. sf utiliza para contener/almacenar los datos espaciales una estructura muy similar a un dataframe: los spatial dataframes o sf2 , que son muy parecidos a un data frame salvo que incluyen una columna adicional, generalmente llamada geometry que almacena la información geográfica, los datos vectoriales espaciales, ya sean estos puntos, lineas, polígonos etc…

  3. Muchas de las funciones del paquete sf comienzan con st_; por ejemplo st_nearest_points(), lo que facilita su uso.

  4. las funciones de sf se integran en el tidyverse workflow. De hecho la estructura de datos que utiliza el paquete sf para almacenar datos geográficos son los objetos de tipo `sf una extensión de los data.frames, de forma que pueden ser manipulados con dplyr y graficados con ggplot2. Los objetos sf pueden almacenar datos normales (cuantitativos, cualitativos, texto) pero almacenan datos espaciales en una columna especial llamada habitualmente geometry con clase especial (sfc), y allí se almacena la información geográfica: el CRS, coordenadas y el tipo de objeto geométrico. La clase sfc tiene siete subclases para denotar los distintos tipos de objetos geométricos que se derivan del estándar sf.

  • Por ejemplo, para seleccionar geometrías usamos la función filter():
#- elegimos 4 CC.AA
zz_prov_chosen <- c("Andalucía", "Galicia", "Aragón", "Canarias", "Illes Balears")

zz_prov_1 <- Provincias %>% filter(ine_ccaa.n %in% zz_prov_chosen)
zz_prov_2 <- Provincias %>% filter(!(ine_ccaa.n %in% zz_prov_chosen))

p1 <- ggplot(zz_prov_1, aes(fill = ine_prov) ) + 
         geom_sf()  +
         scale_fill_viridis_d(guide = "none") +
         labs(title = "Coord. geográficas")

p2 <- ggplot(zz_prov_2, aes(fill = ine_prov) ) + 
         geom_sf()  +
         scale_fill_viridis_d(guide = "none") +
         labs(title = "Coord. geográficas")

p1 + p2 

  • Por ejemplo, para agrupar geometrías, en este caso las provincias españolas, usamos la función summarize()
#- creamos las geometrías de las CC.AA por agrupación de las geometrías provinciales
CCAA_2 <- Provincias %>% group_by(ine_ccaa, ine_ccaa.n) %>% summarize()

p1 <- ggplot(Provincias, aes(fill = ine_prov) ) + 
         geom_sf()  +
         scale_fill_viridis_d(guide = "none") +
         labs(title = "Coord. geográficas")


p2 <- ggplot(CCAA_2, aes(fill = ine_ccaa) ) + 
         geom_sf()  +
         scale_fill_discrete(guide = "none") +
         labs(title = "Coord. geográficas")

p1 + p2 

Bueno, pues este es toda la teoría del tutorial. Vamos a hacer gráficos!!




2. Haciendo gráficos

Primero vamos cargar un conjunto de datos espaciales del paquete rnaturalearth. Bueno, en realidad ya lo hemos cargado antes.

#- antes usaba las worlg geometies del paquete rnaturalearth, pero ...
# world <- rnaturalearth::ne_countries(scale = "medium", returnclass = "sf")
#- pero ahora prefiero utilizar las geometrias del paquete tmap,
#- las guarde en noviembre de 2021. Se cargaban así:
library(tmap) 
data(World) #- hacemos accesibles 1 df
world <- World ; rm(World)

Veamos que hay en world

class(world) #- es un sf, pero tb es un data.frame
#> [1] "sf"         "data.frame"
names(world) #- fijate que la ultima columna se llama geometry y almacena los datos espaciales
#>  [1] "iso_a3"       "name"         "sovereignt"   "continent"    "area"        
#>  [6] "pop_est"      "pop_est_dens" "economy"      "income_grp"   "gdp_cap_est" 
#> [11] "life_exp"     "well_being"   "footprint"    "inequality"   "HPI"         
#> [16] "geometry"

Los gráficos los vamos a hacer, de momento, con ggplot2. Es tan fácil como usar geom_sf(). Las siguientes 3 expresiones producen el mismo gráfico:

ggplot(data = world) + geom_sf()

ggplot(data = world, aes(geometry = geometry)) + geom_sf()

ggplot() + geom_sf(data = world, aes(geometry = geometry))

Como el mapa que hemos hecho, en realidad es un gráfico ggplot, pues ya sabemos cambiar/tunear algunas de las características del gráfico. Por ejemplo:

ggplot(data = world) + geom_sf(color = "black", fill = "lightgreen", lwd = 0.2)

Podemos poner títulos y leyendas:

p <- ggplot(data = world) + geom_sf() +
       labs(title = "Gráfico 1: Mapa del mundo",
            caption = "Datos provenientes de tmap")
p

Podemos hacer mapas de COROPLETAS: las distintas regiones se colorean de forma que muestren los valores de una variable estadística. Por ejemplo, una coropleta con la variable población(pob_est)

p + geom_sf(aes(fill = pop_est))
p + geom_sf(aes(fill = pop_est)) + scale_fill_distiller()
p + geom_sf(aes(fill = pop_est)) + scale_fill_viridis_c(option = "plasma", trans = "sqrt")


Proyecciones

Para cambiar la proyección de un objeto “sf” a otro CRS usamos la función st_transform(), o alternativamente podemos especificar directamente el CRS en el gráfico con coord_sf():

#- world2 <- st_transform(world, "+proj=laea +y_0=0 +lon_0=155 +lat_0=-90 +ellps=WGS84 +no_defs")
p + coord_sf(crs = "+proj=laea +y_0=0 +lon_0=155 +lat_0=-90 +ellps=WGS84 +no_defs") + 
     labs(subtitle = "Lambert Azimuthal Equal Area projection")


Vamos a jugar un poco con el CRS con la función coord_sf(). Hay que saber que ggplot usará el CRS de la primera capa que contenga uno. Si no hubiese ningún CRS se usa WGS84 (latitude/longitude, the reference system used in GPS).

Se puede cambiar el CRS de varias maneras:

  1. usando un **string PROJ** válido. Por ejemplo este string“+proj=laea +lat_0=52 +lon_0=10 +x_0=4321000 +y_0=3210000 +ellps=GRS80 +units=m +no_defs”` es el European-centric ETRS89 Lambert Azimuthal Equal-Area projection)

  2. usando un código SRID (Spatial Reference System Identifier)

  3. Usando un código EPGS (European Petroleum Survey Group)3

Los siguientes tres gráficos hacen lo mismo. Representan los datos del spatial.data.frame world usando the ETRS89 Lambert Azimuthal Equal-Area projection, cuyo código EPSG es 3035. Aquí tienes algunos códigos de proyecciones:

p + coord_sf(crs = "+proj=laea +lat_0=52 +lon_0=10 +x_0=4321000 +y_0=3210000 +ellps=GRS80 +units=m +no_defs ")  #- usamos PROJ string

p + coord_sf(crs = st_crs(3035))   #- usamos SRID identifier

p + coord_sf(crs = "+init=epsg:3035")  #- usamos EPSG code (mejor no usarlo xq GDAL ha deprecated esta sintaxis)
p + coord_sf(crs = st_crs(3035)) + #- usamos SRID identifier
    labs(subtitle = "(European-centric ETRS89 \nLambert Azimuthal Equal-Area projection)")


Zoom

Volvemos a la proyección nativa del conjunto de datos world y hacemos un zoom en nuestro mapa con coord_sf(). El zoom lo hacemos pare centrarnos en España y alrededores. Para hacer el zoom en realidad ajustamos los límites de los ejes del gráfico

p_esp <- p + coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)
p_esp

Con el paquete ggspatial podemos poner elementos de mapas como una Scale bar con annotation_scale() y una North arrow con annotation_north_arrow():

p_esp + 
 ggspatial::annotation_scale(location = "bl", width_hint = 0.5) +
 ggspatial::annotation_north_arrow(location = "bl", which_north = "true", 
                                   pad_x = unit(0.75, "in"), pad_y = unit(0.5, "in"),
                                   style = north_arrow_fancy_orienteering)


texto en el mapa

El mapa se ha hecho con ggplot2, así que podemos añadir, por ejemplo, texto con geom_text(); pero antes de ello, vamos a crear/calcular centroides de cada país para ver donde situamos el texto en el mapa.

world_points <- st_centroid(world, of_largest_polygon = TRUE)    #- sustituye la geometry por el centroide

De esta forma, con st_centroid() podemos calcular los centroides de cada geometría, de cada país, pero Los datos del centroide (longitud, latitud) se almacenan en la columna geometry; es decir sustituyen o eliminan las geometrías anteriores que eran los límites o fronteras de los países.

Si queremos que las geometrías originales y los centroides estén en un mismo data.frame, hemos de hacer:

world_points <- cbind(world, st_coordinates(st_centroid(world$geometry, of_largest_polygon = TRUE))) #- ahora el centroide pasa a estar en 2 columnas, llamadas X e Y, donde figuran la longitud y latitud del centroide

Lo que hacemos es fusionar los los dos data.frame’s, y el centroide pasará a estar en dos nuevas columnas llamadas X e Y, sin sustituir las geometrías de los países.

Para ver esas dos nuevas columnas (X e Y), vamos a hacer un “pequeño truco”, vamos a quitar la columna de geometrías. Esto facilita el visionado de los datos, pero lógicamente cuando vayamos a hacer el gráfico, realmente no podremos eliminar la geometry porque si no, los datos dejarían de ser datos espaciales.

#- truco para ver mejor los datos espaciales: quitar la geometría
names(world_points)
#>  [1] "iso_a3"       "name"         "sovereignt"   "continent"    "area"        
#>  [6] "pop_est"      "pop_est_dens" "economy"      "income_grp"   "gdp_cap_est" 
#> [11] "life_exp"     "well_being"   "footprint"    "inequality"   "HPI"         
#> [16] "X"            "Y"            "geometry"
zz <- world_points %>% select(name, iso_a3,  X, Y) %>%  
      st_set_geometry(NULL)  #- por si quiero ver mejor los datos del df

Hacemos el mapa con los nombres de los países con geom_text() y el nombre del Mar Mediterráneo con annotate()

p_esp + 
  geom_text(data = world_points, 
            aes(x = X, y = Y, label = name), 
            color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) +
  annotate(geom = "text", x = 5.5, y = 38, 
           label = "Mar Mediterráneo", fontface = "italic", color = "grey22", size = 4)


Tuneando del mapa

Vamos a tunear el mapa. Por ejemplo, vamos a poner el mar (en realidad al background del theme) del color aliceblue, y a los continentes les pondremos un color terroso con fill = "antiquewhite". Arreglamos un poco las grid-lines dentro del theme, y le ponemos la estrellita. No nos va a salir bonito-bonito porque los nombres de los países se van a superponer. Podríamos quitar nombres, pero otro día:

p <- p + 
  geom_sf(fill = "antiquewhite") +
  geom_text(data = world_points, 
            aes(x = X, y = Y, label = name), 
                color = "darkblue", fontface = "bold", 
                check_overlap = TRUE, size = 2) +
  annotation_north_arrow(location = "bl", which_north = "true",
                         pad_x = unit(0.75, "in"), 
                         pad_y = unit(0.5, "in"),
                         style = north_arrow_fancy_orienteering) +
  theme(panel.grid.major = element_line(color = gray(.5), linetype = "dashed", size = 0.5), 
        panel.background = element_rect(fill = "aliceblue"))
p

Hacemos otra vez un zoom con sf::coord_sf()

p + coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE) +
    ggspatial::annotation_scale(location = "bl", width_hint = 0.5)

Como nos ha quedado medio chulo, si quisiéramos guardar el mapa haríamos:

ggsave("map.pdf")
ggsave("map_web.png", width = 6, height = 6, dpi = "screen")




3. Mas tuneado

Vamos a ir modificando el mapa, no necesariamente para hacerlo más bonito, sino para ver como se pueden hacer mapas con ggplot2:

añadiendo puntos

Primero quiero añadir al mapa donde está mi pueblo y donde está Valencia, vamos que voy a añadir puntos al mapa.

Para ello, primero necesito tener la localización de estos puntos en el mapa, así que me fui a OSM, OpenStreetMap y geolocalicé los dos municipios y con esta información, voy a crear un data.frame con la long/lat de mi pueblo y de Valencia:

pueblos <- data.frame(
               nombre = c("Pancrudo", "Valencia"), 
               longitude = c(-1.028781, -0.3756572),
               latitude = c(40.76175, 39.47534) )     
pueblos
nombre longitude latitude
Pancrudo -1.0287810 40.76175
Valencia -0.3756572 39.47534
  • lo mas fácil para añadir puntos es usar geom_point()
p_esp + 
  geom_point(data = pueblos, 
             aes(x = longitude, y = latitude), 
             size = 2, color = "darkred") +
  geom_text(data = pueblos, 
            aes(x = longitude, y = latitude, label = nombre), 
            color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5)

Utilizar geom_point() es fácil y funciona, pero es más flexible convertir el data.frame a un objeto sf. Esto lo podemos hacer con la función st_as_sf(), definiendo la proyección (aquí WGS84, que es el código CRS # 4326):

pueblos_sf <- st_as_sf(pueblos, 
                       coords = c("longitude", "latitude"), 
                       crs = 4326,  #- EPSG:4326 Coordenadas Geográficas WGS84
                       agr = "constant")

Para después añadirlo como una capa más con geom_sf() a nuestro gráfico:

p_esp + geom_sf(data = pueblos_sf, size = 2, color = "darkred")

Hagamos zoom con coord_sf

p_esp + geom_sf(data = pueblos_sf, size = 2, color = "darkred") + 
        coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)

Añadiendo polígonos

La verdad es que se hace igual que con los puntos, hay que usar la función geom_sf() y a correr.

Vamos a añadir los contornos/polígonos de las CC.AA:

zz_CCAA <- CCAA %>% st_set_geometry(NULL)
p + geom_sf(data = CCAA, fill = NA) + 
      coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)

Ahora añadimos las provincias de Andalucía, PERO coloreadas según su población media por municipio. Para ello:

    1. primero cargamos datos de población
INE_padron_muni_96_20 <- pjpv.datos.01::pob_muni_1996_2020
#INE_padron_muni_96_20 <- pjpv2020.01::pjp_data_pob_mun_1996_2019
pob_andalucia <- INE_padron_muni_96_20 %>% 
                 filter(year == 2020) %>% 
                 filter(ine_ccaa.n == "Andalucía") %>%
                 group_by(ine_prov.n) %>% mutate(n_pueblos = n_distinct(ine_muni.n)) %>%
                 mutate(pob_prov = sum(pob_total, na.rm = TRUE)) %>% ungroup() %>%
                 mutate(pob_media_pueblos = pob_prov/n_pueblos) %>% 
                 select(ine_prov.n, ine_prov, pob_media_pueblos, pob_prov, n_pueblos) %>%
                 distinct() %>% ungroup()
    1. después cargamos lindes provinciales (en realidad ya los tenemos)
# Provincias <- Provincias
zz_Provincias <- Provincias %>% st_set_geometry(NULL)
    1. fusionamos los datos de población y los lines provinciales:
geo_pob_andalucia <- left_join(pob_andalucia, Provincias, by = c("ine_prov" = "ine_prov"))
geo_pob_andalucia <- left_join(pob_andalucia, Provincias)
    1. finalmente añadimos las provincias coloreadas por población al mapa:
p + geom_sf(data = CCAA, fill = NA) +
    geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
    scale_fill_viridis_c(alpha = .4) +
    geom_sf(data = pueblos_sf, size = 2, color = "darkred") +
    coord_sf(xlim = c(-15.00, 25.00), ylim = c(21, 57.44), expand = TRUE)

  • vamos añadir también 3 municipios españoles seleccionados al azar:
pueblos_3 <- IGN_nomencla_muni %>% 
             sample_n(3) %>% 
             select(NOMBRE_ACTUAL, PROVINCIA, LONGITUD_ETRS89, LATITUD_ETRS89) %>%
             st_as_sf(coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = 4326, agr = "constant", remove = FALSE)
  • Bueno, en realidad no los voy a elegir tan tan al azar:
pueblos_3 <- IGN_nomencla_muni %>% 
             filter(NOMBRE_ACTUAL %in% c("Pancrudo", "Alburquerque", "Polentinos")) %>% 
             select(NOMBRE_ACTUAL, PROVINCIA, LONGITUD_ETRS89, LATITUD_ETRS89) %>%
             st_as_sf(coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = 4326, agr = "constant", remove = FALSE)
p_esp <- p + geom_sf(data = CCAA, fill = NA) +
         geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
         scale_fill_viridis_c(alpha = .4) +
         geom_sf(data = pueblos_3, size = 2, color = "darkred") +
         ggrepel::geom_label_repel(data = pueblos_3, aes(x = LONGITUD_ETRS89, y = LATITUD_ETRS89, label = NOMBRE_ACTUAL)) +
         coord_sf(xlim = c(-10.00, 7.00), ylim = c(35, 45), expand = TRUE)
p_esp

Con los mapas y gráficos nunca se acaba!!!

Canarias no se ve. ¿La situamos en el mapa? Usaremos sf::st_bbox()

canarias <- Provincias %>% filter(ine_prov %in% c(35,38))
peninsula <- Provincias %>% filter( !(ine_prov %in% c(35, 38)) )
my_shift <- st_bbox(peninsula)[c(1,2)]- (st_bbox(canarias)[c(1,2)]) + c(-2.4, -1.1)
canarias$geometry <- canarias$geometry + my_shift
st_crs(canarias)  <- st_crs(peninsula)
peninsula_y_canarias <- rbind(peninsula, canarias)

p1 <- ggplot() + geom_sf(data = peninsula_y_canarias)
p2 <- ggplot() + geom_sf(data = peninsula) + geom_sf(data = canarias, fill = "purple") 
#coord_sf(xlim = c(-12.00, 4.00), ylim = c(33, 44), expand = TRUE)

p1 + p2 

  • hagamos zoom
ggplot() + geom_sf(data = peninsula) +
           geom_sf(data = canarias) +
           coord_sf(xlim = c(-12.00, 4.00), ylim = c(33, 44), expand = TRUE)

  • pongamos Canarias, pintada en rojo, en nuestro mapa
p_esp + geom_sf(data = canarias, fill = "red") +
         coord_sf(xlim = c(-12.00, 5.00), ylim = c(30, 44), expand = TRUE)

el río Ebro

Pues que quiero poner el Río Ebro en el mapa. Logicamente necesio los datos geográficos del rio Ebro.

#rios <- rio::import("https://github.com/perezp44/archivos_download/blob/master/rio_ebro.rds?raw=true")
zz_rios <- rios_espanya %>% st_set_geometry(NULL)
names(rios_espanya)
#> [1] "Cod_Mar"    "PfafCuen"   "PfafRio"    "Cod_Uni"    "Nom_Rio"   
#> [6] "LngTramo_m" "Long_Rio_m" "color"      "geometry"
  • Voy a situar en el mapa 4 ríos:
#- no hace falta pero
cod_rios_guenos <- c(913757, 913687, 913685, 913619)
nombre_rios_guenos <- c("Pancrudo", "Jiloca", "Jalón", "Ebro")

rios_guenos <- rios_espanya %>% filter(Cod_Uni %in% cod_rios_guenos)
ggplot(data = peninsula) + geom_sf() +
    geom_sf(data = rios_guenos, color = "lightblue", lwd = 1.3) +
    labs(subtitle = "Mapa de España con 4 ríos Güenos", color = "")
# col = sf::sf.colors(2, alpha = 0.5)

  • ¿Cómo se llamará el río pequeñín?
ggplot(data = peninsula) + geom_sf() +
    geom_sf(data = rios_guenos, color = "lightblue", lwd = 1.3) +
    geom_point(data = pueblos, aes(x = longitude, y = latitude), size = 2, color = "darkred") +
    geom_text(data = pueblos, aes(x = longitude, y = latitude, label = nombre), color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) + 
    labs(subtitle = "Mapa de España con 4 ríos Güenos", color = "")




4. Layouts

Con los mapas se pueden hacer composiciones para destacar el mensaje que se quiere mostrar. Se pueden hacer estas composiciones de varias maneras:

  • Using “grobs”, i.e. graphic objects from ggplot2, which can be inserted in the plot region using plot coordinates;

  • Usando el paquete patchwork o el paquete cowplot

names(world)
#>  [1] "iso_a3"       "name"         "sovereignt"   "continent"    "area"        
#>  [6] "pop_est"      "pop_est_dens" "economy"      "income_grp"   "gdp_cap_est" 
#> [11] "life_exp"     "well_being"   "footprint"    "inequality"   "HPI"         
#> [16] "geometry"
gworld <- ggplot(data = world) +
  geom_sf(aes(fill = income_grp)) +
  # geom_sf(aes(fill = region_wb)) +
  geom_rect(xmin = -15, xmax = 25.00, ymin = 21, 
            ymax = 57.44, fill = NA, colour = "black", size = 1.5) +
  theme(panel.background = element_rect(fill = "azure")) +
  labs(subtitle = "Mapa del mundo") +
  scale_fill_discrete(guide = "none")

gworld

g_europe <- ggplot(data = world) +
    geom_sf() +
    geom_sf(data = CCAA, fill = NA) +
    geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
    geom_sf(data = pueblos_3, size = 2, color = "darkred") +
    geom_label_repel(data = pueblos_3, aes(x = LONGITUD_ETRS89, y = LATITUD_ETRS89, label = NOMBRE_ACTUAL)) +
    coord_sf(xlim = c(-15.00, 25.00), ylim = c(21, 57.44), expand = TRUE) +
    theme(panel.background = element_rect(fill = "azure")) +
    labs(subtitle = "Mapa de Europa Occidental") +
    scale_fill_continuous(guide = "none")
g_europe

library(patchwork)
gworld + g_europe + plot_layout(widths = c(1, 2))




5. Paquete Mapview

Vamos a ver lo fácil que es hacer un mapa con el paquete mapview.

Por ejemplo, teníamos geolocalizados a Pancrudo y Valencia. Veámoslos en un gráfico con mapview()

pueblos <- data.frame(nombre = c("Pancrudo", "Valencia"), longitude = c(-1.028781, -0.3756572), latitude = c(40.76175, 39.47534)) #- ETRS89
pueblos_sf <- st_as_sf(pueblos, coords = c("longitude", "latitude"), crs = 4326, agr = "constant") #- EPSG:4326 Coordenadas Geográficas WGS84
mapview::mapview(pueblos_sf)

Otro ejemplo con las geometrías de las CC.AA, aunque es una afrenta para Pancrudo

mapview::mapview(rios)

Para ver que se puede hacer con mapview vamos a añadir alguna información a CCAA, por ejemplo el número de provincias, el número de municipios y la población total en el año 2017:

INE_padron_muni_96_20 <- pjpv.datos.01::pob_muni_1996_2020
#INE_padron_muni_96_20 <- pjpv2020.01::pjp_data_pob_mun_1996_2019
info_CCAAs <- INE_padron_muni_96_20 %>% 
              filter(year == 2017) %>% 
              #filter(poblacion == "Total") %>% 
              group_by(ine_ccaa.n) %>% 
              mutate(n_prov = n_distinct(ine_prov)) %>% 
              mutate(n_pueblos = n_distinct(ine_muni)) %>% 
              mutate(pob_CCAA = sum(pob_total, na.rm = TRUE)) %>% ungroup() %>%
              select(ine_ccaa, ine_ccaa.n, n_prov, n_pueblos, pob_CCAA) %>%
              distinct() %>% ungroup()

Juntamos el data.frame info_CCAAs con el dataframe con las geometrías `CCAA:

CCAA_con_info <- left_join(CCAA, info_CCAAs)

Y vamos a graficarlo ya con mapview:

mapview::mapview(CCAA_con_info, 
                 zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA"),
                 color = "tomato", col.regions = "purple", lwd = 3,
                 cex = "n_pueblos")
mapview::mapview(CCAA_con_info, 
                 zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA"),
                cex = "n_pueblos")

Se pueden poner varias capas:

mapview(list(CCAA_con_info, pueblos_sf), layer.name = c("CC.AA", "2 municipios chachis"))

O mejor así:

mapview::mapview(CCAA_con_info, zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA")) +
mapview::mapview(pueblos_sf) 

Y muchas mas cosas, por ejemplo Map pop-ups o Image pop-ups

  • se puede usar el operador %>% con las funciones de sf
CCAA_con_info %>% st_union %>% mapview


Integración con el paquete mapedit

Integracion con mapedit

#install.packages("mapedit")
library(mapedit)
my_map <- mapview(pueblos_sf)
drawFeatures(my_map, editor = "leafpm")   #- good

Para recuperar el mapa es mejor así:

library(mapedit)
mys_dibujitos <- editMap(mapview(pueblos_sf))
mapview(mys_dibujitos$finished)




6. Paquete leaflet

El paquete leaflet permite utilizar en R una de la librerías de JavaScript más conocidas: Leaflet.

Para abrir un mapa leaflet:

library(leaflet)
leaflet() %>% addTiles() %>% leafem::addMouseCoordinates()

Podemos centrar el mapa, decidir el nivel de zoom y ponerle marcadores y popups:

m <- leaflet() %>%
  addTiles() %>% 
  setView(lng = -1.0287810, lat = 40.76175, zoom = 6) %>% 
  addMarkers(lng = -1.0287810, lat = 40.76175, popup = "Pancrudo") %>% 
  addPopups(lng = -0.3756572, lat = 39.47534, popup = "Valencia")
m

Vamos a añadirle elementos, por ejemplo puntos, por ejemplo mis 2 municipios:

leaflet() %>% 
  addTiles() %>% # Add default OpenStreetMap map tiles
  addCircleMarkers(data = pueblos_sf)
  #leafem::addHomeButton(ext = extent(breweries91), layer.name = "pueblos")

O, por ejemplo polígonos como las CC.AA:

leaflet(data = CCAA) %>% addTiles() %>%
  addPolygons(fillColor = topo.colors(18, alpha = NULL), stroke = FALSE)

Si te ha gustado tu mapa leaflet y quieres guardarlo, puedes guardarlo como un archivo html así:

htmltools::save_html(lplot, "leaflet.html")

Se pueden hacer bastantes más cosas, por ejemplo, para hacer coropletas con leaflet puedes ir aquí. Otro ejemplo de análisis con leaflet aquí.




7. Operaciones geométricas

Las operaciones geométricas que podemos hacer con sf con datos espaciales vectoriales se pueden dividir en tres grupos:

    1. funciones que devuelven un valor que resume alguna propiedad de la geometría:

      • st_area() : calcula el area
      • st_lenght() : calcula el perímetro
      • st_distance(): calcula la distancia (entre dos geometrías)
    1. funciones que chequean si se cumple una condición:

      • En 1 geometría: st_is_valid() : chequea si la geometria es válida

      • En 2 geometrías: por ejemplo, st_intersects(A, B) chequea si dos geometrías se intersectan. Otras funciones: st_disjoint(), st_touches(), st_crosses(), st_within(), st_contains(), st_overlaps(), st_covers(), st_equals(), st_is_within_distance(), y alguna más

    1. funciones que crean una nueva geometría:

      • En 1 geométria: por ejemplo, st_centroid(): calcula el centroide. Otras funciones: st_buffer(), st_boundary() , st_convex_hull(), st_voronoi()

      • En 2 geométrias: por ejemplo, st_intersection() calcula la interseccion. Otras funciones: st_combine(), st_union(), st_difference()


7.1 Operaciones geométricas (Ejemplos)

Las 5 provincias más grandes

Vamos a colorear las 5 provincias españolas con más territorio, para ello tenemos que calcular el área con sf::st_area():

Provicias_5 <- Provincias %>% 
               mutate(area = st_area(.)) %>% 
               mutate(areakm2 = units::set_units(area, km^2)) %>% 
               arrange(desc(areakm2)) %>% 
               slice(1:5)
ggplot() + geom_sf(data = Provincias) + geom_sf(data = Provicias_5, fill = "purple")

Bien, pero mejor si ponemos el nombre de las provincias

Prov_5_centroides <- st_centroid(Provicias_5) 
Prov_5_centroides <-  cbind(Prov_5_centroides, st_coordinates(st_centroid(Prov_5_centroides$geometry)))

ggplot() + geom_sf(data = Provincias) + 
           geom_sf(data = Provicias_5, fill = "purple") +
           geom_text(data = Prov_5_centroides, 
                     aes(x = X, y = Y, label = ine_prov.n),
                     color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) +
          labs(title = "Las 5 provincias españolas más extensas", x = "", y = "") 

Distancias (a mi pueblo)

Calculemos las distancias entre puntos, por ejemplo entre los centroides de las 52 provincias españolas:

Prov_centroides <- st_centroid(Provincias) 
Prov_centroides_XY <- cbind(Prov_centroides, st_coordinates(st_centroid(Prov_centroides$geometry)))
distancias <- st_distance(Prov_centroides_XY, by_element = FALSE) #- devuelve una matriz

Quiero ver que municipio está mas lejos de mi pueblo. Cargo datos de los municipios con latitud-longitud en ETRS89:

municipios <- IGN_nomencla_muni
municipios <- municipios %>% select(COD_INE, PROVINCIA, NOMBRE_ACTUAL, LONGITUD_ETRS89, LATITUD_ETRS89)

Tengo que convertir el df a un spatial-df, y tengo que tener cuidado con el CRS que le pongo. Aquí vi que ETRS89 es equivalente a EPSG Projection 4258, así que, espero haberlo hecho bien, ya vorem:

municipios_sf <- st_as_sf(municipios, coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = st_crs(4258))

Vamos a ver que fila ocupa mi pueblo. Ocupa la fila nº 6694, así que voy a crear un df sólo con mi pueblo y luego calcular las distancias con fs::st_distance():

pancrudo_sf <- municipios_sf %>% slice(6694)
g1 <- st_geometry(municipios_sf)
g1_pancrudo <- st_geometry(pancrudo_sf) #- dejo solo la geometria

#- distancias_a_Pancrudo <- mapply(st_distance, g1, g1_pancrudo) %>% as.vector) #- con R-base
distancias_a_Pancrudo <- map2(g1, g1_pancrudo, st_distance) %>% as_vector()         #- con purrr
distancias_a_Pancrudo <- as.data.frame(distancias_a_Pancrudo)
df_con_distancias_a_Pancrudo <- bind_cols(municipios_sf, distancias_a_Pancrudo) %>% 
                                mutate(Kms = distancias_a_Pancrudo * 100) %>% 
                                arrange(Kms)

El pueblo más cercano a Pancrudo es Pozuel del Campo que está a 3.3507456, eso si, en linea recta. Por la carretera hay un poco más, según Google Maps 7,1 kilómetros. A ver si podemos calcularlo luego con R usando OSM.

El pueblo más lejano a Pancrudo, si consideramos sólo la península es Muxía en la provincia de A Coruña, que está a 851,65 kilómetros (en linea recta). En coche, según Google Maps, 924 Kms.


Municipios por los que pasa el río Ebro

Pues eso, que me apetece saber por donde pasa el Ebro y el Pancrudo.

  1. Primero cargo geometrías de los municipios españoles. Las lindes municipales provienen del paquete LAU2boundaries4spain
muni_xx <- municipios_2020 %>% st_set_geometry(NULL)
muni    <- municipios_2020

Vamos a quedarnos solo con la España peninsular:

#zz <- muni_xx %>% group_by(ine_ccaa, ine_ccaa.n) %>% count()
muni_borrar <- c("Illes Balears", "Canarias")
muni <- muni %>% filter(!(ine_ccaa.n %in% muni_borrar))
  1. Ahora los datos de ríos Pancrudo, Jiloca, Jalón y Ebro
rio_ebro_4 <- read_rds(here::here("datos",  "mapas", "Rios", "rio_ebro.rds"))

Vamos a poner todos los tramos de los 4 ríos juntos. Con summarise()

rio_ebro_4_xx <- rio_ebro_4 %>% st_set_geometry(NULL)
rio_ebro_4_x <- rio_ebro_4 %>% select(Nom_Rio, Long_Rio_m, geometry) %>% group_by(Nom_Rio) %>% summarize()

Hagamos ya un mapa de los lindes municipales, los ríos y voy a situar Pancrudo y Valencia:

theme_set(cowplot::theme_map())
p <- ggplot(muni) + 
     geom_sf(color = "grey", fill = "white", lwd = 0.01) +
     geom_sf(data = rio_ebro_4_x, color = "lightblue", lwd = 1.6) +
     geom_point(data = pueblos, aes(x = longitude, y = latitude), size = 3, color = "darkred") +
     geom_text(data  = pueblos, aes(x = longitude, y = latitude, label = nombre), color = "darkred",
                    fontface = "bold", check_overlap = TRUE, size = 2.5) +
     labs(title = "R-Mapa con 4 ríos güenos",
          caption = "Datos provenientes del paquete LAU2boundaries4spain") +  
          theme(panel.background = element_rect(fill = "aliceblue"))
p

Venga, calculamos las intersecciones con sf::st_intersects() pero antes tenemos que poner los 2 dfs en el mismo CRS:

muni_a <- muni %>% st_transform(crs = st_crs(rio_ebro_4_x))
zz_a <- st_intersects(muni_a, rio_ebro_4_x, sparse = FALSE, prepared = TRUE)

Ahora ya si seleccionamos aquellos municipios por los que pasa el Ebro. Lo hago con R-base:

muni_ebro <- muni_a[zz_a,]

Parece que hay 190 municipios por loq eu pasa el Ebro. A ver si nos sale el mapa

p + geom_sf(data = muni_ebro) +
    geom_sf(data = rio_ebro_4_x, color = "lightblue", lwd = 0.25)

No, no voy a obtener los municipios por los que pasa el rio Pancrudo. Eso está MAL!!!!




Biblio




  1. Most geocoded data created through Google Maps or other geocoding sites provides coordinates in longitude and latitude values using the WGS84 ellipsoid and thus contains a CRS equivalent to the PROJ argument +proj=longlat +datum=WGS84 or EPSG 4326. However, this information about the CRS is implicit and not contained anywhere within the data frame itself↩︎

  2. Sí, todo se llama sf!!! Tanto el paquete como el estándar que incorpora como la estructura de datos se llaman todos sf.↩︎

  3. Parece que con PROJ7 es mejor no usarlo↩︎

