1. Introducción
Vamos a utilizar R como una aplicación GIS (Sistemas de información
geográfica); es decir, lo vamos a utilizar para almacenar, manipular,
analizar y presentar datos geográficos o geoespaciales. GIS es un área
enorme, por ejemplo, aquí tienes
un listado de herramientas y paquetes para trabajar con datos espaciales
en R. Hay muchísimas!!!, es un área de conocimiento en sí misma, así que
sólo voy a intentar hacer una pequeña introducción a GIS con R.
Durante este tutorial usaremos distintos data.frames con geometrías
de:
- países del mundo (world)
- CC.AA españolas (CCAA)
- provincias españolas (Provincias)
- municipios españoles en 2020 (municipios_2020)
- ríos españoles (rios_espanya)
- 4 ríos relacionados con el río Ebro (rio_ebro_4)
- localización (longitud, latitud) de los municipios españoles
(IGN_nomencla_muni)
Venga, vamos a hacer mapas con ellos!!! Sí, enseguida!! A todos nos
gustan los mapas y hacer mapas con R es easy … bueno, no tan
fácil, pero vamos a ello!!
Más que mapas lo que vamos a hacer es visualizar datos
geoespaciales. Unos datos no se pueden considerar geoespaciales
si no vienen acompañados de un CRS (Coordinate
Reference System) de forma que las aplicaciones GIS puedan manipular y
mostrar correctamente esos datos. Los CRS utilizan un modelo matemático
para conectar los datos, las coordenadas de un objeto, con su posición
física en la superficie terrestre. Un sistema de referencia de
coordenadas geográficas permite que todos los puntos de la tierra puedan
ser descritos como un conjuntos de coordenadas (como latitud, longitud y
altitud). Diversos sistemas se utilizan para representar la tierra
tridimensional en un plano o mapa bidimensional.
Los datos geoespaciales representan lugares geográficos de la Tierra
y para poder representar la posición de un objeto en la Tierra
necesitamos dos cosas:
Un CRS consiste en modelo geométrico elipsoide de la superficie
terrestre y un datum que identifica el origen y orientación de
los ejes y también las unidades de medida.
Como sabéis la Tierra no es esférica y esto complica la utilización
de un único CRS, de forma que se han creado unos cuantos para tratar de
representar la superficie terrestre de forma adecuada.
Además, hay dos tipos de CRS: CRS geográficos y
proyectados. En los sistema geográficos, el marco de referencia
es el globo terráqueo y cuantos grados norte o este, está el objeto;
mientras que en los sistemas proyectados, el marco de referencia es una
representación plana de la Tierra (o de parte de ella). Si te interesa
el tema, aquí
y aquí
tienes dos posts divulgativos.
Proyecciones
Como la Tierra es esférica, para hacer un mapa bidimensional (o
plano) de ella, se tiene que usar algún tipo de proyección, por lo que
las áreas se mostrarán más o menos distorsionadas. Por ejemplo:
p1 <- ggplot(CCAA, aes(fill = ine_ccaa) ) +
geom_sf() +
scale_fill_viridis_d(guide = "none") +
labs(title = "Coord. geográficas")
p2 <- ggplot(CCAA, aes(fill = ine_ccaa) ) +
geom_sf() + coord_sf(crs = 2154, datum = sf::st_crs(2154)) +
scale_fill_viridis_d(guide = "none") +
labs(title = "Lambert 93")
p1 + p2
Datos espaciales
Para poder representar adecuadamente datos espaciales, estos deben
contener la información de su CRS y algunas veces hay que convertir
entre CRS’s; de forma que la estructura tradicional de datos en R (los
data.frames) no es adecuada para almacenar datos espaciales. Piensa
además que los datos espaciales más simples (los puntos) serían fáciles
de almacenar en dos columnas de un data.frame, pero piensa en objetos
espaciales más complejos como lineas, polígonos, polígonos con huecos
etc… hace que para almacenar datos espaciales en R se utilicen
estructuras de datos más complejas que un data.frame.
Además, para complicar un poco más las cosas, hay dos tipos
fundamentales de datos geográficos: raster y
vectoriales. En el curso solo vamos a ver (un poquito) los
datos espaciales vectoriales.
Los datos ráster se almacenan como una cuadrícula de valores que
se representan en un mapa como píxeles. Cada valor de píxel representa
un área en la superficie de la Tierra. Los datos ráster son datos
pixelados (o cuadriculados) en los que cada píxel está asociado a una
ubicación geográfica específica. El valor de un píxel puede ser continuo
(por ejemplo, elevación) o categórico (por ejemplo, uso del suelo). Un
ráster geoespacial solo es diferente de una foto digital en que está
acompañado de información espacial que conecta los datos a una ubicación
en particular. Esto incluye la extensión y el tamaño de celda del
ráster, el número de filas y columnas y su sistema de referencia de
coordenadas (o CRS)
Las estructuras de datos vectoriales representan posiciones
específicas en la superficie de la Tierra.
sp
versus sf
En R hay 2 formas alternativas de almacenar (y de manipular) datos
geográficos vectoriales: el paquete sp
y el paquete
sf
. Las principales diferencias entre los paquetes sp y sf
se derivan de la manera en que las clases sp y sf almacenan información
sobre CRS, distinguen entre puntos, líneas y polígonos, y cómo conectan
estos datos espaciales con datos no espaciales.
Cuando se usan estos paquetes, tanto sp
como
sf
, proporcionan enlaces a potentes bibliotecas SIG de
código abierto, como GDAL (Geospatial Data
Abstraction Library: es una biblioteca de software para la lectura y
escritura de formatos de datos geoespaciales, publicada bajo la MIT
License por la fundación geoespacial de código abierto (Open Source
Geospatial Foundation), GEOS
(Geometry Engine Open Source: para operaciones de topología en
geometrías) y PROJ (PROJ es una
biblioteca que proporciona métodos para transformar entre sistemas de
referencia de coordenadas diferentes y operaciones de proyección). Por
eso cuando cargamos el paquete sf
nos aparece el siguiente
mensaje en la consola:
Linking to GEOS 3.9.1, GDAL 3.3.2, PROJ 7.2.1
Muchos paquetes R para GIS utilizan la metodología/arquitectura
proporcionada por sp
, pero por varias razones la
metodología implementada por el paquete el paquete sf
ya es
prácticamente el estándar.
Las principales razones son 4:
El paquete sf
implementa el estándar abierto “simple
feautures” para la representación de datos geográficos vectoriales en R.
Simple features es un estándar, un conjunto común de reglas, para
representar las geometrías espaciales de objetos del mundo real en un
ordenador, en las que se define desde cómo se almacenan los datos en el
ordenador hasta qué operaciones geométricas se pueden aplicar.
sf
utiliza para contener/almacenar los datos
espaciales una estructura muy similar a un dataframe: los spatial
dataframes o sf
, que son muy parecidos a un data frame
salvo que incluyen una columna adicional, generalmente llamada
geometry
que almacena la información geográfica, los datos
vectoriales espaciales, ya sean estos puntos, lineas, polígonos
etc…
Muchas de las funciones del paquete sf
comienzan con
st_
; por ejemplo st_nearest_points()
, lo que
facilita su uso.
las funciones de sf
se integran en el
tidyverse workflow. De hecho la estructura de datos que
utiliza el paquete sf
para almacenar datos geográficos son
los objetos de tipo `sf
una extensión de los data.frames,
de forma que pueden ser manipulados con dplyr
y graficados
con ggplot2
. Los objetos sf
pueden almacenar
datos normales (cuantitativos, cualitativos, texto) pero almacenan datos
espaciales en una columna especial llamada habitualmente
geometry
con clase especial (sfc
), y allí se
almacena la información geográfica: el CRS, coordenadas y el tipo de
objeto geométrico. La clase sfc tiene siete subclases para denotar los
distintos tipos de objetos geométricos que se derivan del estándar
sf
.
- Por ejemplo, para seleccionar geometrías usamos la función
filter()
:
#- elegimos 4 CC.AA
zz_prov_chosen <- c("Andalucía", "Galicia", "Aragón", "Canarias", "Illes Balears")
zz_prov_1 <- Provincias %>% filter(ine_ccaa.n %in% zz_prov_chosen)
zz_prov_2 <- Provincias %>% filter(!(ine_ccaa.n %in% zz_prov_chosen))
p1 <- ggplot(zz_prov_1, aes(fill = ine_prov) ) +
geom_sf() +
scale_fill_viridis_d(guide = "none") +
labs(title = "Coord. geográficas")
p2 <- ggplot(zz_prov_2, aes(fill = ine_prov) ) +
geom_sf() +
scale_fill_viridis_d(guide = "none") +
labs(title = "Coord. geográficas")
p1 + p2
- Por ejemplo, para agrupar geometrías, en este caso las provincias
españolas, usamos la función
summarize()
#- creamos las geometrías de las CC.AA por agrupación de las geometrías provinciales
CCAA_2 <- Provincias %>% group_by(ine_ccaa, ine_ccaa.n) %>% summarize()
p1 <- ggplot(Provincias, aes(fill = ine_prov) ) +
geom_sf() +
scale_fill_viridis_d(guide = "none") +
labs(title = "Coord. geográficas")
p2 <- ggplot(CCAA_2, aes(fill = ine_ccaa) ) +
geom_sf() +
scale_fill_discrete(guide = "none") +
labs(title = "Coord. geográficas")
p1 + p2
Bueno, pues este es toda la teoría del tutorial. Vamos a hacer
gráficos!!
2. Haciendo gráficos
Primero vamos cargar un conjunto de datos espaciales del paquete rnaturalearth
.
Bueno, en realidad ya lo hemos cargado antes.
#- antes usaba las worlg geometies del paquete rnaturalearth, pero ...
# world <- rnaturalearth::ne_countries(scale = "medium", returnclass = "sf")
#- pero ahora prefiero utilizar las geometrias del paquete tmap,
#- las guarde en noviembre de 2021. Se cargaban así:
library(tmap)
data(World) #- hacemos accesibles 1 df
world <- World ; rm(World)
Veamos que hay en world
class(world) #- es un sf, pero tb es un data.frame
#> [1] "sf" "data.frame"
names(world) #- fijate que la ultima columna se llama geometry y almacena los datos espaciales
#> [1] "iso_a3" "name" "sovereignt" "continent" "area"
#> [6] "pop_est" "pop_est_dens" "economy" "income_grp" "gdp_cap_est"
#> [11] "life_exp" "well_being" "footprint" "inequality" "HPI"
#> [16] "geometry"
Los gráficos los vamos a hacer, de momento, con ggplot2
.
Es tan fácil como usar geom_sf()
. Las siguientes 3
expresiones producen el mismo gráfico:
ggplot(data = world) + geom_sf()
ggplot(data = world, aes(geometry = geometry)) + geom_sf()
ggplot() + geom_sf(data = world, aes(geometry = geometry))
Como el mapa que hemos hecho, en realidad es un gráfico ggplot, pues
ya sabemos cambiar/tunear algunas de las características del gráfico.
Por ejemplo:
ggplot(data = world) + geom_sf(color = "black", fill = "lightgreen", lwd = 0.2)
Podemos poner títulos y leyendas:
p <- ggplot(data = world) + geom_sf() +
labs(title = "Gráfico 1: Mapa del mundo",
caption = "Datos provenientes de tmap")
p
Podemos hacer mapas de COROPLETAS: las distintas
regiones se colorean de forma que muestren los valores de una variable
estadística. Por ejemplo, una coropleta con la variable
población(pob_est)
p + geom_sf(aes(fill = pop_est))
p + geom_sf(aes(fill = pop_est)) + scale_fill_distiller()
p + geom_sf(aes(fill = pop_est)) + scale_fill_viridis_c(option = "plasma", trans = "sqrt")
Proyecciones
Para cambiar la proyección de un objeto “sf” a otro CRS usamos la
función st_transform()
, o alternativamente podemos
especificar directamente el CRS en el gráfico con
coord_sf()
:
#- world2 <- st_transform(world, "+proj=laea +y_0=0 +lon_0=155 +lat_0=-90 +ellps=WGS84 +no_defs")
p + coord_sf(crs = "+proj=laea +y_0=0 +lon_0=155 +lat_0=-90 +ellps=WGS84 +no_defs") +
labs(subtitle = "Lambert Azimuthal Equal Area projection")
Vamos a jugar un poco con el CRS con la función
coord_sf()
. Hay que saber que ggplot usará el CRS de la
primera capa que contenga uno. Si no hubiese ningún CRS se usa
WGS84 (latitude/longitude, the reference system used in
GPS).
Se puede cambiar el CRS de varias maneras:
usando un
**string PROJ** válido. Por ejemplo este string
“+proj=laea
+lat_0=52 +lon_0=10 +x_0=4321000 +y_0=3210000 +ellps=GRS80 +units=m
+no_defs”` es el European-centric ETRS89 Lambert Azimuthal Equal-Area
projection)
usando un código SRID (Spatial Reference System
Identifier)
Usando un código EPGS (European Petroleum Survey
Group)
Los siguientes tres gráficos hacen lo mismo. Representan los datos
del spatial.data.frame world
usando the ETRS89 Lambert
Azimuthal Equal-Area projection, cuyo código EPSG es 3035. Aquí
tienes algunos códigos de proyecciones:
p + coord_sf(crs = "+proj=laea +lat_0=52 +lon_0=10 +x_0=4321000 +y_0=3210000 +ellps=GRS80 +units=m +no_defs ") #- usamos PROJ string
p + coord_sf(crs = st_crs(3035)) #- usamos SRID identifier
p + coord_sf(crs = "+init=epsg:3035") #- usamos EPSG code (mejor no usarlo xq GDAL ha deprecated esta sintaxis)
p + coord_sf(crs = st_crs(3035)) + #- usamos SRID identifier
labs(subtitle = "(European-centric ETRS89 \nLambert Azimuthal Equal-Area projection)")
Zoom
Volvemos a la proyección nativa del conjunto de datos
world
y hacemos un zoom en nuestro mapa con
coord_sf()
. El zoom lo hacemos pare centrarnos en España y
alrededores. Para hacer el zoom en realidad ajustamos los límites de los
ejes del gráfico
p_esp <- p + coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)
p_esp
Con el paquete ggspatial
podemos poner elementos de
mapas como una Scale bar con annotation_scale()
y
una North arrow con annotation_north_arrow()
:
p_esp +
ggspatial::annotation_scale(location = "bl", width_hint = 0.5) +
ggspatial::annotation_north_arrow(location = "bl", which_north = "true",
pad_x = unit(0.75, "in"), pad_y = unit(0.5, "in"),
style = north_arrow_fancy_orienteering)
texto en el mapa
El mapa se ha hecho con ggplot2
, así que podemos añadir,
por ejemplo, texto con geom_text()
; pero antes de ello,
vamos a crear/calcular centroides de cada país para ver donde situamos
el texto en el mapa.
world_points <- st_centroid(world, of_largest_polygon = TRUE) #- sustituye la geometry por el centroide
De esta forma, con st_centroid()
podemos calcular los
centroides de cada geometría, de cada país, pero Los datos del centroide
(longitud, latitud) se almacenan en la columna geometry
; es
decir sustituyen o eliminan las geometrías anteriores que eran los
límites o fronteras de los países.
Si queremos que las geometrías originales y los centroides estén en
un mismo data.frame, hemos de hacer:
world_points <- cbind(world, st_coordinates(st_centroid(world$geometry, of_largest_polygon = TRUE))) #- ahora el centroide pasa a estar en 2 columnas, llamadas X e Y, donde figuran la longitud y latitud del centroide
Lo que hacemos es fusionar los los dos data.frame’s, y el
centroide pasará a estar en dos nuevas columnas llamadas X e Y, sin
sustituir las geometrías de los países.
Para ver esas dos nuevas columnas (X e Y), vamos a hacer un “pequeño
truco”, vamos a quitar la columna de geometrías. Esto facilita el
visionado de los datos, pero lógicamente cuando vayamos a hacer el
gráfico, realmente no podremos eliminar la geometry porque si no, los
datos dejarían de ser datos espaciales.
#- truco para ver mejor los datos espaciales: quitar la geometría
names(world_points)
#> [1] "iso_a3" "name" "sovereignt" "continent" "area"
#> [6] "pop_est" "pop_est_dens" "economy" "income_grp" "gdp_cap_est"
#> [11] "life_exp" "well_being" "footprint" "inequality" "HPI"
#> [16] "X" "Y" "geometry"
zz <- world_points %>% select(name, iso_a3, X, Y) %>%
st_set_geometry(NULL) #- por si quiero ver mejor los datos del df
Hacemos el mapa con los nombres de los países con
geom_text()
y el nombre del Mar Mediterráneo con
annotate()
p_esp +
geom_text(data = world_points,
aes(x = X, y = Y, label = name),
color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) +
annotate(geom = "text", x = 5.5, y = 38,
label = "Mar Mediterráneo", fontface = "italic", color = "grey22", size = 4)
Tuneando del mapa
Vamos a tunear el mapa. Por ejemplo, vamos a poner el mar (en
realidad al background
del theme
) del color
aliceblue
, y a los continentes les pondremos un color
terroso con fill = "antiquewhite"
. Arreglamos un poco las
grid-lines dentro del theme
, y le ponemos la estrellita. No
nos va a salir bonito-bonito porque los nombres de los países se van a
superponer. Podríamos quitar nombres, pero otro día:
p <- p +
geom_sf(fill = "antiquewhite") +
geom_text(data = world_points,
aes(x = X, y = Y, label = name),
color = "darkblue", fontface = "bold",
check_overlap = TRUE, size = 2) +
annotation_north_arrow(location = "bl", which_north = "true",
pad_x = unit(0.75, "in"),
pad_y = unit(0.5, "in"),
style = north_arrow_fancy_orienteering) +
theme(panel.grid.major = element_line(color = gray(.5), linetype = "dashed", size = 0.5),
panel.background = element_rect(fill = "aliceblue"))
p
Hacemos otra vez un zoom con sf::coord_sf()
p + coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE) +
ggspatial::annotation_scale(location = "bl", width_hint = 0.5)
Como nos ha quedado medio chulo, si quisiéramos guardar el mapa
haríamos:
ggsave("map.pdf")
ggsave("map_web.png", width = 6, height = 6, dpi = "screen")
3. Mas tuneado
Vamos a ir modificando el mapa, no necesariamente para hacerlo más
bonito, sino para ver como se pueden hacer mapas con
ggplot2
:
añadiendo puntos
Primero quiero añadir al mapa donde está mi pueblo y donde está
Valencia, vamos que voy a añadir puntos al mapa.
Para ello, primero necesito tener la localización de estos puntos en
el mapa, así que me fui a OSM,
OpenStreetMap y geolocalicé los dos municipios y con esta
información, voy a crear un data.frame con la long/lat de mi pueblo y de
Valencia:
pueblos <- data.frame(
nombre = c("Pancrudo", "Valencia"),
longitude = c(-1.028781, -0.3756572),
latitude = c(40.76175, 39.47534) )
pueblos
Pancrudo |
-1.0287810 |
40.76175 |
Valencia |
-0.3756572 |
39.47534 |
- lo mas fácil para añadir puntos es usar
geom_point()
p_esp +
geom_point(data = pueblos,
aes(x = longitude, y = latitude),
size = 2, color = "darkred") +
geom_text(data = pueblos,
aes(x = longitude, y = latitude, label = nombre),
color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5)
Utilizar geom_point()
es fácil y funciona, pero es más
flexible convertir el data.frame a un objeto sf
. Esto lo
podemos hacer con la función st_as_sf()
, definiendo la
proyección (aquí WGS84, que es el código CRS # 4326):
pueblos_sf <- st_as_sf(pueblos,
coords = c("longitude", "latitude"),
crs = 4326, #- EPSG:4326 Coordenadas Geográficas WGS84
agr = "constant")
Para después añadirlo como una capa más con geom_sf()
a
nuestro gráfico:
p_esp + geom_sf(data = pueblos_sf, size = 2, color = "darkred")
Hagamos zoom con coord_sf
p_esp + geom_sf(data = pueblos_sf, size = 2, color = "darkred") +
coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)
Añadiendo polígonos
La verdad es que se hace igual que con los puntos, hay que usar la
función geom_sf()
y a correr.
Vamos a añadir los contornos/polígonos de las CC.AA:
zz_CCAA <- CCAA %>% st_set_geometry(NULL)
p + geom_sf(data = CCAA, fill = NA) +
coord_sf(xlim = c(-15.00, 15.00), ylim = c(21, 47.44), expand = TRUE)
Ahora añadimos las provincias de Andalucía, PERO coloreadas según su
población media por municipio. Para ello:
- primero cargamos datos de población
INE_padron_muni_96_20 <- pjpv.datos.01::pob_muni_1996_2020
#INE_padron_muni_96_20 <- pjpv2020.01::pjp_data_pob_mun_1996_2019
pob_andalucia <- INE_padron_muni_96_20 %>%
filter(year == 2020) %>%
filter(ine_ccaa.n == "Andalucía") %>%
group_by(ine_prov.n) %>% mutate(n_pueblos = n_distinct(ine_muni.n)) %>%
mutate(pob_prov = sum(pob_total, na.rm = TRUE)) %>% ungroup() %>%
mutate(pob_media_pueblos = pob_prov/n_pueblos) %>%
select(ine_prov.n, ine_prov, pob_media_pueblos, pob_prov, n_pueblos) %>%
distinct() %>% ungroup()
- después cargamos lindes provinciales (en realidad ya los
tenemos)
# Provincias <- Provincias
zz_Provincias <- Provincias %>% st_set_geometry(NULL)
- fusionamos los datos de población y los lines provinciales:
geo_pob_andalucia <- left_join(pob_andalucia, Provincias, by = c("ine_prov" = "ine_prov"))
geo_pob_andalucia <- left_join(pob_andalucia, Provincias)
- finalmente añadimos las provincias coloreadas por población al
mapa:
p + geom_sf(data = CCAA, fill = NA) +
geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
scale_fill_viridis_c(alpha = .4) +
geom_sf(data = pueblos_sf, size = 2, color = "darkred") +
coord_sf(xlim = c(-15.00, 25.00), ylim = c(21, 57.44), expand = TRUE)
- vamos añadir también 3 municipios españoles seleccionados al
azar:
pueblos_3 <- IGN_nomencla_muni %>%
sample_n(3) %>%
select(NOMBRE_ACTUAL, PROVINCIA, LONGITUD_ETRS89, LATITUD_ETRS89) %>%
st_as_sf(coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = 4326, agr = "constant", remove = FALSE)
- Bueno, en realidad no los voy a elegir tan tan al azar:
pueblos_3 <- IGN_nomencla_muni %>%
filter(NOMBRE_ACTUAL %in% c("Pancrudo", "Alburquerque", "Polentinos")) %>%
select(NOMBRE_ACTUAL, PROVINCIA, LONGITUD_ETRS89, LATITUD_ETRS89) %>%
st_as_sf(coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = 4326, agr = "constant", remove = FALSE)
p_esp <- p + geom_sf(data = CCAA, fill = NA) +
geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
scale_fill_viridis_c(alpha = .4) +
geom_sf(data = pueblos_3, size = 2, color = "darkred") +
ggrepel::geom_label_repel(data = pueblos_3, aes(x = LONGITUD_ETRS89, y = LATITUD_ETRS89, label = NOMBRE_ACTUAL)) +
coord_sf(xlim = c(-10.00, 7.00), ylim = c(35, 45), expand = TRUE)
p_esp
Con los mapas y gráficos nunca se acaba!!!
Canarias no se ve. ¿La situamos en el mapa? Usaremos
sf::st_bbox()
canarias <- Provincias %>% filter(ine_prov %in% c(35,38))
peninsula <- Provincias %>% filter( !(ine_prov %in% c(35, 38)) )
my_shift <- st_bbox(peninsula)[c(1,2)]- (st_bbox(canarias)[c(1,2)]) + c(-2.4, -1.1)
canarias$geometry <- canarias$geometry + my_shift
st_crs(canarias) <- st_crs(peninsula)
peninsula_y_canarias <- rbind(peninsula, canarias)
p1 <- ggplot() + geom_sf(data = peninsula_y_canarias)
p2 <- ggplot() + geom_sf(data = peninsula) + geom_sf(data = canarias, fill = "purple")
#coord_sf(xlim = c(-12.00, 4.00), ylim = c(33, 44), expand = TRUE)
p1 + p2
ggplot() + geom_sf(data = peninsula) +
geom_sf(data = canarias) +
coord_sf(xlim = c(-12.00, 4.00), ylim = c(33, 44), expand = TRUE)
- pongamos Canarias, pintada en rojo, en nuestro mapa
p_esp + geom_sf(data = canarias, fill = "red") +
coord_sf(xlim = c(-12.00, 5.00), ylim = c(30, 44), expand = TRUE)
el río Ebro
Pues que quiero poner el Río Ebro en el mapa. Logicamente necesio los
datos geográficos del rio Ebro.
#rios <- rio::import("https://github.com/perezp44/archivos_download/blob/master/rio_ebro.rds?raw=true")
zz_rios <- rios_espanya %>% st_set_geometry(NULL)
names(rios_espanya)
#> [1] "Cod_Mar" "PfafCuen" "PfafRio" "Cod_Uni" "Nom_Rio"
#> [6] "LngTramo_m" "Long_Rio_m" "color" "geometry"
- Voy a situar en el mapa 4 ríos:
#- no hace falta pero
cod_rios_guenos <- c(913757, 913687, 913685, 913619)
nombre_rios_guenos <- c("Pancrudo", "Jiloca", "Jalón", "Ebro")
rios_guenos <- rios_espanya %>% filter(Cod_Uni %in% cod_rios_guenos)
ggplot(data = peninsula) + geom_sf() +
geom_sf(data = rios_guenos, color = "lightblue", lwd = 1.3) +
labs(subtitle = "Mapa de España con 4 ríos Güenos", color = "")
# col = sf::sf.colors(2, alpha = 0.5)
- ¿Cómo se llamará el río pequeñín?
ggplot(data = peninsula) + geom_sf() +
geom_sf(data = rios_guenos, color = "lightblue", lwd = 1.3) +
geom_point(data = pueblos, aes(x = longitude, y = latitude), size = 2, color = "darkred") +
geom_text(data = pueblos, aes(x = longitude, y = latitude, label = nombre), color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) +
labs(subtitle = "Mapa de España con 4 ríos Güenos", color = "")
4. Layouts
Con los mapas se pueden hacer composiciones para destacar el mensaje
que se quiere mostrar. Se pueden hacer estas composiciones de varias
maneras:
Using “grobs”, i.e. graphic objects from ggplot2, which can be
inserted in the plot region using plot coordinates;
Usando el paquete patchwork
o el paquete
cowplot
names(world)
#> [1] "iso_a3" "name" "sovereignt" "continent" "area"
#> [6] "pop_est" "pop_est_dens" "economy" "income_grp" "gdp_cap_est"
#> [11] "life_exp" "well_being" "footprint" "inequality" "HPI"
#> [16] "geometry"
gworld <- ggplot(data = world) +
geom_sf(aes(fill = income_grp)) +
# geom_sf(aes(fill = region_wb)) +
geom_rect(xmin = -15, xmax = 25.00, ymin = 21,
ymax = 57.44, fill = NA, colour = "black", size = 1.5) +
theme(panel.background = element_rect(fill = "azure")) +
labs(subtitle = "Mapa del mundo") +
scale_fill_discrete(guide = "none")
gworld
g_europe <- ggplot(data = world) +
geom_sf() +
geom_sf(data = CCAA, fill = NA) +
geom_sf(data = geo_pob_andalucia, aes(geometry = geometry, fill = n_pueblos)) +
geom_sf(data = pueblos_3, size = 2, color = "darkred") +
geom_label_repel(data = pueblos_3, aes(x = LONGITUD_ETRS89, y = LATITUD_ETRS89, label = NOMBRE_ACTUAL)) +
coord_sf(xlim = c(-15.00, 25.00), ylim = c(21, 57.44), expand = TRUE) +
theme(panel.background = element_rect(fill = "azure")) +
labs(subtitle = "Mapa de Europa Occidental") +
scale_fill_continuous(guide = "none")
g_europe
library(patchwork)
gworld + g_europe + plot_layout(widths = c(1, 2))
5. Paquete Mapview
Vamos a ver lo fácil que es hacer un mapa con el paquete mapview
.
Por ejemplo, teníamos geolocalizados a Pancrudo y Valencia. Veámoslos
en un gráfico con mapview()
pueblos <- data.frame(nombre = c("Pancrudo", "Valencia"), longitude = c(-1.028781, -0.3756572), latitude = c(40.76175, 39.47534)) #- ETRS89
pueblos_sf <- st_as_sf(pueblos, coords = c("longitude", "latitude"), crs = 4326, agr = "constant") #- EPSG:4326 Coordenadas Geográficas WGS84
mapview::mapview(pueblos_sf)
Otro ejemplo con las geometrías de las CC.AA, aunque es una afrenta
para Pancrudo
mapview::mapview(rios)
Para ver que se puede hacer con mapview
vamos a añadir
alguna información a CCAA, por ejemplo el número de provincias, el
número de municipios y la población total en el año 2017:
INE_padron_muni_96_20 <- pjpv.datos.01::pob_muni_1996_2020
#INE_padron_muni_96_20 <- pjpv2020.01::pjp_data_pob_mun_1996_2019
info_CCAAs <- INE_padron_muni_96_20 %>%
filter(year == 2017) %>%
#filter(poblacion == "Total") %>%
group_by(ine_ccaa.n) %>%
mutate(n_prov = n_distinct(ine_prov)) %>%
mutate(n_pueblos = n_distinct(ine_muni)) %>%
mutate(pob_CCAA = sum(pob_total, na.rm = TRUE)) %>% ungroup() %>%
select(ine_ccaa, ine_ccaa.n, n_prov, n_pueblos, pob_CCAA) %>%
distinct() %>% ungroup()
Juntamos el data.frame info_CCAAs
con el dataframe con
las geometrías `CCAA
:
CCAA_con_info <- left_join(CCAA, info_CCAAs)
Y vamos a graficarlo ya con mapview
:
mapview::mapview(CCAA_con_info,
zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA"),
color = "tomato", col.regions = "purple", lwd = 3,
cex = "n_pueblos")
mapview::mapview(CCAA_con_info,
zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA"),
cex = "n_pueblos")
Se pueden poner varias capas:
mapview(list(CCAA_con_info, pueblos_sf), layer.name = c("CC.AA", "2 municipios chachis"))
O mejor así:
mapview::mapview(CCAA_con_info, zcol = c("ine_ccaa.n", "n_prov", "n_pueblos", "pob_CCAA")) +
mapview::mapview(pueblos_sf)
Y muchas mas cosas, por ejemplo Map
pop-ups o Image
pop-ups
- se puede usar el operador
%>%
con las funciones de
sf
CCAA_con_info %>% st_union %>% mapview
Integración con el paquete mapedit
Integracion con mapedit
#install.packages("mapedit")
library(mapedit)
my_map <- mapview(pueblos_sf)
drawFeatures(my_map, editor = "leafpm") #- good
Para recuperar el mapa es mejor así:
library(mapedit)
mys_dibujitos <- editMap(mapview(pueblos_sf))
mapview(mys_dibujitos$finished)
6. Paquete leaflet
El paquete leaflet
permite utilizar en R una de la librerías de JavaScript más conocidas:
Leaflet.
Para abrir un mapa leaflet:
library(leaflet)
leaflet() %>% addTiles() %>% leafem::addMouseCoordinates()
Podemos centrar el mapa, decidir el nivel de zoom y ponerle
marcadores y popups:
m <- leaflet() %>%
addTiles() %>%
setView(lng = -1.0287810, lat = 40.76175, zoom = 6) %>%
addMarkers(lng = -1.0287810, lat = 40.76175, popup = "Pancrudo") %>%
addPopups(lng = -0.3756572, lat = 39.47534, popup = "Valencia")
m
Vamos a añadirle elementos, por ejemplo puntos, por ejemplo mis 2
municipios:
leaflet() %>%
addTiles() %>% # Add default OpenStreetMap map tiles
addCircleMarkers(data = pueblos_sf)
#leafem::addHomeButton(ext = extent(breweries91), layer.name = "pueblos")
O, por ejemplo polígonos como las CC.AA:
leaflet(data = CCAA) %>% addTiles() %>%
addPolygons(fillColor = topo.colors(18, alpha = NULL), stroke = FALSE)
Si te ha gustado tu mapa leaflet y quieres guardarlo, puedes
guardarlo como un archivo html así:
htmltools::save_html(lplot, "leaflet.html")
Se pueden hacer bastantes más cosas, por ejemplo, para hacer
coropletas con leaflet puedes ir aquí. Otro
ejemplo de análisis con leaflet aquí.
7. Operaciones geométricas
Las operaciones geométricas que podemos hacer con sf
con
datos espaciales vectoriales se pueden dividir en tres grupos:
funciones que devuelven un valor que resume alguna propiedad de
la geometría:
st_area()
: calcula el area
st_lenght()
: calcula el perímetro
st_distance()
: calcula la distancia (entre dos
geometrías)
funciones que chequean si se cumple una condición:
En 1 geometría: st_is_valid()
: chequea si la
geometria es válida
En 2 geometrías: por ejemplo, st_intersects(A, B)
chequea si dos geometrías se intersectan. Otras funciones:
st_disjoint()
, st_touches()
,
st_crosses()
, st_within()
,
st_contains()
, st_overlaps()
,
st_covers()
, st_equals()
,
st_is_within_distance()
, y alguna más
funciones que crean una nueva geometría:
En 1 geométria: por ejemplo, st_centroid()
: calcula
el centroide. Otras funciones: st_buffer()
,
st_boundary()
, st_convex_hull()
,
st_voronoi()
En 2 geométrias: por ejemplo, st_intersection()
calcula la interseccion. Otras funciones: st_combine()
,
st_union()
, st_difference()
7.1 Operaciones geométricas (Ejemplos)
Las 5 provincias más grandes
Vamos a colorear las 5 provincias españolas con más territorio, para
ello tenemos que calcular el área con sf::st_area()
:
Provicias_5 <- Provincias %>%
mutate(area = st_area(.)) %>%
mutate(areakm2 = units::set_units(area, km^2)) %>%
arrange(desc(areakm2)) %>%
slice(1:5)
ggplot() + geom_sf(data = Provincias) + geom_sf(data = Provicias_5, fill = "purple")
Bien, pero mejor si ponemos el nombre de las provincias
Prov_5_centroides <- st_centroid(Provicias_5)
Prov_5_centroides <- cbind(Prov_5_centroides, st_coordinates(st_centroid(Prov_5_centroides$geometry)))
ggplot() + geom_sf(data = Provincias) +
geom_sf(data = Provicias_5, fill = "purple") +
geom_text(data = Prov_5_centroides,
aes(x = X, y = Y, label = ine_prov.n),
color = "darkblue", fontface = "bold", check_overlap = TRUE, size = 2.5) +
labs(title = "Las 5 provincias españolas más extensas", x = "", y = "")
Distancias (a mi pueblo)
Calculemos las distancias entre puntos, por ejemplo entre los
centroides de las 52 provincias españolas:
Prov_centroides <- st_centroid(Provincias)
Prov_centroides_XY <- cbind(Prov_centroides, st_coordinates(st_centroid(Prov_centroides$geometry)))
distancias <- st_distance(Prov_centroides_XY, by_element = FALSE) #- devuelve una matriz
Quiero ver que municipio está mas lejos de mi pueblo. Cargo datos de
los municipios con latitud-longitud en ETRS89
:
municipios <- IGN_nomencla_muni
municipios <- municipios %>% select(COD_INE, PROVINCIA, NOMBRE_ACTUAL, LONGITUD_ETRS89, LATITUD_ETRS89)
Tengo que convertir el df a un spatial-df, y tengo que tener cuidado
con el CRS que le pongo. Aquí vi que
ETRS89 es equivalente a EPSG Projection 4258
, así que,
espero haberlo hecho bien, ya vorem:
municipios_sf <- st_as_sf(municipios, coords = c("LONGITUD_ETRS89", "LATITUD_ETRS89"), crs = st_crs(4258))
Vamos a ver que fila ocupa mi pueblo. Ocupa la fila nº 6694, así que
voy a crear un df sólo con mi pueblo y luego calcular las distancias con
fs::st_distance()
:
pancrudo_sf <- municipios_sf %>% slice(6694)
g1 <- st_geometry(municipios_sf)
g1_pancrudo <- st_geometry(pancrudo_sf) #- dejo solo la geometria
#- distancias_a_Pancrudo <- mapply(st_distance, g1, g1_pancrudo) %>% as.vector) #- con R-base
distancias_a_Pancrudo <- map2(g1, g1_pancrudo, st_distance) %>% as_vector() #- con purrr
distancias_a_Pancrudo <- as.data.frame(distancias_a_Pancrudo)
df_con_distancias_a_Pancrudo <- bind_cols(municipios_sf, distancias_a_Pancrudo) %>%
mutate(Kms = distancias_a_Pancrudo * 100) %>%
arrange(Kms)
El pueblo más cercano a Pancrudo es Pozuel del Campo que está a
3.3507456, eso si, en linea recta. Por la carretera hay un poco más,
según Google Maps 7,1 kilómetros. A ver si podemos calcularlo luego con
R usando OSM.
El pueblo más lejano a Pancrudo, si consideramos sólo la península es
Muxía en la provincia de A Coruña, que está a 851,65 kilómetros (en
linea recta). En coche, según Google Maps, 924 Kms.
Municipios por los que pasa el río Ebro
Pues eso, que me apetece saber por donde pasa el Ebro y el
Pancrudo.
- Primero cargo geometrías de los municipios españoles. Las lindes
municipales provienen del paquete
LAU2boundaries4spain
muni_xx <- municipios_2020 %>% st_set_geometry(NULL)
muni <- municipios_2020
Vamos a quedarnos solo con la España peninsular:
#zz <- muni_xx %>% group_by(ine_ccaa, ine_ccaa.n) %>% count()
muni_borrar <- c("Illes Balears", "Canarias")
muni <- muni %>% filter(!(ine_ccaa.n %in% muni_borrar))
- Ahora los datos de ríos Pancrudo, Jiloca, Jalón y Ebro
rio_ebro_4 <- read_rds(here::here("datos", "mapas", "Rios", "rio_ebro.rds"))
Vamos a poner todos los tramos de los 4 ríos juntos. Con
summarise()
rio_ebro_4_xx <- rio_ebro_4 %>% st_set_geometry(NULL)
rio_ebro_4_x <- rio_ebro_4 %>% select(Nom_Rio, Long_Rio_m, geometry) %>% group_by(Nom_Rio) %>% summarize()
Hagamos ya un mapa de los lindes municipales, los ríos y voy a situar
Pancrudo y Valencia:
theme_set(cowplot::theme_map())
p <- ggplot(muni) +
geom_sf(color = "grey", fill = "white", lwd = 0.01) +
geom_sf(data = rio_ebro_4_x, color = "lightblue", lwd = 1.6) +
geom_point(data = pueblos, aes(x = longitude, y = latitude), size = 3, color = "darkred") +
geom_text(data = pueblos, aes(x = longitude, y = latitude, label = nombre), color = "darkred",
fontface = "bold", check_overlap = TRUE, size = 2.5) +
labs(title = "R-Mapa con 4 ríos güenos",
caption = "Datos provenientes del paquete LAU2boundaries4spain") +
theme(panel.background = element_rect(fill = "aliceblue"))
p
Venga, calculamos las intersecciones con
sf::st_intersects()
pero antes tenemos que poner los 2 dfs
en el mismo CRS:
muni_a <- muni %>% st_transform(crs = st_crs(rio_ebro_4_x))
zz_a <- st_intersects(muni_a, rio_ebro_4_x, sparse = FALSE, prepared = TRUE)
Ahora ya si seleccionamos aquellos municipios por los que pasa el
Ebro. Lo hago con R-base:
muni_ebro <- muni_a[zz_a,]
Parece que hay 190 municipios por loq eu pasa el Ebro. A ver si nos
sale el mapa
p + geom_sf(data = muni_ebro) +
geom_sf(data = rio_ebro_4_x, color = "lightblue", lwd = 0.25)
No, no voy a obtener los municipios por los que pasa el rio Pancrudo.
Eso está MAL!!!!
