Programación y manejo de datos con R
(Web del curso aquí)
Aprendimos a cargar datos, pero es raro que los datos estén preparados para empezar nuestro análisis, así que hay que “arreglar/limpiar” los datos. Para ello, tenemos que:
Hacer nuestros datos TIDY
Arreglarlos/modificarlos para que sean útiles para nuestros propósitos
Arreglando los datos
¿qué es el tidyverse?
principales pkgs del Tidyverse
readr: para importar datos
tidyr: convertir a tidy data
dplyr: para manipular datos
ggplot2: para hacer gráficos
stringr: para manipular strings
… y algunos más
aquí nos centraremos principalmente en dos paquetes: dplyr y tidyr
“Filosofía” del Tidyverse
Programs must be written for people to read, and only incidentally for machines to execute – Hal Abelson
dos principios del tidyverse
Los scripts deben ser “fácilmente” legibles por las personas
Resolver problemas complejos encadenando funciones simples con el operador pipe (%>%)
El operador %>% es crucial en el tidyverse
The pipe ha tenido tanto éxito que en 2021 apareció una nueva pipe en R-base: |>
Puedes leer sobre ella aquí
El operador %>% es crucial en el tidyverse. Hay que saber usarlo y entenderlo
Es fácil. Pronto os sentiréis cómodos con él.
The pipe
Igual os resulta más fácil entenderlo con ejemplos
The pipe (más ejemplos)
Pipe nativa (|>)
|>Mejoras en la pipe nativa
En la versión 4.2.0 se mejora la pipe nativa introduciendo un “placeholder”. El placeholder de la pipe nativa es el guión bajo: __
Aún así, la pipe nativa tiene algunas limitaciones: aquí, aquí, aquí y en este vídeo
¿qué pasará en el futuro?