Módulo práctico de ITA
(Grupo M)
Aprendimos a cargar datos y a hacerlos TIDY. También vimos la “teoría” del tidyverse. Ahora nos centraremos en usar el tidyverse para transformar nuestros datos, para obtener resultados. Para ello usaremos ejemplos
vimos ya la la “teoría” del tidyverse
dplyr
es el paquete más importante a la hora de manipular datos.select()
, filter()
, mutate()
, arrange()
, rename
, summarise()
y group_by()
.%>%
)para aprender a manipular datos con dplyr
(y obtener resultados)
Es importante saber cómo contar las observaciones que tenemos en distintos grupos
Por ejemplo, contar cuantas mujeres hay, o cuantas observaciones hay en cada continente, o cuantas empresas en diferentes sectores, …
… vamos a CONTAR
tenemos 3 formas distintas de contar el nº de observaciones (o filas)
1. Usando mutate()
con n()
2. Usando summarise()
con n()
… seguimos CONTANDO
Pero ahora contamos el nº de observaciones de distintos grupos (por ejemplo el nº de observaciones de cada continente)
mutate()
pero esta vez solo usaremos summarise()
y count()
… aún seguimos CONTANDO
Contamos el nº de observaciones de distintos grupos, pero ahora definidos por dos variables (por ejemplo el nº de observaciones de cada continente y año)
Extensión: n()
versus nrow()
n()
es una función auxiliar en el tidyverse. Devuelve en nº de filas “in the current group”. Solo funciona en el tidyverse, concretamente en funciones como mutate()
y summarise()