Calendario de clases y HOMEWORK: Aquí os dejaré las
tareas previas a cada clase. Tenéis que tener muy claro
que no podéis venir a clase de espectadores, habrá que trabajar en clase
y sobre todo haber trabajado en casa; es decir, cada semana, antes de
venir a clase hay que hacer las tareas previas. Tenemos
14 sesiones de clase. Intenta faltar lo menos posible y asiste, sí o sí,
a las 5 primeras sesiones.
Iré actualizándo este apartado conforme pasen las semanas. Intentaré
ajustar y acertar lo más posible con la programación de las clases pero
… , como sabéis, en una clase siempre puede haber
incidentes/sorpresas.
Homework
(para hacer antes de ir a
clase)Lee la sección Guía del curso
de la
página web del curso.
Créate una cuenta en Github. Mejor si usas tu cuenta de correo de Gmail. La usaremos para acceder a varios servicios web.
Prepara tu ordenador; es decir, instálate R, RStudio y los paquetes. Aquí tienes una guía para la instalación. Si tienes algún problema con la instalación contacta conmigo por email.
Lee el primer turorial: Tutorial 01: Introducción
. Es solo
leer, no hay que estudiar nada; además se lee fácil. Se trata
simplemente de poner en contexto el curso y hablar un poco sobre qué es
esto de la “era del Big Data”, la ciencia de datos etc …
Si quieres, puedes echarle un vistazo a las 2 primeras transparencias: aquí y aquí.
Lo primero presentar el curso
Hablar de la evaluación y forma de trabajo en el curso.
Hablar un poco de algunas de las ideas del Tema 1
¿Cómo trabajaremos con R? Workflow
Ejemplos iniciales
Muchas veces para (medio) entender/saber hacer estas cosas tendrás que asistir a tutorías o estudiar o preguntar a un compañero, o ….
¿Qué es la ciencia de datos?
¿Qué es R y RStudio? ¿Y los paquetes?
¿Qué son los ficheros .R? ¿Y los .Rmd? ¿Y los Rprojects?
Saber interactuar con R a través de Rprojects
Too much for the first class? Igual sí. Al final veremos lo que podamos.
Homework
(para hacer antes de ir a
clase)Leer el e-mail que os he mandado a vuestro correo de la UV y hacer (si quieres) las 2 tareas extra-oficiales que allí os cuento. Además, en el mail hay una tercera tarea, está tercera tarea sí es oficial, hay que hacerla.
Leer el tutorial nº 2, es sólo leer. En el tutorial aparece una pequeña explicación de las ventajas de usar Rprojects y hace hincapié en el concepto de rutas relativas. Trata de entenderlo, lógicamente, pero si tienes dudas/problemas no pasa nada, lo trabajaremos en profundidad cuando empecemos el tutorial nº 04, supongo que en la tercera sesión/viernes del curso.
Configurar RStudio. Para ello tienes que seguir las instrucciones que figuran en el tutorial nº 2, concretamente aquí. Es importante que tengamos todos la misma configuración, ya explicaré la razón en clase. Esto es importante hacerlo bien!!
Estaremos un buen rato con el ejemplo “ej_000_ejemplo-inicial.R”; es un análisis muy simple, pero ejemplifica bien lo que haremos durante el curso.
Utilizaremos el fichero “ej_000_ejemplo-inicial.Rmd” para crear una primera capa para entender los ficheros .Rmd
Ver todo los que podamos de R-base, para ello utilizaremos las Slides-03: R base. Es muy importante entender algunos conceptos como asignación, tipos de datos, estructuras de datos, funciones …
Jugar con algunos ejemplos
Homework
(para hacer antes de ir a
clase)Leer el e-mail que os he mandado a vuestro correo de la UV. Allí
están los detalles de la segunda entrega, que esta vez sí forma
parte de la evaluación continua, así que, en realidad es la
entrega_01
. Hay que entregarla antes del jueves a las
23:59.
La principal tarea que tenéis que hacer está semana es repasar un poco lo que hemos visto y ver si te vas sintiendo cómodo en R/RStudio.
Leer el primer apartado del Tutorial 03: R base.
Leer e intentar ejecutar el código de las Slides-03: R base.
Corregir la primera entrega.
“Acabar” con el tema de R-base. Para ello utilizaremos las Slides-03: R base.
Empezar a importar/exportar datos. Para ello usaremos las Slides-04: Importar y exportar datos.
Espero que tengamos tiempo para jugar con algunos ejemplos
Homework
(para hacer antes de ir a
clase)Esta semana no hay tarea para entregar pero si que tenéis tarea de leer, repasar y practicar, pensar en los trabajos etc… vamos, ir metiéndoos en el universo R.
La principal tarea que tenéis que hacer está semana, otra vez, es repasar un poco lo que hemos visto; en concreto, leer e intentar ejecutar el código de las Slides-04: Importar y exportar datos.
Acabar las Slides-04: Importar y exportar datos.
Empezar una de las partes principales del curso: manejo de datos con R à la tidyverse. Presentaremos ideas/conceptos como “the pipe” y “tidy data” y empezaremos a usar 2 paquetes del tidyverse: tidyr y dplyr, el principal paquete para manipular datos. Para ello utilizaremos las Slides-05: Data munging.
Leer el e-mail que os he mandado a vuestro correo de la UV. Esta vez sí hay entrega, la cuarta. El viernes hicimos la tercera en clase.
Lee todo lo que puedas del Tutorial 05: Data munging.
Leer e intentar ejecutar el código de las Slides-05: Data munging.
“Corregir” la entrega_04
. Se trata de no repetir
errores y aprender de ellos. Aunque igual lo hacéis genial y no hay ni
un solo error. 🥇 ✅
Meternos de lleno con el tidyverse
, concretamente
con su principal paquete dplyr
. Necesito que os leáis el
tutorial 05 y las slides 05, please!!!!!
No creo que lleguemos, pero igual empezamos a hablar de ggplot2 y hacer nuestro primer super-gráfico. 📊 📉
Hay que hacer la entrega_05
. ya la empezamos en
clase, ahora se trata de acabarla. Esfuérzate e intenta aprender con
ella el funcionamiento/sintaxis de dplyr
.
Repasa el Tutorial 05: Data munging
.
Lee los 2 primeros apartados del Tutorial 06: ggplot2
.
Instalaros estos 3 paquetes: robservable
,
wikifacts
y coronavirus
. Los dos primeros
paquetes están en CRAN, así que podéis instalarlos con
install.packages("nombre_del_pkg")
; el último instaladlo
con remotes::install_github("RamiKrispin/coronavirus")
.
Acordaros de que, para evitar problemas, es mejor instalar los paquetes
desde una sesión limpia de R.
Corregir la entrega_05
.
Acabar el tutorial 05
. No queda mucho: fusionar
tablas, algunos consejos y practicar un poco más; para ello empezaremos
(en parejas) la entrega_06
.
Haremos un ejemplo ya realista: manejaremos datos sobre coronavirus y lo visualizaremos con el package robservable
Igual os hablo un poquito de Wikidata y hacemos algunas queries (espero).
Empezar con las ideas básicas de ggplot2 y está vez sí, hacer nuestro primer super-gráfico.
Homework
(para hacer antes de ir a
clase)Acabar la entrega_06
. En la última pregunta tenéis
que hacer vuestro primer super-gráfico.
Lee todo lo que puedas del Tutorial 06: ggplot2
.
Pégale un vistazo a las Slides-06(A): ggplot2 (primeras ideas)
,
y si puedes, también a las Slides-06(B): ggplot2 (más elementos)
.
Instalaros estos 3 paquetes: ggThemeAssist, esquisse y ggannotate. Los dos
primeros paquetes están en CRAN, así que podéis instalarlos con
install.packages("nombre_del_pkg")
. Igual ya los tenéis
instalados. Podéis probarlo con library()
. El tercer
paquete no está en CRAN, podéis instalarlo con
remotes::install_github("mattcowgill/ggannotate")
.
Acordaros de que, para evitar problemas, siempre es mejor instalar los
paquetes desde una sesión limpia de R.
Corregir la entrega_06
.
Seguir con ggplot2: recordar las ideas básicas con Slides-06(A): ggplot2 (primeras ideas)
e introducir más elementos de los gráficos ggplot: Slides-06(B): ggplot2 (más elementos)
.
Como la clase estará totalmente dedicada a ggplot2
,
supongo que haremos algunos ejemplos en los que se cargarán datos, se
arreglarán, para finalmente hacer un gráfico chulo. No lo entenderemos
del todo, pero casi-casi.
Homework
(para hacer antes de ir a
clase)Evidentemente, entregar a tiempo la
entrega_08
Leer el tutorial sobre ggplot2
.
No estaría mal que empezáseis a pensar/perfilar vuestro trabajo en grupo
Corregir la entrega_08
Continuar y acabar con el tutorial 06 sobre
ggplot2
Ejemplos relacionados con visualización
Empezar con Rmarkdown. Veremos las ideas básicas para poder hacer informes reproducibles con Rmarkdown
Homework
(para hacer antes de ir a
clase)Esta semana, como sabéis, tenéis que hacer la
entrega_09
para hacerla tendréis que repasar/estudiar
ggplot2
.
Tenéis que instalaros unos paquetes relacionados con Rmarkdown.
Lo haremos con el paquete pacman. Para ello solo tenéis que correr las
siguientes instrucciones:
pacman::p_install(bslib, thematic, shiny, rmdformats, flexdashboard, posterdown, vitae, tinytex)
y
pacman::p_install_gh(c("rstudio/pagedown", "yihui/rolldown"))
.
Ya sabéis, desde sesión limpia de R. Una vez instalados los paquetes,
corred la siguiente instrucción tinytex::install_tinytex()
para instalaros una distrubución ligera de Latex.
Tenéis que empezar a pensar en los trabajos: el individual, pero sobre todo el trabajo en equipo.
Corregir la entrega_09.
“Empezar” con Rmarkdown. Veremos las ideas básicas (y no tan básicas) para poder hacer informes reproducibles con Rmarkdown
Os proporcionaré unas plantillas que puedan serviros para hacer vuestros trabajos.
Subiremos nuestros primeros “trabajos” a Github.
Homework
(para hacer antes de ir a
clase)Enviarme, en un documento .html, generado a través de un .Rmd, un bosquejo de vuestro trabajo en grupo. Es importante que lo vayáis perfilando … y haciendo.
Seguramente los tengáis ya instalados, pero por si acaso,
instalaros los siguientes paquetes:
pacman::p_load(freqtables, janitor, sjmisc, flextable, formattable, flextable, kableExtra, gt, DT, reactable, stargazer, modelsummary, gtsummary, sjPlot, rpivotTable, webshot)
Hablar de vuestros proyectos de trabajos
Seguir con RMD. Para ello probaremos otros formatos/plantillas.
Subiremos, esta vez sí, el bosquejo de vuestros trabajos a Github.
Tendremos una charla de un estudiante de hace dos años (Antonio Segovia). Antonio nos hablará sobre posibilidades de iniciación y perspectivas laborales en el mundo de la Ciencia de Datos.
Veremos como crear tablas para documentos Rmd. Usaremos el
tutorial 09
Homework
(para hacer antes de ir a
clase)Como sabéis ya no hay homework, buenio, sí, el homework es tratar de asentar lo que hemos visto durante el curso, para eso tenéis que ir haciendo los trabajos en grupo. Ánimo con ellos
Seguramente los tengáis ya instalados, pero por si acaso, instalaros los siguientes paquetes:
::p_load(knitr, here, tidyverse, patchwork, ggrepel)
pacman::p_load(sf, rnaturalearth, rnaturalearthdata, ggspatial, mapview, leafem, leaflet)
pacman::p_load(tmap, tidygeocoder, tmaptools) pacman
Hablar (otra vez) de vuestros trabajos.
Seguir con el tema de las tablas. para ello usaremos el
Tutorial 08: Tablas con Rmarkdown
y el
ej_222_tablas-con-gt.R
Empezar con mapas: a ver si le damos un buen bocado al
Tutorial 09: Introducción a GIS con R
.
Ejemplos de mapas: ej_102_eurostat-easy.R
y
ej_223_mapa_crec-pob-muni.R
.
Homework
(para hacer antes de ir a
clase)Veremos … según lo que veamos en la clase 11.
Después del descanso, sobre las 17:45, tendremos charla de Jorge Segura, actuario jefe de Unión Alcoyana Seguros.
Homework
(para hacer antes de ir a
clase)Acabar y dejar chulos-chulos los trabajos en equipo. No os olvidéis de subir la última versión a Github
Mandar a tu profesor la ultima versión del trabajo en equipo.
Yo, relajarme y escuchar.
Vosotros, 👩🎓, sorprenderme con vuestras fantásticas presentaciones. Bueno, no pasa nada si alguna sale tan solo regular. El 🙌 👏 👏 lo vais a tener igual.
Ánimo con los trabajos y presentación!!!