Finally an end to the #rstats vs. 🐍 debate! pic.twitter.com/IDjmE0XIRG
— Mine Çetinkaya-Rundel (@minebocek) September 18, 2019
En el curso usaremos R, RStudio y Quarto. Los 3 son programas de ordenador, pero son muy diferentes. Conviene diferenciarlos y saber para qué sirve cada uno. Trato de explicarlo.
1 ¿Qué es R?
R es un programa de ordenador, una pieza de software, pero principalmente es un lenguaje de programación y un entorno para hacer estadística o ciencia de datos.
La página oficial de R dice que:
R is a language and environment for statistical computing and graphics.
Actualmente R es el principal lenguaje usado (junto con Phyton) en el campo de la estadística y la ciencia de datos.
R fue creado por 2 profesores de la universidad de Auckcland: Ross Ihaka y Robert Gentleman. Algunos dicen que el nombre R viene de sus iniciales, otros piensan que se debe a que para crear R se basaron en el lenguaje S1. Quizás se deba a las 2 cosas.
R. Ihaka y R. Gentleman crearon R en 1993 con el objetivo de tener un programa para enseñar estadística en sus clases. En 1995 decidieron que R pasase a ser a dominio público, de forma que actualmente es un proyecto GNU con licencia GPL; es decir, es software libre.
En 1997 se creo un “consejo de sabios” (The R Core Team) para desarrollar y extender las capacidades de R. La primera versión oficial de R, la 1.0.0 vio la luz en febrero de 2000.
Actualmente el entorno R es el resultado de toda una comunidad de usuarios.
2 ¿Qué es RStudio?
Sí, es un programa de ordenador, pero no es un programa para hacer estadística ni es un lenguaje de programación. RStudio nos servirá para poder interactuar con R de forma más cómoda y eficiente.
Para entenderlo: cuando hacemos un análisis estadístico, R es el que hace los cálculos, gráficos etc… R lo hace todo pero le damos las ordenes a R a través de RStudio. RStudio es una interfaz para acceder a R de manera más cómoda. Técnicamente RStudio es un IDE (Integrated development environment) diseñado especialmente para R. Intuitivamente es un programa que nos facilita dar nuestras ordenes a R: si R y RStudio formasen parte de un coche, R sería el motor y Rstudio el volante y los pedales.
RStudio fue creado en 2011 y actualmente es el entorno, o IDE, más usado para programar con R.
Todavía no sabemos que es Quarto, pero RStudio nos facilita la interacción tanto con R como con Quarto. Son ellos, son R y Quarto, los que harán el “trabajo duro”, concretamente R hará los cálculos, si es que nuestro documento/informe es de índole cuantitativo, y Quarto generará el documento final, ya sea este un tutorial, unas slides, página web, etc …
A pesar de que Quarto y R son los que generan los resultados, nosotros no veremos habitualmente a estos dos programas, porque interactuaremos con ellos a través de RStudio.
3 ¿Qué es Quarto?
Sí, también es un programa de ordenador, por tanto tenemos que instalarlo.
Es un programa sin interfaz gráfica (sin menús ni ventanas). Se maneja a través la Terminal con lineas de comandos, así que técnicamente es un programa de tipo CLI (command line interface), pero no sufras porque (casi siempre) interactuaremos con él a través de RStudio.
Quarto es un programa para confeccionar documentos, documentos reproducibles. Se trata de escribir las ordenes que generan el documento en un archivo (source document) para que Quarto al procesarlo genere el documento final. Este documento final puede ser de diferentes tipos (tutoriales, informes, slides, webs, blogs, …) y formatos (html, pdf, docx, …).
Parece complicado pero enseguida verás que es easy-peasy-lemon-squeezy!!
En la página oficial de Quarto se dice que:
Quarto® is an open-source scientific and technical publishing system built on Pandoc
Es un programa de código abierto que sirve para escribir documentos (en sentido amplio) de carácter técnico y científico; y sí, usa Pandoc que es … otro programa!!
Quarto es la segunda generación de Rmarkdown (otro entorno para hacer documentos técnicos) y podemos pensar que su anuncio semi-oficial se hizo con este post de Allison Hill, aunque su presentación a la sociedad y puesta de largo fue en el congreso rstudio::conf(2022).
Actualmente Quarto está en proceso de implantación por la comunidad R (pero también en las comunidades de Phyton y Julia) y es de esperar que cabe sustituyendo completamente al anterior sistema, Rmarkdown.
Notas
Un programa para hacer estadística creado en los Bell Labs por John Chambers entre otros↩︎