Los pingüinos molan

Viendo si con los datos de pingüinos se aprecia la paradoja de Simpson

trabajo BigData
pinguinos
Autorcitos
Afiliación

Bob Dylan (dylanbxxxx@alumni.uv.es)

Patti Smith

Nacho Vegas

Fecha de Publicación

30 de diciembre de 2024

Resumen
Los resultados señalan los siguientes clusters de países …. Por favor, la redacción tiene que estar cuidada

Intro

Vamos a utilizar datos del paquete palmerpenguins. El repo del paquete en CRAN está aquí, el repo de Github está aquí y la página web del paquete está aquí.

Los datos se pueden cargar en la memoria de de R/RStudio de esta forma:

Código
# install.packages("palmerpenguins")
library(palmerpenguins)
df <- palmerpenguins::penguins

El dataset contiene observaciones sobre un conjunto de 344 pingüinos de 3 especies. Hay 8 variables.


Los pingüinos molan

Vamos a ver una foto de un pingüino:

Gráfico 1: Un pingüino chulo: By Robert Elliott of WikiU Film School

Sí, lo pingüinos molan, así que vamos a poner otra foto de pingüinos que tenemos en nuestro PC pero la vamos a poner en el margen:


Algunos gráficos

Bueno pues vamos a hacer algún gráfico, pero claro antes he de cargar los paquetes

Código
library(tidyverse)

Arreglo los datos

Código
#- cojos datos de pingüinos y arreglo un poco 
df <- palmerpenguins::penguins %>% 
  dplyr::select(species, bill_depth_mm, body_mass_g) %>% 
  tidyr::drop_na()

Primer gráfico

Código
#- primer gráfico
p <- ggplot(data = df, 
       mapping = aes(x = bill_depth_mm, y = body_mass_g, color = species)) +
     geom_point()
p


Segundo

Código
#- segundo gráfico
p <- p + geom_smooth(method = "lm", se = FALSE) 

p


El último

Código
#- tercer gráfico
p + geom_smooth(method = "lm", se = FALSE, color = "black") 


Con esto acabo mi trabajo para BigData!!


  • también podría haber puesto el código y el plot en el margen
Código
p + geom_smooth(method = "lm", se = FALSE, color = "black") 




Información sobre la sesión

Abajo muestro mi entorno de trabajo y paquetes utilizados

current session info

─ Session info ───────────────────────────────────────────────────────────────
 setting  value
 version  R version 4.4.2 (2024-10-31)
 os       Ubuntu 22.04.5 LTS
 system   x86_64, linux-gnu
 ui       X11
 language (EN)
 collate  es_ES.UTF-8
 ctype    es_ES.UTF-8
 tz       Europe/Madrid
 date     2024-12-10
 pandoc   3.2 @ /usr/lib/rstudio/resources/app/bin/quarto/bin/tools/x86_64/ (via rmarkdown)

─ Packages ───────────────────────────────────────────────────────────────────
 package        * version date (UTC) lib source
 cli              3.6.3   2024-06-21 [1] CRAN (R 4.4.1)
 clipr            0.8.0   2022-02-22 [1] CRAN (R 4.4.0)
 colorspace       2.1-1   2024-07-26 [1] CRAN (R 4.4.1)
 desc             1.4.3   2023-12-10 [1] CRAN (R 4.4.0)
 details          0.3.0   2022-03-27 [1] CRAN (R 4.4.1)
 digest           0.6.37  2024-08-19 [1] CRAN (R 4.4.1)
 dplyr          * 1.1.4   2023-11-17 [1] CRAN (R 4.4.0)
 evaluate         1.0.1   2024-10-10 [1] CRAN (R 4.4.1)
 fansi            1.0.6   2023-12-08 [1] CRAN (R 4.4.0)
 farver           2.1.2   2024-05-13 [1] CRAN (R 4.4.0)
 fastmap          1.2.0   2024-05-15 [1] CRAN (R 4.4.0)
 forcats        * 1.0.0   2023-01-29 [1] CRAN (R 4.4.0)
 generics         0.1.3   2022-07-05 [1] CRAN (R 4.4.0)
 ggplot2        * 3.5.1   2024-04-23 [1] CRAN (R 4.4.0)
 glue             1.8.0   2024-09-30 [1] CRAN (R 4.4.1)
 gtable           0.3.6   2024-10-25 [1] CRAN (R 4.4.1)
 hms              1.1.3   2023-03-21 [1] CRAN (R 4.4.0)
 htmltools        0.5.8.1 2024-04-04 [1] CRAN (R 4.4.0)
 htmlwidgets      1.6.4   2023-12-06 [1] CRAN (R 4.4.0)
 httr             1.4.7   2023-08-15 [1] CRAN (R 4.4.0)
 jsonlite         1.8.9   2024-09-20 [1] CRAN (R 4.4.2)
 knitr            1.49    2024-11-08 [1] CRAN (R 4.4.2)
 labeling         0.4.3   2023-08-29 [1] CRAN (R 4.4.0)
 lattice          0.22-5  2023-10-24 [4] CRAN (R 4.3.1)
 lifecycle        1.0.4   2023-11-07 [1] CRAN (R 4.4.0)
 lubridate      * 1.9.3   2023-09-27 [1] CRAN (R 4.4.0)
 magrittr         2.0.3   2022-03-30 [1] CRAN (R 4.4.0)
 Matrix           1.7-0   2024-04-26 [1] CRAN (R 4.4.0)
 mgcv             1.9-1   2023-12-21 [4] CRAN (R 4.3.2)
 munsell          0.5.1   2024-04-01 [1] CRAN (R 4.4.0)
 nlme             3.1-165 2024-06-06 [4] CRAN (R 4.4.0)
 palmerpenguins * 0.1.1   2022-08-15 [1] CRAN (R 4.4.1)
 pillar           1.9.0   2023-03-22 [1] CRAN (R 4.4.0)
 pkgconfig        2.0.3   2019-09-22 [1] CRAN (R 4.4.0)
 png              0.1-8   2022-11-29 [1] CRAN (R 4.4.0)
 purrr          * 1.0.2   2023-08-10 [1] CRAN (R 4.4.0)
 R6               2.5.1   2021-08-19 [1] CRAN (R 4.4.0)
 readr          * 2.1.5   2024-01-10 [1] CRAN (R 4.4.0)
 rlang            1.1.4   2024-06-04 [1] CRAN (R 4.4.1)
 rmarkdown        2.29    2024-11-04 [1] CRAN (R 4.4.2)
 rstudioapi       0.17.1  2024-10-22 [1] CRAN (R 4.4.2)
 scales           1.3.0   2023-11-28 [1] CRAN (R 4.4.0)
 sessioninfo      1.2.2   2021-12-06 [1] CRAN (R 4.4.0)
 stringi          1.8.4   2024-05-06 [1] CRAN (R 4.4.0)
 stringr        * 1.5.1   2023-11-14 [1] CRAN (R 4.4.0)
 tibble         * 3.2.1   2023-03-20 [1] CRAN (R 4.4.0)
 tidyr          * 1.3.1   2024-01-24 [1] CRAN (R 4.4.0)
 tidyselect       1.2.1   2024-03-11 [1] CRAN (R 4.4.0)
 tidyverse      * 2.0.0   2023-02-22 [1] CRAN (R 4.4.0)
 timechange       0.3.0   2024-01-18 [1] CRAN (R 4.4.0)
 tzdb             0.4.0   2023-05-12 [1] CRAN (R 4.4.0)
 utf8             1.2.4   2023-10-22 [1] CRAN (R 4.4.0)
 vctrs            0.6.5   2023-12-01 [1] CRAN (R 4.4.0)
 withr            3.0.2   2024-10-28 [1] CRAN (R 4.4.1)
 xfun             0.49    2024-10-31 [1] CRAN (R 4.4.2)
 xml2             1.3.6   2023-12-04 [1] CRAN (R 4.4.0)
 yaml             2.3.10  2024-07-26 [1] CRAN (R 4.4.1)

 [1] /home/pjpv/R/x86_64-pc-linux-gnu-library/4.4
 [2] /usr/local/lib/R/site-library
 [3] /usr/lib/R/site-library
 [4] /usr/lib/R/library

──────────────────────────────────────────────────────────────────────────────


Reutilizar