Ha salido un nuevo paquete para mostrar distribuciones de una manera que a mi me parece muy bonita. Se trata de ggdist, un ‘escición’ de tidybayes. Veamos que podemos hacer con él. Me interesa mostrar las distribuciones de diferentes variables en forma de percentiles.
Primero de todo vamos a cargar unos datos. Como sabéis, tengo tirria a los clásicos Iris y mtcars. Vamos a probar con el simpático “penguins”
remotes::install_github("allisonhorst/palmerpenguins")
pacman::p_load(palmerpenguins, tidyverse, ggdist, see , wesanderson)
df <- penguins
df <- df[complete.cases(df),]
Primero de todo vamos a convertir en long nuestros datos
df <- df %>% pivot_longer(cols = 3:6, names_to = "index")
Ahora sí, a plotear! Primero de todo vamos a hacer lo mínimo. El gráfico básico con los valores que queremos mostrar usando el geom stat_dots especificando los 100 cuantiles. Para que aparezca en cada variable usaremos el facet_wrap con su respectivo scale = “free”.
df %>%
ggplot(aes(x = value)) +
stat_dots(quantiles = 100) +
facet_wrap(~index, scale = "free")
Un vez con nuestro lienzo básico, vamos a darle un poco de alegría. Vamos a distinguirlos por sexo y con color y fill y aplicar unos colores bonitos. Además, pondremos el theme_modern del paquete see.
df %>%
ggplot(aes(x = value, color = sex, fill = sex)) +
stat_dots(quantiles = 100, alpha = .50, shape = 19)+ # con alpha los haremos transparentes
facet_wrap(~index, scale = "free") +
theme_modern() +
scale_color_manual(values=c("#56B4E9", "#E69F00" ))
Aún quedaría mucho por tocar para hacer uno gráficos publicables, pero he cumplido con lo que me propuse: tener une ejemplode gráficos de cuantiles