class: center, middle .linea-superior[] .linea-inferior[] <img src="imagenes/logo_portada2.png" width="200" /> ## INE Educa: Clases abiertas de R ## Tidy data: *pivot_longer()* ## Proyecto Ciencia de Datos --- background-image: url("imagenes/fondo2.PNG") background-size: contain; background-position: 100% 0% # Tidy data En ocasiones necesitamos tranformar la distribuición o formato de nuestros dataframes, desde **wide** a **long**, o viceversa -- .center[<img src="imagenes/wide_long.png" height="300" />] -- Para esto el paquete **tidyr** nos ofrece las funciones **pivot_longer()** y **pivot_wider()** -- En este video revisaremos **pivot_longer()** --- background-image: url("imagenes/fondo2.PNG") background-size: contain; background-position: 100% 0% # Tidy data *pivot_longer()* Esta función incrementa el número de filas y disminuye el número de columnas -- .center[<img src="imagenes/tidyr-pivot_wider_longer.gif" height="300" />] -- Los dataframes obtenidos por esta función son más fáciles de **manipular**, pero no de visualizar -- El formato **long** es especialmente útil para graficar o modelar --- background-image: url("imagenes/fondo2.PNG") background-size: contain; background-position: 100% 0% # Tidy data *pivot_longer()* Ejemplo de `pivot_longer()`: -- ```r df1 <- data.frame(region = c(1, 2), hombres = c(100, 200), mujeres = c(50, 300)) df1 ``` ``` ## region hombres mujeres ## 1 1 100 50 ## 2 2 200 300 ``` ```r library(tidyr) df1 %>% pivot_longer(cols = -region , names_to = "sexo", values_to = "total_sexo") ``` ``` ## # A tibble: 4 × 3 ## region sexo total_sexo ## <dbl> <chr> <dbl> ## 1 1 hombres 100 ## 2 1 mujeres 50 ## 3 2 hombres 200 ## 4 2 mujeres 300 ``` --- background-image: url("imagenes/fondo2.PNG") background-size: contain; background-position: 100% 0% # Tidy data *pivot_longer()* ## Función `pivot_longer()` ``` ## # A tibble: 4 × 3 ## region sexo total_sexo ## <dbl> <chr> <dbl> ## 1 1 hombres 100 ## 2 1 mujeres 50 ## 3 2 hombres 200 ## 4 2 mujeres 300 ``` Los argumentos más comunes de esta función son: -- - *cols*: columnas a las que se le aplicará la operación -- - *names_to*: indica el nombre de la variable que será creada para "guardar" los nombres de las categorías. - *values_to*: indica el nombre de la variable que será creada para "guardar" los valores asociados a las categorías --- class: center, middle .linea-superior[] .linea-inferior[] <img src="imagenes/logo_portada2.png" width="200" /> ## INE Educa: Clases abiertas de R ## Proyecto Ciencia de Datos ## Tidy data: *pivot_longer()*