Luego entonces so far, so good, con las herramientas que ya tenemos, sabemos que podemos reproducir el tutorial de Predicting Wine Quality. En la “Practica 2” cargamos estos paquetes: caret, dplyr, moments, ggplot2, ggcorrplot, e1071, doParallel, nnet y ordinal.
Ahora buscamos reproducir el código seleccionado, copiado (desde Predicting Wine Quality) y pegado aquí:
Exploro “red” con medios convencionales:
## [1] "data.frame"
## [1] 1599 13
## [1] "fixed_acidity" "volatile_acidity" "citric_acid"
## [4] "residual_sugar" "chlorides" "free_sulfur_dioxide"
## [7] "total_sulfur_dioxide" "density" "pH"
## [10] "sulphates" "alcohol" "quality"
## [13] "wine"
Ya en confianza seguimos con el resto del código:
# Aparentemente esta es una base de datos de vinos blancos
white <- read.csv("http://bit.ly/2VlYfCJ",
stringsAsFactors = FALSE) %>%
mutate(wine = "white")
# Fusionamos ambas bases de datos, pero las diferenciamos usando una variable categórica
wine <- rbind(red, white) %>%
mutate(wine = as.factor(wine))
## fixed_acidity volatile_acidity citric_acid residual_sugar
## Min. : 3.800 Min. :0.0800 Min. :0.0000 Min. : 0.600
## 1st Qu.: 6.400 1st Qu.:0.2300 1st Qu.:0.2500 1st Qu.: 1.800
## Median : 7.000 Median :0.2900 Median :0.3100 Median : 3.000
## Mean : 7.215 Mean :0.3397 Mean :0.3186 Mean : 5.443
## 3rd Qu.: 7.700 3rd Qu.:0.4000 3rd Qu.:0.3900 3rd Qu.: 8.100
## Max. :15.900 Max. :1.5800 Max. :1.6600 Max. :65.800
## chlorides free_sulfur_dioxide total_sulfur_dioxide
## Min. :0.00900 Min. : 1.00 Min. : 6.0
## 1st Qu.:0.03800 1st Qu.: 17.00 1st Qu.: 77.0
## Median :0.04700 Median : 29.00 Median :118.0
## Mean :0.05603 Mean : 30.53 Mean :115.7
## 3rd Qu.:0.06500 3rd Qu.: 41.00 3rd Qu.:156.0
## Max. :0.61100 Max. :289.00 Max. :440.0
## density pH sulphates alcohol
## Min. :0.9871 Min. :2.720 Min. :0.2200 Min. : 8.00
## 1st Qu.:0.9923 1st Qu.:3.110 1st Qu.:0.4300 1st Qu.: 9.50
## Median :0.9949 Median :3.210 Median :0.5100 Median :10.30
## Mean :0.9947 Mean :3.219 Mean :0.5313 Mean :10.49
## 3rd Qu.:0.9970 3rd Qu.:3.320 3rd Qu.:0.6000 3rd Qu.:11.30
## Max. :1.0390 Max. :4.010 Max. :2.0000 Max. :14.90
## quality wine
## Min. :3.000 red :1599
## 1st Qu.:5.000 white:4898
## Median :6.000
## Mean :5.818
## 3rd Qu.:6.000
## Max. :9.000
Seguimos explorando, lo más importante, es que te des cuenta de cómo estamos reproduciendo el análisis de Predicting Wine Quality, eventualmente puedes seguir “copy&paste” hasta terminar todo el procedimiento.
##
## 3 4 5 6 7 8 9
## 30 216 2138 2836 1079 193 5
Con este código, abre el proyecto “semana_i”, crea un nuevo “R Script” agregando encabezado y usando el snippet para dividir las secciones, crea el archivo “Practica_5.R”.
Por último, estando dentro del proyecto “semana_i”, en el panel superior derecho de RStudio, activa la pestaña “History”, pincha el icono de un “floppy disc” azul “save history into a file”, usa este formato “apellidoPaterno_Nombre.RHistory”, el archivo quedará guardado en el directorio de trabajo.