Ejercicio de Corelación: Despues de hacer los ejercicios habrá preguntas en MSTeam para contestar.

Objetivos:

  • Determinar si el estudiante puede evaluar si las variables tienen una distribución normal o no
  • Basado en lo anterior seleccionar la prueba de correlación correspondiente
  • Calcular el coeficiente de determinación
  • Visualizar la correlación

Los Datos

The data were obtained from Andrews, D.F. and Herzberg, A.M. (1985) Data: A Collection of Problems from Many Fields for the Student and Research Worker. Springer-Verlag.

Las variables en el archivo urine en el paquete boot

  • r = Indicator of the presence of calcium oxalate crystals.

  • gravity = The specific gravity of the urine.

  • ph = The pH reading of the urine.

  • osmo = The osmolarity of the urine. Osmolarity is proportional to the concentration of molecules in solution.

  • cond = The conductivity of the urine. Conductivity is proportional to the concentration of charged ions in solution.

  • urea = The urea concentration in millimoles per litre.

  • calc = The calcium concentration in millimoles per litre.

library(boot)
## 
## Attaching package: 'boot'
## The following object is masked from 'package:car':
## 
##     logit
## The following object is masked from 'package:survival':
## 
##     aml
## The following object is masked from 'package:lattice':
## 
##     melanoma
head(urine) 
##   r gravity   ph osmo cond urea calc
## 1 0   1.021 4.91  725   NA  443 2.45
## 2 0   1.017 5.74  577 20.0  296 4.49
## 3 0   1.008 7.20  321 14.9  101 2.36
## 4 0   1.011 5.51  408 12.6  224 2.15
## 5 0   1.005 6.52  187  7.5   91 1.16
## 6 0   1.020 5.27  668 25.3  252 3.34

  1. Evaluar si las 6 variables (excluye la variable “r”) cumple con distribución normales.
  • Usa dos de los métodos que hemos aprendido para evaluar cada variable si cumple con distribución normal.

  • Explicar que prueba utilizas y interpretas los resultados.

  1. Usando el gráfico de qq-plot gráfica la correlación “menos normal” de las pruebas anteriores. Salva este gráfico en .png o .jpeg.

  1. Estimado de correlación entre las seis variables
  • Tomando en cuenta lo que observaste en la pruebas anterior, selecciona la prueba correcta entre Pearson o Kendall, para evaluar la correlaciones entre las variables. Tiene que seleccionar la prueba correcta.

    • Cual variables tienen una correlación mayor
    • Cual variables tiene la correlación menor

  1. Coeficiente de determinación
  • Calcula el coeficiente de determinación entre:
    • calcium y urea
    • ph y calc
  • Cual de estos pares explica mejor la relación entre una variable y la otra (2 puntos)

  1. ¿Como se interpreta el coeficiente de determinación?

  1. Usa la funcción ggMarginal del paquete ggEXTRA

Selecciona un par de variables de la correlación anterior:

  • Prepare un gráfico para demostrar la correlación y su distribución usando ggMarginal.
  • Interpretar el gráfico y compara con la prueba de normalidad que hiciste anteriormente
  • salva el grafico en formato .jpeg o .png

  1. ¿Cual son los supuestos para usar la correlación de Pearson?