Regresión Logística
Este ejercicio es para practicar como hacer una Regresión
logística
Los temas incluye.
- Construir un modelo de una regresión logística
- Determinar si los coeficientes son diferentes de cero
- Construir un gráfico de la relación logística usando ggplot2
- Determinar los valores de probabilidades especifico para algunos
valores “X”
Ejercicio
Karn and Penrose data Set
Los Datos
Los datos provienen de un estudio realizado por Mary N. Karn and L.
S. Penrose publicado en Annals of Eugenics, titulado
Birth Weight and gestation time in relation to maternal age,
parity and infant survival publicado en 1951. Estaremos usando
solamente una parte de los datos. El periodo de gestación y el peso de
los bebés varones al nacer y su supervivencia (fallecio= 0 y sobrevivio=
1). Para facilitar el trabajo he modificado los datos un poco para
cumplir con las tareas asignada.
En el archivo “Karn_Penrose_infant_survivorship.csv” tiene datos
sobre 7036 nacimientos entre los años 1935 y 1946. El archivo tiene 4
columnas:
- Line_number = la secuencia de los datos
- Gestation_Time_days = El periodo de gestación en días
- Weigth_lb = El peso del bebe en libras
- Surv_Index = “0” o “1”
library(ggplot2)
library(readr)
Karn_Penrose_infant_survivorship <- read_csv("Data_files_csv/Karn_Penrose_infant_survivorship.csv")
## Rows: 4052 Columns: 4
## ── Column specification ──────────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (4): row_num, Survival, Weigth_lb, Gestation_Time_days
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
KPdata=Karn_Penrose_infant_survivorship
- Pregunta: Explique en sus propias palabras cuales son las hipótesis
que se pueden probar. Especificamente mencione si la hipótesis es una
hipótesis nula o alterna. (4 puntos)
- Pregunta: Graficar la variable de respuesta (2 puntos)
- Pregunta: Grafique las variables explicativas
- Periodo de gestación (2 puntos)
- Peso de los varones al nacer (2 puntos)
Evaluando la distribución de la variable de respuesta
- Pregunta: Usando la prueba correcta evalúa la relación entre la
supervivencia y:
- periodo de gestación (2 puntos)
- peso de los varones al nacer (2 puntos)
- determina si los coeficientes son significativos de cada una de las
pruebas y explica que quiere decir la prueba (4 puntos)
- Graficar la Relación entre la supervivencia y el peso de los bebes
(2 puntos)
- Cual es la probabilidad de un bebe de 4 lbs sobrevivir (2
puntos)
- Cual es la probabilidad de un bebe de 7 lbs sobrevivir (2
puntos)
- Preguntar a su familia cual era el peso de nacer cuando Ud. nacio,
calcula la probabilidad de sobrevivir (3 puntos)