TEMA 12. CONCORDANCIA Y CORRELACIÓN
Relaciones entre variables y regresión
La regresión es la predicción de una medida basándonos en el conocimiento de otra. El término de regresión fue introducido por Galton. "Cada peculiaridad de un hombre es compartida por sus descendientes, pero en media, en un grado menor". Por ejemplo, los padres altos tienen la tendencia de que sus hijos también hereden parte de esa altura o acercarse (regresión a la media)
ESTUDIO CONJUNTO DE DOS VARIABLES CUANTITATIVAS. Queremos conocer si hay relación, de qué tipo y si es posible predecir el valor de cada una en función de la otra.
Existen distintos modelos de análisis de regresión, sin embargo, solo estudiaremos el modelo lineal simple.
¿CÓMO PODEMOS COMPROBAR LA NORMALIDAD DE LOS DATOS?
CRITERIO DE LOS MÍNIMOS CUADRADOS
¿CÓMO EVALUAMOS LA BONDAD DE AJUSTE DE ESTE MODELO?
Lo comprobaremos gracias al coeficiente de determinación anteriormente explicado.
¿QUÉ NO PODEMOS OLVIDAR?
Cálculo del test de hipótesis t para modelos de regresión lineal simple(t de Kendall)
Grados de libertad: gl=n1-n2-2
Si por ejemplo el grado de libertad fuese 14 lo buscaríamos en la tabla. El valor que obtenemos es 1,716. A continuación, este valor lo comparamos con el valor de t.
Si t> valor de la tabla, rechazo la hipótesis nula.
Si t< valor de la tabla,acepto la hipótesis nula.
Relaciones entre variables y regresión
La regresión es la predicción de una medida basándonos en el conocimiento de otra. El término de regresión fue introducido por Galton. "Cada peculiaridad de un hombre es compartida por sus descendientes, pero en media, en un grado menor". Por ejemplo, los padres altos tienen la tendencia de que sus hijos también hereden parte de esa altura o acercarse (regresión a la media)
ESTUDIO CONJUNTO DE DOS VARIABLES CUANTITATIVAS. Queremos conocer si hay relación, de qué tipo y si es posible predecir el valor de cada una en función de la otra.
- Presentamos en una tabla datos sobre la altura y el peso de una persona.
- Representamos los datos en un diagrama de dispersión. Observamos si existe correlación
- Incorrelación
- Relación directa
- Relación inversa
Existen distintos modelos de análisis de regresión, sin embargo, solo estudiaremos el modelo lineal simple.
EL TÉRMINO B LO LLAMAREMOS COEFICIENTE DE REGRESIÓN
ATENCIÓN:
Si a=89 y b=0,9 calcula la TAS en una persona de 20 años
La edad es la variable independiente y la TAS la variable dependiente.
TAS= 89+ 0,9x 20=107
Este valor corresponde a la media de edad. Cada vez que la edad aumenta un año, la TAS varía en 0,9 (pendiente de la recta).
- Cuando los datos están más concentrados la r es más grande
- Cuando los datos están menos concentrados la r es más pequeña.
CORRELACIÓN Y DETERMINACIÓN.
¿CÓMO PODEMOS COMPROBAR LA NORMALIDAD DE LOS DATOS?
- Métodos gráficos: histograma
- Métodos descriptivos: IQR/S= 1,34
- Prueba del lápiz grueso o gráfico QQ
- Prueba de Kolmogorov-Smirnov y prueba de Shapiro-Wilk
CRITERIO DE LOS MÍNIMOS CUADRADOS
- Recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube
- Obtenemos un punto sobre la gráfica y lo llamaremos Yi
- Escogemos otro punto sobre la recta que hemos dibujado y lo denominaremos Yi*. Este punto estima el modelo
- Calculamos la diferencia entre ambos. Debe ser lo más pequeña posible, de ahí el nombre de este criterio.
¿CÓMO EVALUAMOS LA BONDAD DE AJUSTE DE ESTE MODELO?
Lo comprobaremos gracias al coeficiente de determinación anteriormente explicado.
- Cuanto más se aproxime a 1 mayor poder explicativo y un mayor nº de puntos se acercarán al modelo
- Para que el cálculo sea fácil se puede calcular este valor elevando al cuadrado el coeficiente de correlación de Person.
- R^2 x100= Porcentaje de variaciones explicadas en el modelo
¿QUÉ NO PODEMOS OLVIDAR?
Cálculo del test de hipótesis t para modelos de regresión lineal simple(t de Kendall)
Grados de libertad: gl=n1-n2-2
Si por ejemplo el grado de libertad fuese 14 lo buscaríamos en la tabla. El valor que obtenemos es 1,716. A continuación, este valor lo comparamos con el valor de t.
Si t> valor de la tabla, rechazo la hipótesis nula.
Si t< valor de la tabla,acepto la hipótesis nula.
No hay comentarios:
Publicar un comentario