TEMA 5. ESTADÍSTICOS UNIVARIABLES
Ya hemos estudiado las tablas de frecuencia. Es momento de aprender cuáles son las medidas estadísticas más importantes.
Existen 3 tipos de medidas estadísticas:
Nos hemos ayudado de una tabla para hacer todas las operaciones de forma ordenada.
Se le llama distribución normal o Gaussiana, a una de las distribuciones de probabilidad de variable continua más usadas en fenómenos reales. Su gráfica tiene forma acampanada y es simétrica respecto a los valores de posición central (distribución unimodal simétrica). A la curva se le conoce como Campana de Gauss.
Medidas de forma. Asimetría y Curtosis
Indican la asimetría y el grado de apuntamiento.
ASIMETRÍAS
Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media. Pueden llamarse también sesgadas y se caracterizan porque el pico de la misma está descentrado.
Es adimensional y toma valores entre -1 y 1.
• g1 = 0 (distribución simétrica; existe la
misma concentración de valores a la
derecha y a la izquierda de la media)
• g1 > 0 (distribución asimétrica positiva; La cola de la distribución es más larga hacia la derecha y los valores más elevados quedan a la izquierda)
• g1 < 0 (distribución asimétrica negativa;
La cola de la distribución es más larga
hacia la izquierda y los valores más
elevados quedan a la derecha)
CURTOSIS O APUNTAMIENTO
Coeficiente de apuntamiento o curtosis de una variable:sirve para medir el grado de concentración de los valores que toma en torno a su media.
• Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.
• Adopta también valores entre -1 y 1. Es una medida adimensional.
• g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
• g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
• g2 < 0 (distribución platicúrtica) . Presenta un
reducido grado de concentración alrededor de
los valores centrales de la variable
Ya hemos estudiado las tablas de frecuencia. Es momento de aprender cuáles son las medidas estadísticas más importantes.
Existen 3 tipos de medidas estadísticas:
- Medidas de tendencia central: valores alrededor de los cuales el resto de los datos tienden a agruparse
Media
Es la suma
de todos valores de la variable observada entre el total de
observaciones.
Mediana
Puntuación que ocupa la posición central de la distribución. Para calcularla, los datos deben estar ordenados de forma creciente o decreciente.
Si la mediana y la media coincide, podemos decir que la distribución es simétrica.
Moda
Es el valor que se repite con más frecuencia en la distribución. Es la medida de tendencia central menos empleada.
CARACTERÍSTICAS DE LAS MEDIDAS
DE TENDENCIA CENTRAL
|
||
MEDIA
|
MEDIANA
|
MODA
|
La suma de desviaciones con respecto a la media es
0
La media no se altera por una transformación lineal
de escala. Si a la media se le suma o multiplica un valor K, aumentará en esas unidades.
Es muy sensible a puntuaciones extremas
|
Es el valor de la observación
tal que un 50% de los datos son menores y un 50% son mayores
Es más robusta y menos sensible a valores extremos.
Es por esto que debemos usarla siempre que ocurran situaciones así.
|
Pueden ser unimodales, bimodales o multimodales
según si tienen una moda, dos o más de dos.
Si lo datos están agrupados se habla de clase modal
y corresponde al intervalo en el que el cociente entre la frecuencia relativa
y la amplitud es mayor.
|
- Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos
- Cuantiles: destacan los percentiles,deciles y cuartiles, según si dividen la muestra en 100, 10 0 4 partes.
- El valor del percentil 50 corresponde a la mediana. Cada percentil se escribe como (Pi)
- Los deciles se escriben como (Di). El valor de D5 corresponde al de la mediana, y por tanto, a Pi
- Los cuartiles se representan como Q1,Q2,Q3 y Q4.
CÁLCULO DE LA POSICIÓN DE UN PERCENTIL. EJERCICIO
Calcular percentil 25.
Datos
n= 50
Lp= (n +1) x P/ 100
Lp= (50+1) x 25/100= 12,75
- Medidas de dispersión o variabilidad: información acerca de la heterogeneidad de las observaciones. Se utilizan ya que las medidas de tendencia central no nos aportan la suficiente información.
Para explicar cada una vamos a realizar un ejercicio práctico.
El siguiente conjunto de datos forman una población: 2,4,6,8 y 10.
Calcular:
a)Rango
b)Varianza
c)Desviación estándar
d)Coeficiente de Variación
e)Desviación típica
a) Rango: Xmax - Xmín = Valor máximo- Valor mínimo
R= 10-2=8
b) Varianza: media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
Debemos tener en cuenta que estamos trabajando con una población y que por tanto usaremos esta fórmula:
Para ello primero debemos calcular N y la media.
N= 5 (tenemos 5 valores en nuestra población)
Utilizando esta fórmula, la media resulta ser 6.
Ahora si podemos calcular la varianza. La varianza es el sumatorio por lo que utilizaremos la tabla para ir realizando poco a poco las operaciones. Finalmente la varianza nos da 8.
c) Desviación estándar: puede definirse como la raíz cuadrada de la varianza
Según esta definición, la desviación estándar resulta ser 2,83.
d) Coeficiente de variación: cociente entre la desviación típica y la media de nuestra población. Se multiplica por 100 para mayor comprensión.
Realizando la fórmula nos sale que el coeficiente de variación es 47,14%.
e) Desviación media: media de las distancias de cada observación con respecto a la media de la muestra.
De nuevo, resolviendo la fórmula el resultado es 2,4.
Xi
|
(Xi – 6)
|
(Xi – 6)2
|
/ Xi-6/
|
2
|
-4
|
16
|
4
|
4
|
-2
|
4
|
2
|
6
|
0
|
0
|
0
|
8
|
2
|
4
|
2
|
10
|
4
|
16
|
4
|
30
|
40
|
12
|
Nos hemos ayudado de una tabla para hacer todas las operaciones de forma ordenada.
Distribución normal
Se le llama distribución normal o Gaussiana, a una de las distribuciones de probabilidad de variable continua más usadas en fenómenos reales. Su gráfica tiene forma acampanada y es simétrica respecto a los valores de posición central (distribución unimodal simétrica). A la curva se le conoce como Campana de Gauss.
Medidas de forma. Asimetría y Curtosis
Indican la asimetría y el grado de apuntamiento.
ASIMETRÍAS
Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media. Pueden llamarse también sesgadas y se caracterizan porque el pico de la misma está descentrado.
Es adimensional y toma valores entre -1 y 1.
• g1 > 0 (distribución asimétrica positiva; La cola de la distribución es más larga hacia la derecha y los valores más elevados quedan a la izquierda)
CURTOSIS O APUNTAMIENTO
Coeficiente de apuntamiento o curtosis de una variable:sirve para medir el grado de concentración de los valores que toma en torno a su media.
• Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.
• Adopta también valores entre -1 y 1. Es una medida adimensional.
• g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
• g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
No hay comentarios:
Publicar un comentario