¡Bienvenidos y bienvenidas a mi blog!

Entradas populares

viernes, 10 de abril de 2020

TEMA 5.ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS: Profesor de ETIC y Director del Centro Universitario de Enfermería de Cruz Roja, adscrito a la Universidad de Sevilla Medidas de tendencia central. Medidas de dispersión. Medidas de posición. Forma de distribución: asimetría y curtosis.

TEMA 5. ESTADÍSTICOS UNIVARIABLES

Ya hemos estudiado las tablas de frecuencia. Es momento de aprender cuáles son las medidas estadísticas más importantes.




Existen 3 tipos de medidas estadísticas:


  • Medidas de tendencia central: valores alrededor de los cuales el resto de los datos tienden a agruparse


Media

Es la suma de todos valores de la variable observada entre el total de observaciones.






Mediana

Puntuación que ocupa la posición central de la distribución. Para calcularla, los datos deben estar ordenados de forma creciente o decreciente.

Si la mediana y la media coincide, podemos decir que la distribución es simétrica.



Moda

Es el valor que se repite con más frecuencia en la distribución. Es la medida de tendencia central menos empleada.

CARACTERÍSTICAS DE LAS MEDIDAS DE TENDENCIA CENTRAL
MEDIA
MEDIANA
MODA
La suma de desviaciones con respecto a la media es 0

La media no se altera por una transformación lineal de escala. Si a la media se le suma o multiplica un valor K, aumentará en esas unidades.
Es muy sensible a puntuaciones extremas
Es el valor de la observación tal que un 50% de los datos son menores y un 50% son mayores

Es más robusta y menos sensible a valores extremos. Es por esto que debemos usarla siempre que ocurran situaciones así.
Pueden ser unimodales, bimodales o multimodales según si tienen una moda, dos o más de dos.

Si lo datos están agrupados se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.





  • Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos
    • Cuantiles: destacan los percentiles,deciles y cuartiles, según si dividen la muestra en 100, 10 0 4 partes.
      • El valor del percentil 50 corresponde a la mediana. Cada percentil se escribe como (Pi)
      • Los deciles se escriben como (Di). El valor de D5 corresponde al de la mediana, y por tanto, a Pi
      • Los cuartiles se representan como Q1,Q2,Q3 y Q4.









CÁLCULO DE LA POSICIÓN DE UN PERCENTIL. EJERCICIO

Calcular percentil 25.

Datos

n= 50

Lp= (n +1) x P/ 100

Lp= (50+1) x 25/100= 12,75




  • Medidas de dispersión o variabilidad: información acerca de la heterogeneidad de las observaciones. Se utilizan ya que las medidas de tendencia central no nos aportan la suficiente información.
 Para explicar cada una vamos a realizar un ejercicio práctico.


El siguiente conjunto de datos forman una población: 2,4,6,8 y 10. 

Calcular:

a)Rango
b)Varianza
c)Desviación estándar
d)Coeficiente de Variación
e)Desviación típica

a) Rango: Xmax - Xmín = Valor máximo- Valor mínimo

R= 10-2=8


b) Varianza: media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Debemos tener en cuenta que estamos trabajando con una población y que por tanto usaremos esta fórmula:



Para ello primero debemos calcular N y la media.

N= 5 (tenemos 5 valores en nuestra población)

 

Utilizando esta fórmula, la media resulta ser 6.


Ahora si podemos calcular la varianza. La varianza es el sumatorio por lo que utilizaremos la tabla para ir realizando poco a poco las operaciones. Finalmente la varianza nos da 8.


c) Desviación estándar: puede definirse como la raíz cuadrada de la varianza

Según esta definición, la desviación estándar resulta ser 2,83.


d) Coeficiente de variación: cociente entre la desviación típica y la media de nuestra población. Se multiplica por 100 para mayor comprensión.


Realizando la fórmula nos sale que el coeficiente de variación es 47,14%.

e) Desviación media: media de las distancias de cada observación con respecto a la media de la muestra.

De nuevo, resolviendo la fórmula el resultado es 2,4.




Xi
   (Xi – 6)
 (Xi – 6)2
         / Xi-6/
2
-4
16
4
4
-2
4
2
6
0
0
0
8
2
4
2
10
4
16
4
30

40
12


Nos hemos ayudado de una tabla para hacer todas las operaciones de forma ordenada.


Distribución normal

Se le llama distribución normal o Gaussiana, a una de las distribuciones de probabilidad de variable continua más usadas en fenómenos reales. Su gráfica tiene forma acampanada y es simétrica respecto a los valores de posición central (distribución unimodal simétrica). A la curva se le conoce como Campana de Gauss.

Medidas de forma. Asimetría y Curtosis

Indican la asimetría y el grado de apuntamiento.


ASIMETRÍAS

Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media. Pueden llamarse también sesgadas y se caracterizan porque el pico de la misma está descentrado.

Es adimensional y toma valores entre -1 y 1.


• g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)

 • g1 > 0 (distribución asimétrica positiva; La cola de la distribución es más larga hacia la derecha y los valores más elevados quedan a la izquierda)


• g1 < 0 (distribución asimétrica negativa; La cola de la distribución es más larga hacia la izquierda y los valores más elevados quedan a la derecha)





CURTOSIS O APUNTAMIENTO

Coeficiente de apuntamiento o curtosis de una variable:sirve para medir el grado de concentración de los valores que toma en torno a su media.

• Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.
 • Adopta también valores entre -1 y 1. Es una medida adimensional.

• g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).


 • g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.


 • g2 < 0 (distribución platicúrtica) . Presenta un reducido grado de concentración alrededor de los valores centrales de la variable











No hay comentarios:

Publicar un comentario