¡Bienvenidos y bienvenidas a mi blog!

Entradas populares

jueves, 30 de abril de 2020

TEMA 7. TEORÍA DE LA PROBABILIDAD.Conceptos básicos. Distribución y reglas básicas de la probabilidad. Teorema de Bayés. Distribución de probabilidad discreta: binomial y de Poisson. Distribución de probabilidad continua: normal o campana de Gauss


TEMA 7. TEORÍA DE LA PROBABILIDAD





La probabilidad es la medida de ocurrencia de un evento que es incierto. Se expresa con valores de 0 a 1, a través de los porcentajes.

La probabilidad nos ayuda a tomar decisiones, ya que de alguna manera reducimos la incertidumbre.















La probabilidad presenta 3 vertientes:


































LEY DE LOS GRANDES NÚMEROS: número hacia el que tienden las frecuencias relativas de un suceso cuando repetimos un evento un número elevado de veces.


EJERCICIO

En un saco tenemos 40 gramos de arroz integral y arroz basmati. Calcula la probabilidad de que al sacar un grano de arroz, este sea integral.

Nº de granos de arroz que extraemos
Nº de granos arroz integral (frecuencia absoluta)
Frecuencia relativa
100
42
0,42
1000
419
0419
5000
2050
0,41

Si tenemos estos datos, y calculamos la frecuencia relativa obtendremos que 0,4 es el número hacia el que tienden las frecuencias relativas. Para ello no nos bastaría con esos valores, sino con un número elevado de eventos.



EVENTOS O SUCESOS

El conjunto de todos los resultados posibles en un estudio se llama espacio muestral.

  • Un evento es un subconjunto de esos resultados
  • Un evento complementario de un suceso A, está formado por elementos que A no tiene y se denomina Ac
  • Se llama evento unión de A y B, al conjunto de resultados de A y B
  • Se llama evento intersección de A y B, a los elementos que presentan en común.
Los sucesos pueden ser dependientes, cuando no hay relación entre ellos; e independientes.

Sucesos compatibles: aquellos que tienen sucesos en común
Sucesos incompatibles: no presentan ningún suceso en común

¿Qué es la unión de sucesos compatibles?


¿Y la unión de sucesos incompatibles?

Intersección de sucesos: elementos en común de A y B




Teoría de la Probabilidad





PROBABILIDAD DE UN SUCESO OSCILA ENTRE 0 Y 1

PROBABILIDAD DE EVENTO SEGURO=1

PROBABILIDAD DE EVENTO IMPOSIBLE=0

PROBABILIDAD DE SUCESO CONTRARIO= 1- P (A)

PROBABILIDAD CONDICIONADA
Probabilidad de que ocurra un suceso A si ha ocurrido B.

B debe ser distinto a 0




TEOREMA DE BAYES
Probabilidad de A dado a B con la probabilidad de B dado a A.

También puede usarse la ecuación de la probabilidad condicionada



DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN DE POISSON
Modelo matemático de variables discretas (cara/cruz, hombre/mujer). El resultado obtenido en cada prueba es independiente del resto.

P(A)=constante=ÉXITO

P(A´)=1-P=Q=FRACASO

N=nº de pruebas del experimento


 



Poisson era un médico militar francés. Se estudió la probabilidad de que un soldado muriera por los golpes de un caballo.

Se estudian sucesos raros o poco frecuentes y el resultado se representa por una variable discreta. Se miden áreas, volúmenes…

No se conoce el total de posible resultados.





DISTRIBUCIONES NORMALES





Criterios de tipificación


  • Variables continuas que siguen una DN y tienen más de 100 unidades+
  • Como los valores deben estar entre 0 y 1 debemos tipificar tanto la media como la desviación típica y así saber si un valor corresponde o no a una distribución
  • Debemos usar una tabla de tipificación de distribuciones normales.



EJERCICIOS


1. Si se lanza un dado, cual es la probabilidad de que... (teniendo en cuenta que hay como máximo 6 resultados)

1.1.Caiga un 3.

Nº de eventos favorables/ Nº de eventos posibles

P(3)=1/6=0,16


1.2.Caiga menos de 10.

P(<10)=1, ya que todos los valores que obtendremos serán más pequeños que el 10.

1.3.Caiga un 8.

P(8)=0

1.4.Que no caiga en 5.

Es lo mismo que la probabilidad de que salga el número 1,2,3,4 y 6.

1-P(5)=1-(1/6)=0,83


2. Si se lanza una moneda al aire, la probabilidad de que salga cara es 1/2. ¿Qué probabilidad hay de que en 6 tiradas al aire salgan 2 caras?

En primer lugar, analizamos los datos.

P= 1/2
N=6
x= 2 caras

Utilizamos la fórmula  y sustituimos.






P[ x=2]= ( 6      x  (1/2)^2 x (1/2)^4= 23,43% de probabilidad de que salgan 2 caras
                    2  )   


3. Se realiza una escala de autoestima a una muestra de 500 mujeres. Recogemos los siguientes datos con una escala de actitud de 20 puntos y obtenemos lo siguiente:

Media de autoestima: 8
Desviación típica:2

¿Qué porcentaje de mujeres tienen puntuaciones de autoestima entre 5 y 8?

1) Tipificación de los valores.

P[ 5<=x<=8]

Zx= X-m/s= d-8/2= -1,5

Zx= 8-8/2=0

Buscamos -1,5 en la tabla tipificada de valores negativos y el resultado es 0,06. Para mejor comprensión lo multiplicamos por cien.

Solución: Un 6% ha obtenido una puntuación entre 5 y 8.


¿Qué proporción de mujeres tiene una puntuación igual o más de 13?

P[x>=13]

Zx=13-8/2=2,5

Y>=2,5

Al no poder ser >=, debemos hacer la siguiente operación:

1-P[ Y<=2,5]

Buscamos 2,5 en la tabla de tipificación y nos da 0,993

1-0,993= 0,0062

0,0062x100=6,2


Solución: Un 6,2% de mujeres han obtenido una puntuación igual o mayor de 13.



4.La glucemia basal de los diabéticos atendidos en la consulta de enfermería puede considerarse como una variable normalmente distribuida con media 106 mg por 100ml y desviación típica de 8 mg por 100 ml N (106;8)

Media=106
Desviación típica=8

Calcula el nivel de glucemia basal tal que por debajo de él estén el 25% de los diabéticos.

Este ejercicio ya nos da la probabilidad, y debemos calcular el valor inicial o A.

P[X<=A]=0,25, siendo la A nuestra incógnita

P [Y<=A]=0,25

Queremos encontrar el valor de Z en la tabla y por ello buscamos el 0,25. El valor no es exacto, se encuentra entre 0,25143 y 0,24825. Por lo tanto Z será un valor entre -0,67 y -0,68.

El valor medio sería -0,675

Despejamos la A en la ecuación


Zx= A-m/2

-0,675= X-106/2= 100,6

Solución: El 25% de los diabéticos presenta un nivel de glucemia de 100,6 mg/ml







viernes, 10 de abril de 2020

TEMA 6. REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN: Representación variables cualitativas y cuantitativas discretas. Representación de variables cuantitativas continuas. Errores en las representaciones.

TEMA 6. REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN





Representaciones gráficas:


  • Forma de representación de datos numéricos, que complementa el análisis estadístico,ofreciendo una orientación visual. A pesar de esto, no remplaza a las medidas estadísticas que deben calcularse.
  • Toda representación gráfica debe:
    • Ser clara
    • Debe incluir información en pie de figura y en texto. Usar referencias como Vancouver y APA.
    • Representar las conclusiones del estudio
    • No sobrecargados


¿Cuáles son las más utilizadas? Dependerá de las variables que representen.


Variables cualitativas


Gráfico de sectores: para variables nominales dicotómicas o policotómicas


  • El área de cada sector es proporcional a la frecuencia absoluta o relativa, de las categorías de la variable
  • No usar ni para variables ordinales ni para estudios de más de 3 categorías
  • Muestra 1 variable
  • Si necesitas hacer un estudio en lugares diferentes, debes realizar distintos gráficos de sectores






Errores en gráficos de sectores


  • En las variables policotómicas, si usamos demasiadas categorías, el gráfico resulta ser desordenado y caótico. Habrá categorías cuya representación no sea exacta.
  • No puede usarse para representar variables ordinales, ya que pueden perderse los atributos de jerarquía


Diagrama de barras: para representar variables policotómicas. Muy usado en Ciencias de la Salud.

  • Las frecuencias absolutas y relativas son fácilmente representables
  • Cada barra representa una categoría y su altura la frecuencia. Las barras deben estar separadas
  • El eje Y empieza con la frecuencia 0


  • Puede representarse de forma horizontal, a pesar de que verticalmente es más común. 





  • Puede segregarse por sexos.





Errores en gráficos de barras


  • Uso de variables cuantitativas. Estas deben representarse con histogramas, resúmenes numéricos...
  • Se comparan frecuencias absolutas, y esta no es comparable ya que está sesgada. Las frecuencias relativas sí son más acertadas.

Pictogramas: generalmente usados en variables cualitativas. No son tan comunes.

  • Utiliza figuras proporcionales a la frecuencia de la categoría.
  • No permite buenas comparaciones ya que la figura, a veces, aparecerá desvirtuada






Variables cuantitativas


Histograma


  • Muy usado debido a su sencillez de interpretación. Sucesión de rectángulos contiguos que están construidos sobre una recta.
    • La base de cada rectángulo representa la amplitud del intervalo.
    • La altura representa la frecuencia
  • Puede usarse para variables cuantitativas discretas.


















  • También útil para representar variables cuantitativas continuas.
PESO EN KG DE NIÑOS ATENDIDOS EN LA CONSULTA DE NIÑO SANO n=40





Podemos ver como en este histograma se unen los puntos medios de las bases superiores de los rectángulos. A esto se le llama polígono de frecuencia. Permite visualizar las diferencias de frecuencia de una categoría a otra y resume el resultado del histograma.

Su utilidad radica en la posibilidad de comparación de dos o más distribuciones.

La suma de las áreas de los rectángulos del histograma,a es igual al área limitada por el polígono de frecuencias y el eje X.





Gráficos de tronco y hojas: variables cuantitativa continua


  • En la primera columna se representan los tallos. En este caso, el primer dígito.
  • En la segunda columna las hojas. En este caso, el segundo dígito.
  • Es un diagrama híbrido entre una tabla (información ordenada) y una gráfica (como un histograma)
  • ¿Cuál es la ventaja de estos gráficos? No pierden información individual, identifica la media y mediana en algunos casos y si existen clases faltantes. Para algunos autores es la representación gráfica ideal.




Datos bidimensionales y multidimensionales



Gráficos para datos bidimensionales. Gráficos tendencias temporales.


Nubes de puntos. Scatter plot. Diagrama de dispersión

  • Para representaciones de dos variables, la independiente en el eje X y la dependiente en el eje Y.
  • La imagen del diagrama nos informa sobre la correlación entre las 2 variables






















Como podemos comprobar, no hay una correlación.

Correlación positiva: tendencia ascendente, tipo bisectriz, a medida que aumentan los valores

Correlación negativa: tendencia descendente, a medida que aumentan los valores

Ninguna asociación: dispersión, que da lugar a una asimetría. No podría explicarse la relación entre las 2 variables



Diagramas de estrellas: para representar distintas variables cuantitativas


  • Podemos comparar distintas unidades de análisis, ya sean conglomerados o individuos
  • Cada variable representa un vértice del diagrama
  • Muestra una idea del comportamiento conjunto de las variables.
  • Permite comparativa con un " gold standard" u objetivo idóneo.
































TEMA 5.ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS: Profesor de ETIC y Director del Centro Universitario de Enfermería de Cruz Roja, adscrito a la Universidad de Sevilla Medidas de tendencia central. Medidas de dispersión. Medidas de posición. Forma de distribución: asimetría y curtosis.

TEMA 5. ESTADÍSTICOS UNIVARIABLES

Ya hemos estudiado las tablas de frecuencia. Es momento de aprender cuáles son las medidas estadísticas más importantes.




Existen 3 tipos de medidas estadísticas:


  • Medidas de tendencia central: valores alrededor de los cuales el resto de los datos tienden a agruparse


Media

Es la suma de todos valores de la variable observada entre el total de observaciones.






Mediana

Puntuación que ocupa la posición central de la distribución. Para calcularla, los datos deben estar ordenados de forma creciente o decreciente.

Si la mediana y la media coincide, podemos decir que la distribución es simétrica.



Moda

Es el valor que se repite con más frecuencia en la distribución. Es la medida de tendencia central menos empleada.

CARACTERÍSTICAS DE LAS MEDIDAS DE TENDENCIA CENTRAL
MEDIA
MEDIANA
MODA
La suma de desviaciones con respecto a la media es 0

La media no se altera por una transformación lineal de escala. Si a la media se le suma o multiplica un valor K, aumentará en esas unidades.
Es muy sensible a puntuaciones extremas
Es el valor de la observación tal que un 50% de los datos son menores y un 50% son mayores

Es más robusta y menos sensible a valores extremos. Es por esto que debemos usarla siempre que ocurran situaciones así.
Pueden ser unimodales, bimodales o multimodales según si tienen una moda, dos o más de dos.

Si lo datos están agrupados se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.





  • Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos
    • Cuantiles: destacan los percentiles,deciles y cuartiles, según si dividen la muestra en 100, 10 0 4 partes.
      • El valor del percentil 50 corresponde a la mediana. Cada percentil se escribe como (Pi)
      • Los deciles se escriben como (Di). El valor de D5 corresponde al de la mediana, y por tanto, a Pi
      • Los cuartiles se representan como Q1,Q2,Q3 y Q4.









CÁLCULO DE LA POSICIÓN DE UN PERCENTIL. EJERCICIO

Calcular percentil 25.

Datos

n= 50

Lp= (n +1) x P/ 100

Lp= (50+1) x 25/100= 12,75




  • Medidas de dispersión o variabilidad: información acerca de la heterogeneidad de las observaciones. Se utilizan ya que las medidas de tendencia central no nos aportan la suficiente información.
 Para explicar cada una vamos a realizar un ejercicio práctico.


El siguiente conjunto de datos forman una población: 2,4,6,8 y 10. 

Calcular:

a)Rango
b)Varianza
c)Desviación estándar
d)Coeficiente de Variación
e)Desviación típica

a) Rango: Xmax - Xmín = Valor máximo- Valor mínimo

R= 10-2=8


b) Varianza: media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Debemos tener en cuenta que estamos trabajando con una población y que por tanto usaremos esta fórmula:



Para ello primero debemos calcular N y la media.

N= 5 (tenemos 5 valores en nuestra población)

 

Utilizando esta fórmula, la media resulta ser 6.


Ahora si podemos calcular la varianza. La varianza es el sumatorio por lo que utilizaremos la tabla para ir realizando poco a poco las operaciones. Finalmente la varianza nos da 8.


c) Desviación estándar: puede definirse como la raíz cuadrada de la varianza

Según esta definición, la desviación estándar resulta ser 2,83.


d) Coeficiente de variación: cociente entre la desviación típica y la media de nuestra población. Se multiplica por 100 para mayor comprensión.


Realizando la fórmula nos sale que el coeficiente de variación es 47,14%.

e) Desviación media: media de las distancias de cada observación con respecto a la media de la muestra.

De nuevo, resolviendo la fórmula el resultado es 2,4.




Xi
   (Xi – 6)
 (Xi – 6)2
         / Xi-6/
2
-4
16
4
4
-2
4
2
6
0
0
0
8
2
4
2
10
4
16
4
30

40
12


Nos hemos ayudado de una tabla para hacer todas las operaciones de forma ordenada.


Distribución normal

Se le llama distribución normal o Gaussiana, a una de las distribuciones de probabilidad de variable continua más usadas en fenómenos reales. Su gráfica tiene forma acampanada y es simétrica respecto a los valores de posición central (distribución unimodal simétrica). A la curva se le conoce como Campana de Gauss.

Medidas de forma. Asimetría y Curtosis

Indican la asimetría y el grado de apuntamiento.


ASIMETRÍAS

Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media. Pueden llamarse también sesgadas y se caracterizan porque el pico de la misma está descentrado.

Es adimensional y toma valores entre -1 y 1.


• g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)

 • g1 > 0 (distribución asimétrica positiva; La cola de la distribución es más larga hacia la derecha y los valores más elevados quedan a la izquierda)


• g1 < 0 (distribución asimétrica negativa; La cola de la distribución es más larga hacia la izquierda y los valores más elevados quedan a la derecha)





CURTOSIS O APUNTAMIENTO

Coeficiente de apuntamiento o curtosis de una variable:sirve para medir el grado de concentración de los valores que toma en torno a su media.

• Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.
 • Adopta también valores entre -1 y 1. Es una medida adimensional.

• g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).


 • g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.


 • g2 < 0 (distribución platicúrtica) . Presenta un reducido grado de concentración alrededor de los valores centrales de la variable