viernes, 4 de marzo de 2016

Pruebas de bondad de ajuste

Pruebas de bondad de ajuste



En la construcción del modelo de simulación es importante decidir si un conjunto de datos se ajusta apropiadamente a una distribución específica de probabilidad. Al probar la bondad del ajuste de un conjunto de datos, se comparan las frecuencias observadas FOrealmente en cada categoría o intervalo de clase con las frecuencias esperadas teóricamente FE.
Se mide una única variable categórica, por lo tanto cada elemento de la población se asigna a una y sólo una de varias categorías k.
Para cada categoría se posee un valor preconcebido o supuesto o histórico de pi y usamos información muestral para determinar si dichos valores son correctos.

Fuentes de información:
http://es.slideshare.net/williamleon20/pruebas-de-bondad-de-ajuste-est-ind-clase10

Ejemplo: Ji cuadrada

Ejemplo: Ji cuadrada


Planteamiento

La siguiente muestra de tamaño 50 ha sido obtenida de una población que registra la vida útil (en unidades de tiempo) de baterías alcalinas tipo AAA. Pruébese la hipótesis nula de que la variable aleatoria vida útil de las baterías sigue una distribución exponencial negativa. Considérese un nivel de significancia alfa de 5%.
8.223
0.836
2.634
4.778
0.406
0.517
2.330
2.563
0.511
6.426
2.230
3.810
1.624
1.507
2.343
1.458
0.774
0.023
0.225
3.214
2.920
0.968
0.333
4.025
0.538
0.234
3.323
3.334
2.325
7.514
0.761
4.490
1.514
1.064
5.088
1.401
0.294
3.491
2.921
0.334
1.064
0.186
2.782
3.246
5.587
0.685
1.725
1.267
1.702
1.849

Solución

Calculamos los valores min = 0.023 y max = 8.223. Resultando ser el rango o recorrido igual a 8.2. El valor promedio es de 2.3. A continuación ordenamos los valores de manera ascendente y construimos el histograma de frecuencias relativas con seis clases cada una de longitud 1.5. (esto es debido a que 8.2 / 6 = 1.3)
k
Clase
FO absoluta
FO relativa
1
0.0 – 1.15
21
0.42
2
1.15 – 3.0
15
0.30
3
3.0 – 4.5
8
0.16
4
4.5 – 6.0
3
0.06
5
6.0 – 7.5
1
0.02
6
7.5 – 9.0
2
0.04
Re – agrupamos las clases de modo que la FO sea de al menos 5
k
Clase
FO absoluta
FO relativa
1
0.0 – 1.15
21
0.42
2
1.15 – 3.0
15
0.30
3
3.0 – 4.5
8
0.16
4
4.5 – 9.0
6
0.12
Como nuestra hipótesis nula es que los datos se ajustan a la función de probabilidad exponencial negativa, emplearemos tal función para calcular mediante integración el porcentaje de probabilidad esperado para cada subintervalo. Ya vimos que el valor promedio es de 2.3, sin embargo para fines prácticos lo consideraremos como 2.0. El cálculo de la integral para la primer clase es:
k
Clase
FO relativa
FE teórica
(FO-FE)2FE
1
0.0 – 1.5
0.42
0.528
0.022
2
1.5 – 3.0
0.30
0.249
0.010
3
3.0 – 4.5
0.16
0.118
0.015
4
4.5 – 9.0
0.12
0.105
0.002
Entonces se tiene el valor
Ahora compararemos este valor calculado contra el valor tabulado de la distribución Ji – cuadrada con un nivel de significancia alfa de 5% y el número de grados de libertad
V = (k –1) – 1 = (4 –1) –1 = 2. Entonces:
Como vemos el valor calculado es menor que el valor tabulado, por tanto la conclusión es que no se puede rechazar la hipótesis nula de que la muestra proviene de una distribución exponencial con media 2.0.
Fuentes de información:

Prueba Ji Cuadrada

Prueba Ji Cuadrada



La prueba Ji cuadrada hace uso de la distribución del mismo nombre para probar la bondad del ajuste al comparar el estadístico de prueba Xo2 con el valor en tablas de la mencionada distribución Ji cuadrada con v grados de libertad y un nivel de significancia alfa. En la siguiente sección aplicaremos esta prueba para probar la hipótesis nula de que los números aleatorios (provenientes de un generador) se ajustan a la distribución teórica uniforme continua.
Sea X una variable aleatoria discreta con valores x1, x2,……., xn Se propone la hipótesis nula H0, de que la distribución de donde proviene la muestra se comporta según un modelo teórico específico tal como la uniforme, la exponencial, la normal, etc. Entonces FOi, representa el número de veces que ocurre el valor xi mientras que FEi, es la frecuencia esperada proporcionada por el modelo teórico propuesto. A menudo ocurre que muchas de las frecuencias FEi, (y también las FOi) son muy pequeñas, entonces, como regla práctica adoptamos el criterio de agrupar los valores consecutivos de estas frecuencias esperadas hasta que su suma sea de al menos cinco. La medida estadística de prueba para la hipótesis nula es:
Para n grande este estadístico de prueba tiene una distribución X2aproximada con V grados de libertad dados por

V= (k –1) – (número de parámetros estimados)
así, si se estiman dos parámetros como la media y la varianza, la medida estadística tendrá (k – 3) grados de libertad.
Se puede aplicar esta prueba a variables continuas agrupando adecuadamente los valores en un número adecuado de subintervalos o clases k. Una regla empírica para seleccionar el número de clases es: