Prueba de Kolmogorov-Smirnov
Otra prueba para la bondad de ajuste se apoya en la distribución de Kolmogorov – Smirnov la que al ser desarrollada para variables continuas la hace más poderosa por ejemplo, en el caso de los números aleatorios, que la Ji cuadrada. Por esta razón, en esta sección la presentamos para un caso distinto al de la distribución continua.
Definamos la siguiente función de distribución empírica. Supóngase que Y es una variable aleatoria continua que tiene una función de distribución F(y). Una muestra aleatoria de n realizaciones de Yproduce las observaciones y1, y2, …, yn. Reordenemos esos valores observados de menor a mayor, y las yi ordenadas se representan mediante y(1) y(2) …, y(n). Es decir, si y1 = 7, y2 = 9 y y3 = 3, entoncesy(1) = 3, y(2) = 7 y y(3) = 9. Ahora bien, la función de distribución acumulada empírica esta definida por:
F n(y) = fracción de la muestra menor o igual a y
Supóngase que se toma una variable aleatoria continua Y, bajo la hipótesis nula, que tiene una función de distribución representada por F (y). La hipótesis alterna es que F (y) no es la función verdadera de distribución de es la función verdadera de distribución de Y. Después de observar una muestra aleatoria de n valores deY, F (y) debe estar “cerca“ de F n(y) siempre y cuando sea verdadera la hipótesis nula. Por lo tanto, la medida estadística debe apreciar la cercanía de F(y) a Fn(y) en todo el intervalo de valores de y.
La medida estadística D de K-S se basa en la distancia máxima entre F(y)y Fn(y), es decir,
D = máx ¦ F(y) – Fn(y) ¦
Se rechaza la hipótesis nula si D es “demasiado grande”.
Como F(y) y Fn(y) no son decrecientes y Fn(y) es constante entre observaciones de muestra, la desviación máxima entre F(y) y Fn(y), se presentará ya sea en uno de los puntos de observación y1 , … yn, o inmediatamente a la izquierda de uno de ellos. Para determinar el valor observado de D, se necesita entonces comprobar tan sólo
D+ = máx y D- = máx
Ya que D = máx (D+ , D-)
Si en H0 se supone la forma de F (y), pero se deja sin especificar algunos de los parámetros, entonces éstos se deben estimar a parir de los datos de la muestra antes de poder llevar a cabo la prueba.
Stephens (1974) dio valores de corte de áreas superiores de 0.15, 0.10, 0.05, 0.025 y 0.01 para una forma modificada de la tabla K – S para D (presentada en el apéndice de este libro), los cuales se muestran en la siguiente tabla para tres casos. Estos casos son para la hipótesis nula de una F(y) completamente especificada, unaF(y) normal con promedio y variancia desconocidos, y una F(y)exponencial con promedio desconocido.
TABLA DE KOLMOGOROV – SMIRNOV DE STEPHENS. Puntos porcentuales del extremo superior para D modificada
Fuentes de información:
No hay comentarios.:
Publicar un comentario