Distribución Hipergeométrica
Es aquella que es especialmente útil en todos aquellos casos en los que se extraiga muestras o se realizan experiencias repetidas sin devolución del elemento extraído o sin deformar a la situación experimental inicial. Hasta ahora hemos analizado distribuciones que modernizaban situaciones en las que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantenía constante.
Si el proceso consistía en una serie de extracciones o selecciones ello implicaba la reposición de cada extracción o selección, o bien la consideración de una población muy grande.
Sin embargo si la población es pequeña y las extracciones no se remplazan las probabilidades no se mantendrán constantes. En ese caso las distribuciones tanto la distribución binomial, como la distribución hipergeométrica, persiguen un mismo objetivo: el número de éxitos en una muestra que contiene “n” observaciones. Lo que establece una diferencia entre estas dos distribuciones de probabilidad discreta es la forma en que se obtiene la información.
Para el caso de la distribución binomial la información de la muestra se toma con reposición de una muestra finita, o sin reposición de una población infinita. Para el modelo hipergeométrico la información de la muestra se toma sin reposición de una población finita. Por lo tanto, la probabilidad de éxito, p, es constante a lo largo de todas las observaciones de un experimento binomial, en cambio, en una distribución hipergeométrica el resultado de una observación afecta el resultado de las observaciones previas.
Modeliza, situaciones en las que se repite un número determinado de veces una prueba dicotómica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una distribución fundamental en el estudio de muestras pequeñas de poblaciones pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar a la situación de partida.
En general, el interés que se tiene es en la probabilidad de seleccionar x éxitos de los k posibles resultados o artículos también considerados éxitos y n - x fracasos de los N – k posibles resultados o artículos también considerados fracasos, cuando una muestra aleatoria de tamaño n se selecciona de N resultados o artículos totales. Esto se conoce como un experimento hipergeométrico.
La distribución hipergeométrica viene a cubrir esta necesidad de modernizar procesos de Bernouilli con probabilidades no constantes (sin re emplazamiento). La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realizan experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación experimental inicial.
La función de probabilidad de una v.a X con distribución hipergeométrica es:
La distribución hipergeométrica puede derivarse de un proceso experimental puro o de Bernouilli con las siguientes características:
Ø El proceso consta de (n) pruebas, separadas o separables de entre un conjunto de N pruebas posibles.
Ø Cada una de las pruebas puede dar únicamente dos resultados mutuamente excluyentes: A y no A.
Ø En la primera prueba las probabilidades son: P(A)= p y P(A)= q; con p+q=l.
Las probabilidades de obtener un resultado A y de obtener un resultado no A varían en las sucesivas pruebas, dependiendo de los resultados anteriores.
Ø (Derivación de la distribución). Si estas circunstancias aleatorizados de forma que la variable aleatoria X sea el número de resultados A obtenidos en n pruebas la distribución de X será una Hipergeométrica de parámetros N,n, p así
Un típico caso de aplicación de este modelo es el siguiente:
Supongamos la extracción aleatoria de “n” elementos de un conjunto formado por “N” elementos totales, de los cuales Np son del tipo A y Nq son del tipo Ā (p+q=l) .Si realizamos las extracciones sin devolver los elementos extraídos, y llamamos X, al número de elementos del tipo A que extraemos en n extracciones X seguirá una distribución hipergeométrica de parámetros N, n, p.