¿Qué es una distribución muestral?
Una distribución muestral es una distribución de probabilidad de una estadística obtenida de un mayor número de muestras extraídas de una población específica. La distribución muestral de una población dada es la distribución de frecuencias de un rango de resultados diferentes que posiblemente podrían ocurrir para una estadística de una población .
En estadística , una población es el conjunto completo del que se extrae una muestra estadística . Una población puede referirse a un grupo completo de personas, objetos, eventos, visitas al hospital o mediciones. Por tanto, se puede decir que una población es una observación agregada de sujetos agrupados por una característica común.
- Una distribución muestral es una estadística que se obtiene mediante un muestreo repetido de una población más grande.
- Describe un rango de posibles resultados de una estadística, como la media o la moda de alguna variable, que realmente existe una población.
- La mayoría de los datos analizados por los investigadores provienen de muestras y no de poblaciones.
Comprensión de la distribución muestral
Una gran cantidad de datos extraídos y utilizados por académicos, estadísticos, investigadores, comercializadores, analistas, etc. son en realidad muestras, no poblaciones. Una muestra es un subconjunto de una población. Por ejemplo, un investigador médico que quisiera comparar el peso promedio de todos los bebés nacidos en América del Norte de 1995 a 2005 con los nacidos en América del Sur en el mismo período de tiempo no puede, dentro de un período de tiempo razonable, extraer los datos de toda la población de más de un millón de partos que se produjeron durante el período de diez años. En cambio, solo usará el peso de, digamos, 100 bebés, en cada continente para llegar a una conclusión. El peso de 200 bebés utilizado es la muestra y el peso medio calculado es la media de la muestra.
Ahora suponga que en lugar de tomar solo una muestra de 100 pesos de recién nacidos de cada continente, el investigador médico toma muestras aleatorias repetidas de la población general y calcula la media de la muestra para cada grupo de muestra. Entonces, para América del Norte, obtiene datos para 100 pesos de recién nacidos registrados en los EE. UU., Canadá y México de la siguiente manera: cuatro 100 muestras de hospitales seleccionados en los EE. UU., Cinco 70 muestras de Canadá y tres 150 registros de México, para un total de 1200 pesos de recién nacidos agrupados en 12 juegos. También recopila datos de muestra de 100 pesos al nacer de cada uno de los 12 países de América del Sur.
Cada muestra tiene su propia media muestral y la distribución de las medias muestrales se conoce como distribución muestral.
El peso promedio calculado para cada conjunto de muestras es la distribución muestral de la media. No solo se puede calcular la media a partir de una muestra. Otras estadísticas , como la desviación estándar, la varianza, la proporción y el rango se pueden calcular a partir de datos de muestra. La desviación estándar y la varianza miden la variabilidad de la distribución muestral.
Saber cuán separada está la media de cada uno de los conjuntos de muestras entre sí y de la media de la población dará una indicación de qué tan cerca está la media de la muestra de la media de la población. El error estándar de la distribución muestral disminuye a medida que aumenta el tamaño de la muestra.