MUESTREO EN ESTADISTICA
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.
Técnicas de muestreo
• El marco o base de la muestra. Conjunto de unidades que constituyen la población. Por ejemplo, españoles de ambos sexos que viven en la península y son mayores de edad. Lo ideal sería tener un registro de la población en el que aparecieran todas sus unidades, pero hay ocasiones en que ese registro no existe, pues hay poblaciones que no están censadas. En la práctica suelen utilizarse bases ya formadas como los censos de población o los padrones municipales, etcétera.
• Unidades muestrales. Cada uno de los elementos que constituyen la base o marco de la muestra. Esas unidades pueden ser individuales o colectivas. Si la unidad es colectiva, al número de individuos que la componen se le llama talla de la muestra.
Ejemplo.-
N = 580.000 (población)
n = 2.000 (muestra) (2.000/580.000) 100= 0'35
• COEFICIENTE DE ELEVACIÓN.- Es el número de veces que el tamaño de la población contiene al tamaño de la muestra (N/n).
Ejemplo.-
N = 200.000 (población)
n = 1.000 (muestra) 200.000/1.000=200
Métodos de muestreo.
Existen distintos métodos para obtener muestras:
La gran ventaja que presentan las muestras probabilísticas es que permiten la inferencia estadística. Es decir, permiten trasladar los datos de la muestra al conjunto de la población mientras que las no probabilísticas no.
Para que un muestreo sea probabilístico han de seguirse determinadas normas en el proceso de elección de los individuos (o unidades muestrales). Esas normas dan origen a los 4 métodos básicos de muestreo probabilístico. De los 4 métodos, los 3 primeros son monoetápicos, las unidades muestrales se eligen en una sola etapa.
El muestreo por conglomerados suele ser polietápico, y esas unidades muestrales no son individuales, sino conglomerados de elementos.
RECOLECCIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN
La estadística como herramienta de la investigación necesita trabajar con datos numéricos, como número de habitantes de un país, edades, etc., que a veces pueden llegar a millones. Por esto, es difícil manejarlos y se hace necesario agruparlos y presentarlos en tablas (organización de los datos).
Ejemplo: En una localidad se encontró que sus habitantes tenían las siguientes edades:
25, 30, 10, 8, 7, 30, 45, 43, 32, 30, 9, 2, 1, 6, 20, 27, 29, 15, 13, 21, 11, 60, 3, 65, 6, 5, 12, 13, 14, 22, 21, 42, 47, 34, 35.
Elaborar una distribución de frecuencias para los datos obtenidos en un estudio sobre edades.
Solución
A)-Se cuenta en número de datos datos = N N = 35
B) Se ordenan tales datos (N) de menor a mayor (cuidando que no falte ninguno).
1, 2, 3, 5, 6, 6, 7, 8, 9, 10, 11, 12, 13, 13, 14, 15, 20, 21, 21, 22, 25, 27, 29, 30, 30, 30, 32, 34, 35, 42, 43, 45, 47, 60, 65.
C) Se halla el RANGO diferencia entre el mayor y el menor de los datos. 65 – 1 = 64 R = 64
D) Repartimos el rango en grupos de la misma longitud, dividiendo el rango por el número de grupos. Es tos grupos se le llaman INTERVALOS O CLASES, y se escogen entre 5 y 10. En este caso elegimos 8.
E) Construimos una tabla de datos agrupados.