Población: conjunto de elementos sobre los que queremos hacer afirmaciones.
Muestra: subconjunto de la población que se extrae para ser estudiado
Parámetro: número derivado del estudio de una variable estadística de toda una población.
Estadístico: Medida de resumen numérica que se calcula a partir de la muestra
Unidad de observación: Objeto sobre el cual se realiza una medición. En poblaciones humanas las unidades de observación son los humanos.
Unidad de muestreo: Unidad donde realizamos el muestreo
Marco de muestreo: Lista de las unidades de muestreo
Las familias sirven como unidades de muestreo y las unidades de observación son los individuos que viven en una familia.
Inferencia estadística
Es una rama de la estadística, que a través de métodos y muestras realiza inferencias o generalizaciones de una población.
El muestreo se realiza para obtener información acerca de los parámetros desconocidos de la población, por medio de un experimento que permite observar o medir las características de la población, de las cuáles se tiene incertidumbre.
Por qué una muestra
Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población
Objetivos del muestreo
Describir la muestra: Estadística Descriptiva
Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.
Cómo elegir el tamaño de la muestra
Algunos Criterios Generales son;
¿Qué se va a medir?
¿Qué se quiere determinar?
Nivel máximo de error admisible.
Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral
Variabilidad de las características a medir
Se dice que las variables aleatorias \(X_1, X_2, . . . , X_n\) forman una muestra aleatoria simple de tamaño n si:
Las \(X_i\) son variables aleatorias independientes.
Cada \(X_i\) tiene la misma distribución de probabilidad, en la mayoría de veces se asume normal.
Cualquier función de las variables aleatorias que forman una muestra se llaman estadístico .
Es decir las \(X_i\) son independientes e idénticamente distribuidas (iid) \[𝑋_i\sim N(0,\sigma ^2)\]
Qué es el nivel de confianza
Probabilidad máxima con la que podríamos asegurar que el parámetro a estimar se encuentra dentro de nuestro intervalo estimado.
Representa el porcentaje de intervalos que tomados de 100 muestras independientes distintas contienen en realidad el valor desconocido.
Ejemplo:
Si se construyen 100 intervalos de la forma \(\hat \theta_{inf}< \theta <\hat \theta_{sup}\) con un nivel de confianza NC=0.97 entonces se espera que 97 de los 100 intervalos contengan el parámetro \(\theta\)
Es la probabilidad máxima que asumimos de forma voluntaria de equivocarnos al rechazar la hipótesis nula cuando en realidad es cierta.
Máximo error que queremos cometer en nuestra estimación o contraste.
\[\Huge NC+\alpha=100\% \]
NC | NS \(\alpha\) | \(Z_\alpha\) | \(\alpha/2\) | \(Z_{\alpha/2}\) |
---|---|---|---|---|
90% | 10% | 5% | ||
95% | 5% | 2.5% | ||
99% | 1% | 0.05% |
Video
Población finita
\[\Large n=\frac{N*Z_{\alpha/2}^2*\sigma ^2}{(N-1)e^2+Z_{\alpha/2}^2\sigma^2}\] Población Infinita
\[\Large n=\frac{Z_{\alpha/2}^2\sigma ^2}{e^2}\]
Ejemplo población infinita
Se desea estimar el contenido medio de un refresco con un nivel de confianza del 93%, con un error máximo de estimación de 5 ml. Muestras previas indican que la desviación del contenido es 12 ml. Calcular el tamaño de muestra.
NC=0.93
\(\alpha=0.07\)
\(\alpha/2=0.035\)
\(Z_{\alpha/2}=1.81\)
\(\sigma=12 ml\)
\(e=5 ml\)
\[\Large n=\frac{Z_{\alpha/2}^2\sigma ^2}{e^2}\]
\[\Large n=\frac{1.81^2* 12 ^2}{5^2}=19\]
Se deben hacer mediciones en 19 refrescos.
Video
Población finita \[\Large n=\frac{NZ_{\alpha/2}^2pq}{(N-1)e^2+Z_{\alpha/2}^2pq}\]
Población Infinita \[\Large n=\frac{Z_{\alpha/2}^2pq}{e^2}\] Ejemplo población infinita
Se desea estimar con un nivel de confianza del 97%, el porcentaje de clientes que compraría un nuevo producto, para esto se toma una muestra previa de 80 clientes, de los cuales 65 manifestarían que compraría el nuevo producto. Si se desea un error máximo de estimación del 6%. calcule el tamaño de muestra.
NC=0.97
\(\alpha=0.03\)
\(\alpha/2=0.015\)
\(Z_{\alpha/2}=2.17\)
\(p=\frac{65}{80}\approx 0.8\)
q=0.2
\(e=0.06\)
\[\Large n=\frac{Z^2pq}{e^2}\]
\[\Large n=\frac{2.17^2*0.8*0.2}{0.06^2}\approx 210\] Se deben encuestar 210 personas para conocer sus preferencias sobre la compra o no del producto.
Tamaños de muestra para la media 1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras?
Rta/ Si el tamaño de la muestra es 36, se puede tener un 95% de confianza en que $$ difiere en menos de 4 libras de \(\bar x\) .
Rta/ Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas.
Rta/ Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta.
Tamaños de muestra para la proporción
Rta/ Si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
Rta/ Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10.
Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de montaje. Si la experiencia previa sugiere que \(\sigma= 16 seg\). mide la variación en el tiempo de montaje entre un trabajador y otro al realizar una sola operación de montaje, ¿cuántos operarios habrá que incluir en la muestra? Rta/n=44
Un ingeniero de control de calidad quiere estimar la fracción de elementos defectuosos en un gran lote de lámparas. Por la experiencia, cree que la fracción real de defectuosos tendría que andar alrededor de 0.2. �Qué tan grande tendría que seleccionar la muestra si se quiere estimar la fracción real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%? rta/6147
1.Se basa en el juicio personal del investigador.
2.Puede generar buenas muestras pero no permite una evaluación estadística de confianza.
Algunos de este tipo de muestreo son:
Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación. El criterio de selección (lugar, tiempo y demás) es completamente dependiente del investigador, sin reglas predeterminadas.
Ejemplos:
Encuestas en la calle
Encuestas a estudiantes
Encuestas web
Permite dividir la población en grupos o estratos que comparten características como el sexo, la edad, los estudios, etc., y de ellos se selecciona una muestra proporcional y representativa.
Por ejemplo: en una empresa grande quieren saber cuáles son los hobbies preferidos por sus empleados. Como son tantas personas, deciden dividirlas en dos estratos, por género: hombres y mujeres.
Las mujeres representan el 40 % de los empleados y los hombres el 60 %, por lo tanto, el investigador decide que en la muestra se incluirán 40 mujeres y 60 hombres para tener un total de 100 individuos en el estudio. Así, asegura que la participación de cada género es proporcional a la población que representan. A esos porcentajes elegidos se les llama cuotas.
Se selecciona un grupo inicial, los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales”,es útil si el tamaño de la muestra es pequeño y no está disponible fácilmente.esta técnica ayuda a los investigadores a encontrar muestras cuando son difíciles de localizar.
Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.
Por ejemplo: si un investigador está buscando personas con cierta enfermedad, contacta a uno o dos individuos que presenten dicha condición médica y que ellos mismos sean quienes te recomienden a otros individuos con una historia médica parecida.
Se controla la probabilidad de seleccionar un determinado individuo, permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.
Algunos de este tipo de muestreo son:
Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros.
Con reemplazo: se pueden repetir elementos Sin reemplazo: no se pueden repetir elementos Se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.
Muestreo sistemático Muestreo estratificado Muestreo por grupos
Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, género, ocupación.
Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato
Dentro de cada estrato se puede proceder con muestreo simple.
El método de muestreo por conglomerados se utiliza cuando la población está agrupada naturalmente.
Si se supone que los conglomerados son muestra significativa de la variable que se está estudiando, se puede seleccionar algunos grupos al azar (todos los conglomerados deben tener las mismas probabilidades de ser seleccionados) y utilizarlos en representación de la población.
En la práctica, el conglomerado más utilizado es el geográfico. Si queremos hacer un estudio en un país, podemos dividir el país en conglomerados como las comunidades, provincias, ciudades
Diferencia entre el muestreo por conglomerados y estratos
Se utiliza en muestras ordenadas del 1 al N. Supongamos que tenemos una población de N individuos ordenados del 1 al N. Queremos seleccionar una muestra de tamaño n. Sea k el entero más próximo a N/n. Escogemos al azar un número i entre 1 y k (utilizando los números aleatorios, sacar una bola de un bombo, etc.). La muestra será el elemento i y los elementos i+k, i+2k, etc. Es decir, el elemento k y los elementos a intervalos fijos k hasta conseguir los n sujetos:
Ejemplo Se quiere saber la opinión sobre un profesor de una clase de 60 personas. Dichas personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para realizar la encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre sujetos es:
\[k=N/n =60/12=5\] Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale \(i=2\). La muestra resultado mediante el muestreo sistemático será:
Ejemplo
Ficha técnica de la encuesta
Item | Respuesta |
---|---|
Persona jurídica que realizó la encuesta: | YanHaas S.A Incrito ante el consejo nacional electoral |
Encomendada y financiada por: | Alianza de medios; RCN y periódicos asociados |
Tipo de estudio/ Investigación | Exploratorio /Cuantitativo |
Temas a los que se refiere: | Intención de voto para las elecciones presidenciales 2022 |
Universo poblacional: | Potencial de sufragantes 9.583.254, en las cinco regiones geográficas de estudio: Antioquia-eje cafetero(1), Caribe (2), Bogotá (3), central-Oriente (4) y pacífica (5) |
Grupo objetivo | Hombres y mujeres mayores de 18 años que manifestaron intención de voto en las próximas elecciones presidenciales del año 2022 |
Sistema de muestreo | Muestreo aleatorio estratificado por región y tamaño del municipio según censo electoral |
Técnica de muestreo | Entrevista personal cara a cara en hogares |
Marco muestral: | Censo electoral colombiano discriminado por municipios |
Elemento muestral | Persona mayor de edad, residente de las principales regiones de colombia, que manifestaron intención de voto |
Tamaño de la muestra: | 1249 encuestas distribuidas en 60 municipios del país |
Margen de error observado: | 3.2% |
Nivel de confianza: | 95% |