Definiciones

Población: conjunto de elementos sobre los que queremos hacer afirmaciones.

Muestra: subconjunto de la población que se extrae para ser estudiado

Parámetro: número derivado del estudio de una variable estadística de toda una población.

Estadístico: Medida de resumen numérica que se calcula a partir de la muestra

Unidad de observación: Objeto sobre el cual se realiza una medición. En poblaciones humanas las unidades de observación son los humanos.

Unidad de muestreo: Unidad donde realizamos el muestreo

Marco de muestreo: Lista de las unidades de muestreo

Las familias sirven como unidades de muestreo y las unidades de observación son los individuos que viven en una familia.

Inferencia estadística

Es una rama de la estadística, que a través de métodos y muestras realiza inferencias o generalizaciones de una población.

El muestreo se realiza para obtener información acerca de los parámetros desconocidos de la población, por medio de un experimento que permite observar o medir las características de la población, de las cuáles se tiene incertidumbre.

Muestreo

Por qué una muestra

Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población

Objetivos del muestreo

  • Describir la muestra: Estadística Descriptiva

  • Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.

Cómo elegir el tamaño de la muestra

Algunos Criterios Generales son;

  • ¿Qué se va a medir?

  • ¿Qué se quiere determinar?

  • Nivel máximo de error admisible.

  • Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral

  • Variabilidad de las características a medir

Se dice que las variables aleatorias \(X_1, X_2, . . . , X_n\) forman una muestra aleatoria simple de tamaño n si:

  1. Las \(X_i\) son variables aleatorias independientes.

  2. Cada \(X_i\) tiene la misma distribución de probabilidad, en la mayoría de veces se asume normal.

  3. Cualquier función de las variables aleatorias que forman una muestra se llaman estadístico .

Es decir las \(X_i\) son independientes e idénticamente distribuidas (iid) \[𝑋_i\sim N(0,\sigma ^2)\]

Nivel de confianza

Qué es el nivel de confianza

  • Probabilidad máxima con la que podríamos asegurar que el parámetro a estimar se encuentra dentro de nuestro intervalo estimado.

  • Representa el porcentaje de intervalos que tomados de 100 muestras independientes distintas contienen en realidad el valor desconocido.

Ejemplo:

Si se construyen 100 intervalos de la forma \(\hat \theta_{inf}< \theta <\hat \theta_{sup}\) con un nivel de confianza NC=0.97 entonces se espera que 97 de los 100 intervalos contengan el parámetro \(\theta\)

Nivel de significancia

  • Es la probabilidad máxima que asumimos de forma voluntaria de equivocarnos al rechazar la hipótesis nula cuando en realidad es cierta.

  • Máximo error que queremos cometer en nuestra estimación o contraste.

\[\Huge NC+\alpha=100\% \]

NC NS \(\alpha\) \(Z_\alpha\) \(\alpha/2\) \(Z_{\alpha/2}\)
90% 10% 5%
95% 5% 2.5%
99% 1% 0.05%

Tamaños de muestra

Para la media

Video

Población finita

\[\Large n=\frac{N*Z_{\alpha/2}^2*\sigma ^2}{(N-1)e^2+Z_{\alpha/2}^2\sigma^2}\] Población Infinita

\[\Large n=\frac{Z_{\alpha/2}^2\sigma ^2}{e^2}\]

Ejemplo población infinita

Se desea estimar el contenido medio de un refresco con un nivel de confianza del 93%, con un error máximo de estimación de 5 ml. Muestras previas indican que la desviación del contenido es 12 ml. Calcular el tamaño de muestra.

NC=0.93

\(\alpha=0.07\)

\(\alpha/2=0.035\)

\(Z_{\alpha/2}=1.81\)

\(\sigma=12 ml\)

\(e=5 ml\)

\[\Large n=\frac{Z_{\alpha/2}^2\sigma ^2}{e^2}\]

\[\Large n=\frac{1.81^2* 12 ^2}{5^2}=19\]

Se deben hacer mediciones en 19 refrescos.

Para la proporción

Video

Población finita \[\Large n=\frac{NZ_{\alpha/2}^2pq}{(N-1)e^2+Z_{\alpha/2}^2pq}\]

Población Infinita \[\Large n=\frac{Z_{\alpha/2}^2pq}{e^2}\] Ejemplo población infinita

Se desea estimar con un nivel de confianza del 97%, el porcentaje de clientes que compraría un nuevo producto, para esto se toma una muestra previa de 80 clientes, de los cuales 65 manifestarían que compraría el nuevo producto. Si se desea un error máximo de estimación del 6%. calcule el tamaño de muestra.

NC=0.97

\(\alpha=0.03\)

\(\alpha/2=0.015\)

\(Z_{\alpha/2}=2.17\)

\(p=\frac{65}{80}\approx 0.8\)

q=0.2

\(e=0.06\)

\[\Large n=\frac{Z^2pq}{e^2}\]

\[\Large n=\frac{2.17^2*0.8*0.2}{0.06^2}\approx 210\] Se deben encuestar 210 personas para conocer sus preferencias sobre la compra o no del producto.

EJercicios

Tamaños de muestra para la media 1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras?

Rta/ Si el tamaño de la muestra es 36, se puede tener un 95% de confianza en que $$ difiere en menos de 4 libras de \(\bar x\) .

  1. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?

Rta/ Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas.

  1. Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?

Rta/ Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta.

Tamaños de muestra para la proporción

  1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. �Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02?

Rta/ Si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.

  1. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10?

Rta/ Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10.

  1. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de montaje. Si la experiencia previa sugiere que \(\sigma= 16 seg\). mide la variación en el tiempo de montaje entre un trabajador y otro al realizar una sola operación de montaje, ¿cuántos operarios habrá que incluir en la muestra? Rta/n=44

  2. Un ingeniero de control de calidad quiere estimar la fracción de elementos defectuosos en un gran lote de lámparas. Por la experiencia, cree que la fracción real de defectuosos tendría que andar alrededor de 0.2. �Qué tan grande tendría que seleccionar la muestra si se quiere estimar la fracción real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%? rta/6147

Tipos de muestreo

Muestreo no-Probabilístico

1.Se basa en el juicio personal del investigador.

2.Puede generar buenas muestras pero no permite una evaluación estadística de confianza.

  1. Frecuentemente usado como primera aproximación

Algunos de este tipo de muestreo son:

  • Muestreo por conveniencia
  • Muestreo por cuotas
  • Muestreo tipo “bola de nieve” (snowball)

Muestreo por Conveniencia

Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación. El criterio de selección (lugar, tiempo y demás) es completamente dependiente del investigador, sin reglas predeterminadas.

Ejemplos:

  • Encuestas en la calle

  • Encuestas a estudiantes

  • Encuestas web

Muestreo por cuotas o estratos

Permite dividir la población en grupos o estratos que comparten características como el sexo, la edad, los estudios, etc., y de ellos se selecciona una muestra proporcional y representativa.

Por ejemplo: en una empresa grande quieren saber cuáles son los hobbies preferidos por sus empleados. Como son tantas personas, deciden dividirlas en dos estratos, por género: hombres y mujeres.

Las mujeres representan el 40 % de los empleados y los hombres el 60 %, por lo tanto, el investigador decide que en la muestra se incluirán 40 mujeres y 60 hombres para tener un total de 100 individuos en el estudio. Así, asegura que la participación de cada género es proporcional a la población que representan. A esos porcentajes elegidos se les llama cuotas.

Muestreo bola de nieve

Se selecciona un grupo inicial, los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales”,es útil si el tamaño de la muestra es pequeño y no está disponible fácilmente.esta técnica ayuda a los investigadores a encontrar muestras cuando son difíciles de localizar.

Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.

Por ejemplo: si un investigador está buscando personas con cierta enfermedad, contacta a uno o dos individuos que presenten dicha condición médica y que ellos mismos sean quienes te recomienden a otros individuos con una historia médica parecida.

Muestreo probabilístico

Se controla la probabilidad de seleccionar un determinado individuo, permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.

Algunos de este tipo de muestreo son:

Muestreo aleatorio simple

Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros.

Con reemplazo: se pueden repetir elementos Sin reemplazo: no se pueden repetir elementos Se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.

Muestreo sistemático Muestreo estratificado Muestreo por grupos

Muestreo aleatorio estratificado

Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, género, ocupación.

Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato

Dentro de cada estrato se puede proceder con muestreo simple.

Muestreo por conglomerados

El método de muestreo por conglomerados se utiliza cuando la población está agrupada naturalmente.

Si se supone que los conglomerados son muestra significativa de la variable que se está estudiando, se puede seleccionar algunos grupos al azar (todos los conglomerados deben tener las mismas probabilidades de ser seleccionados) y utilizarlos en representación de la población.

En la práctica, el conglomerado más utilizado es el geográfico. Si queremos hacer un estudio en un país, podemos dividir el país en conglomerados como las comunidades, provincias, ciudades

Diferencia entre el muestreo por conglomerados y estratos

Muestreo sistemático

Se utiliza en muestras ordenadas del 1 al N. Supongamos que tenemos una población de N individuos ordenados del 1 al N. Queremos seleccionar una muestra de tamaño n. Sea k el entero más próximo a N/n. Escogemos al azar un número i entre 1 y k (utilizando los números aleatorios, sacar una bola de un bombo, etc.). La muestra será el elemento i y los elementos i+k, i+2k, etc. Es decir, el elemento k y los elementos a intervalos fijos k hasta conseguir los n sujetos:

Ejemplo Se quiere saber la opinión sobre un profesor de una clase de 60 personas. Dichas personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para realizar la encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre sujetos es:

\[k=N/n =60/12=5\] Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale \(i=2\). La muestra resultado mediante el muestreo sistemático será:

Ejemplo

Ficha técnica de la encuesta

Item Respuesta
Persona jurídica que realizó la encuesta: YanHaas S.A Incrito ante el consejo nacional electoral
Encomendada y financiada por: Alianza de medios; RCN y periódicos asociados
Tipo de estudio/ Investigación Exploratorio /Cuantitativo
Temas a los que se refiere: Intención de voto para las elecciones presidenciales 2022
Universo poblacional: Potencial de sufragantes 9.583.254, en las cinco regiones geográficas de estudio: Antioquia-eje cafetero(1), Caribe (2), Bogotá (3), central-Oriente (4) y pacífica (5)
Grupo objetivo Hombres y mujeres mayores de 18 años que manifestaron intención de voto en las próximas elecciones presidenciales del año 2022
Sistema de muestreo Muestreo aleatorio estratificado por región y tamaño del municipio según censo electoral
Técnica de muestreo Entrevista personal cara a cara en hogares
Marco muestral: Censo electoral colombiano discriminado por municipios
Elemento muestral Persona mayor de edad, residente de las principales regiones de colombia, que manifestaron intención de voto
Tamaño de la muestra: 1249 encuestas distribuidas en 60 municipios del país
Margen de error observado: 3.2%
Nivel de confianza: 95%


Copyright © 2019, webpage made with Rmarkdown.