Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones.

Tipos de hipótesis

Hipótesis nula

\(H_0\)= Hipótesis nula, status quo

\[\Large H_0:\theta=\theta_0\]

Hipótesis alternativa

\(H_1\)= Hipótesis alternativa, sospecha

cola superior

\[\Large H_0:\theta>\theta_0\] cola inferior

\[\Large H_0:\theta<\theta_0\] cola doble

\[\Large H_0:\theta\neq \theta_0\] Nota:

\(\theta\) puede ser cualquier estadístico como la media, la varianza, l adiferencia de medias o de proporciónes o razón de varianzas, lo que cambia es la distribución asociada, varía dependiendo del caso

Tipos de errores

Decisión \(H_0\) verdadera \(H_0\) Falsa
Aceptar \(H_0\) \(\checkmark\) Error tipo II \(\beta\)
Rechazar \(H_0\) Error tipo I \(\alpha\) \(\checkmark\)

Error tipo I falso negativo \(\alpha\): Rechazar \(H_0\), dado que es verdadera

Error tipo II falso positivo \(\beta\): Aceptar \(H_0\), dado que es falsa

Ejemplos

Formulación \(H_0\) \(H_1\) Falso positivo Falso negativo
Una prueba de embarazo No está embarazada Está embarazada Reportar que está embarazada cuando en realidad no está Reportar que no está embarazada cuando en realidad lo está
Prueba de genero de un bebe Feto femenino Feto masculino Reportar un feto masculino cuando en realidad es femenino Reportar un feto femenino cuando en realidad es masculino

Pasos para realizar una prueba de hipótesis

  • Algunos videos de interés

Valor p

• Probabilidad de obtener un estadístico (igual al que se obtuvo o más extremo)

• Probabilidad de equivocarse rechazando la hipótesis nula

• Se contrasta con el nivel de significancia \(\alpha\)

  • Si valor p < \(\alpha\) Rechaza la hipótesis nula

  • Si valor p > \(\alpha\) Acepta la hipotesis nula

Pruebas de hipótesis para una muestra

PH para la media

Hipótesis nula:

\[H_0= \mu=\mu_0\]

Estadístico

Se pueden considerar dos tipos de estadísticos

Normal t student
\(\Large z=\frac{\bar x-\mu}{\sigma/\sqrt n}\) \(\Large t=\frac{\bar x-\mu}{s/\sqrt n}\)

Recuerde que:

Estadístico Muestral Poblacional
Media \(\bar x\) \(\mu\)
Desviación s \(\sigma\)
Tamaño n N

Hipótesis alternativa:

Cola \(H_1\) RR (t student) RR Normal Z
Superior \(\mu>\mu_0\) \(t\geq t_{\alpha,n-1}\) \(Z\geq Z_\alpha\)
Inferior \(\mu<\mu_0\) \(t\leq -t_{\alpha,n-1}\) \(Z\leq -Z_\alpha\)
DC sup \(\mu \neq\mu_0\) \(t\geq t_{\alpha/2,n-1}\) \(Z\geq Z_{\alpha/2}\)
DC inf \(t\leq -t_{\alpha/2,n-1}\) \(Z\leq -Z_{\alpha/2}\)

Ejemplo con la distribución t

Se desea verificar si un proceso de llenado de bolsas de café con 500 gr, está operando correctamente, para ello se toman muestras de tamaño 10 cada 4 horas, una muestra de bolsas tiene los siguientes resultados

502 501 497 491 496 501 502 500 489 490
## [1] 496.9
## [1] 5.173651

Está el proceso llenando bolsas conforme a lo que dice la envoltura?

Siguiendo los pasos de las pruebas de hipótesis

1. Definir las hipótesis

\[H_0:\quad \mu=500 gr\] \[H_1:\quad \mu \neq 500 gr\]

2. Definir el error tipo I denotado por alfa 0.05

3. Calcular el estadístico

Según la normal o según la t de student??

Es la varianza conocida??

Es el tamaño de muestra n>30??

\[\Large t=\frac{\bar x-\mu}{s/\sqrt n}\]

\[\Large t=\frac{496.9-500}{5.17/\sqrt 10}=-1.89\]

4. definir el valor p

\[P(t_9<-1.89)=0.046\]

como es una prueba a doble cola

\[Vp=0.046*2=0.092\]

5. Tomar desición

Como vp>0.05 Acepto \(H_0\) el proceso cumple con lo que dice la etiqueta 500 gr

4. Definir región de aceptación y rechazo

Como es una prueba a doble cola \[\alpha=0.05 \quad \alpha/2=0.025\] se definen los cuantiles que satisfacen esas condiciones.

\[t_{v=9,0.025}=-2.26\]

\[t_{v=9,0.975}=2.26\]

En R

## 
##  One Sample t-test
## 
## data:  vec
## t = -1.8948, df = 9, p-value = 0.09064
## alternative hypothesis: true mean is not equal to 500
## 95 percent confidence interval:
##  493.199 500.601
## sample estimates:
## mean of x 
##     496.9

Ejemplo con la distribución normal

Un fabricante de alarma de calor, afirma que la temperatura de activación del sistema es de 130 F. Una muestra de n=9 sistemas, cuando se somete a prueba, da una temperatura de activación promedio muestral de 131.08 F. Si la distribución de los tiempos de activación es normal con desviación estándar de 1.5 F, ¿contradicen los datos la afirmación del fabricante a un nivel de significancia 0.01

Siguiendo los pasos de las pruebas de hipótesis

Datos

\(\mu=130F \quad \bar x=131.08F \quad \sigma=1.5F\)

1. Definir las hipótesis

\[H_0:\quad \mu=130 F\] \[H_1:\quad \mu > 130 F\]

2. Definir el error tipo I denotado por alfa 0.01

3. Calcular el estadístico

Según la normal o según la t de student??

Es la varianza conocida??

Es el tamaño de muestra n>30??

\[\Large Z=\frac{\bar x-\mu}{\sigma/\sqrt n}\]

\[\Large Z=\frac{131.08-130}{1.5/\sqrt 9}=2.16\]

4. definir el valor p

\[P(Z>2.16)=0.0154\]

5. Tomar desición

Como vp>0.05 (0.0154 >0.01) Acepto \(H_0\), la temperatura de activación es igual a 130 F

4. Definir región de aceptación y rechazo

Se define el cuantil que satisface la condición. 0.01 en el lado superior equivalente al 0.99

\[Z_{0.99}=2.32\]

PH para la proporción

Hipótesis nula:

\[H_0= p=p_0\]

Estadístico

\[\Large z=\frac{\hat p-p_0}{\sqrt{p_0*q_0/ n}}\] Recuerde que:

Hipótesis alternativa:

Cola \(H_1\) RR Normal Z
Superior \(p>p_0\) \(Z\geq Z_\alpha\)
Inferior \(p<p_0\) \(Z\leq -Z_\alpha\)
DC sup \(p \neq p_0\) \(Z\geq Z_{\alpha/2}\)
DC inf \(Z\leq -Z_{\alpha/2}\)

Ejemplo

La obesidad es un problema creciente entre grupos de todas las edades. un estudio reportó que 1276 individuos en una muestra de 4115 adultos fueron encontrados obesos.

Una encuesta reveló que el 20% de los estadounidenses adultos se autoconsideraron obesos. ¿Sugieren los datos más recientes que la proporción verdadera de adultos obesos es más de 1.5 veces el porcentaje de la encuesta de autoevaluación?

Realice una prueba de hipótesis utilizando un nivel de significancia de 0.10.

Pasos

Datos

\[p=\frac{1276}{4115}=0.31\quad q=0.69\]

1. Definir las hipótesis

\[\Large H_0= p=0.3\] \[\Large H_1= p>0.3\]

2. Definir el error tipo I denotado por alfa 0.1

3. Calcular el estadístico

\[\Large z=\frac{\hat p-p_0}{\sqrt{p_0*q_0/ n}}=\frac{0.31-0.3}{\sqrt{0.3*0.7/ 4115}}=\]

\[z=\frac{0.31-0.3}{\sqrt{0.3*0.7/ 4115}}=\frac{0.01}{0.007}=1.4\] 4. definir el valor p

\[P(Z>1.4)=0.081\]

5. Tomar desición

Como vp<0.1 (0.081 < 0.1) Rechazo \(H_0\), la proporción de personas obesas es mayor del 30%.

4. Definir región de aceptación y rechazo Se define el cuantil que satisface la condición. 0.1 en el lado superior equivalente al 0.9

\[Z_{0.9}=1.282\]

PH para la varianza

Surgen situaciones que requieren inferencias acerca de la variabilidad,relacionando con la uniformidad de una población. por ejemplo la variabilidad de las calificaciones otorgadas por cierto profesor en determinado examen. Se esperaría que las puntuaciones tuvieran una varianza pequeña.

Se parte bajo el supuesto de la muestra proviene de una población que se distribuye normal.

Hipótesis nula:

\[\Large H_0= \sigma=\sigma_0^2\]

Estadístico

\[\Large\chi^2=\frac{(n-1)S^2}{\sigma_0^2}\]

Hipótesis alternativa:

Cola \(H_1\) RR (Chi cuadrado)
Superior \(\sigma>\sigma_0^2\) \(\chi^2\geq \chi_{\alpha,n-1}\)
Inferior \(\sigma<\sigma_0^2\) \(\chi^2\leq \chi_{1-\alpha,n-1}\)
DC sup \(\sigma\neq \sigma_0^2\) \(\chi^2\geq \chi_{\alpha/2,n-1}\)
DC inf \(\chi^2\leq \chi_{\alpha/2,n-1}\)

Ejemplo

Datos históricos indican que la varianza de las mediciones sobre una lámina metálica es de 0.18 pulgadas cuadradas.Las mediciones realizadas por un inspector nuevo podrían tener una varianza mayor o menor. Si un nuevo inspector mide 40 laminas grabadas con una varianza de 0.13 pulgadas cuadradas, pruébese con un nivel de significancia de 0.05 si el inspector realiza mediciones satisfactorias.

Solución

Datos

n=13, \(S^2=0.13\), \(\sigma^2=0.18\)

1. Juego de hipótesis

\[\Large H_0= \sigma^2=0.18\] \[\Large H_1= \sigma^2 \neq 0.18\]

2. Definir el error tipo I denotado por alfa 0.05

3. Estadístico

\[\Large\chi^2=\frac{(n-1)S^2}{\sigma_0^2}=\frac{(39)0.13}{0.18}=28.16\]

4. Definir el valor p

\[P(\chi^2_{12}>28.16)=(0.0052)*2 colas=0.0104\] vp=0.0104

5. Desición

Como vp <0.05 (0.0104 < 0.05) Rechazo \(H_0\), la proporción de laminas es diferente de 0.18

4. Definir región de aceptación y rechazo

Pruebas de hipótesis para dos muestras

PH diferencia de medias

Varianzas Estadístico Varianza
Iguales pero desconocidas \[t_{n_1+n_2-2}=\frac{(\bar X_1-\bar X_2)-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\] \[s^2_p=\left[\frac {(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2} \right]\]
Diferentes y desconocidas \[t_{n_1+n_2-2}=\frac{\bar x_1-\bar x_2-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\]
diferentes \[Z=\frac{\bar x_1-\bar x_2-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\]

Hipótesis nula: \[H_0=\mu_x-\mu_y=\mu_d\] Donde \(\mu_d=0\) representa la diferencia que se desea probar entre los valores desconocidos de las medias poblacionales,si \(\mu_d=0\) significa que: \[H_0=\mu_x=\mu_y\]

PH diferencia de medias pareadas

Diferencia de proporciones



Copyright © 2019, webpage made with Rmarkdown.