title: “Pruebas no paramétricas” |
output: |
html_document: |
toc: true |
toc_depth: 5 |
Gran parte de los procedimientos descritos anteriormente de pruebas de hipótesis, consideran que las observaciones provienen de poblaciones normales. En muchas situaciones este supuesto no se cumple. Una alternativa a la no normalidad de los datos, es proceder a implementar pruebas no paramétricas.
La hipotesis nula y alternativa de normalidad son las siguientes:
\[H_0: \quad Los\quad datos\quad se\quad distribuyen \quad normal\]
\[H_1: \quad Los\quad datos\quad no \quad se\quad distribuyen \quad normal\] Existen diferentes pruebas para evaluar la normalidad, todas son de fácil implementación en R.
Se emplea para saber si una distribución de probabilidad acumulada difiere de una distribución hipotética, por lo general la distribución normal, la uniforme, la de Poisson o la exponencial. Es decir permite contrastar si un conjunto de datos muestrales proviene de un tipo de distribución.
Estadístico
Cuando K-S se aplica para contrastar la hipótesis de normalidad de la población, el estadístico de prueba es la máxima diferencia entre las funciones de distribución de probabilidad muestral y la teórica:
\[D=max|F_n-F_0(x)|\]
Siendo \(F_n(x)\) la función de distribución muestral y \(F_0(x)\) es la función teórica (normal) especificada en la hipotesis nula \(H_0\)
Pruebas de hipótesis
\(H_0:\) Los datos analizados siguen una distribución M.
\(H_1:\) Los datos analizados no siguen una distribución M
Ejemplo probando la distribución exponencial
Celia quiere medir el tiempo de atención a los usuarios. Se seleccionaron 20 personas y los tiempos de atención en minutos.
## [1] 2 13
Se procede a revisar el ajuste con respecto a una distribución exponencial con un α=0.05
Sea X el tiempo entre llegadas a Celia Express.
\[H_0:X∼exp\]
\[H_1:X≁exp\] la siguiente función ayuda a estimar los parámetros del modelo
## rate
## 0.11030831
## (0.02466569)
##
## One-sample Kolmogorov-Smirnov test
##
## data: tiempo
## D = 0.13678, p-value = 0.8006
## alternative hypothesis: two-sided
Según las pruebas realizadas, no se rechaza la hipótesis nula y por tanto, se asume la distribución exponencial.
Ejemplo comparando dos distribuciones
x y y provienen de la misma distribución
\[H_0:X∼y\]
\[H_1:X≁y\]
##
## Two-sample Kolmogorov-Smirnov test
##
## data: x and y
## D = 0.5, p-value = 9.065e-05
## alternative hypothesis: two-sided
También se usa para contrastar normalidad de un conjunto de datos, cuando la muestra es como máximo de tamaño 50. Es una alternativa más potente que la prueba de K-S.
Para efectuarla se calcula la media y la varianza muestral \(S^2\), y se ordenan las observaciones de menor a mayor, luego se calculan las diferencias entre: el primero y el último; el segundo y el penúltimo; el tercero y el antepenúltimo, etc. y se corrigen con unos coeficientes tabulados por Shapiro-Wilk.
El estadístico de prueba es:
\[W=\frac{D^2}{nS^2}\]
donde D es la suma de las diferencias corregidas.
Ejemplo en R probando normalidad
Se necesita verificar si es correcto suponer que el volumen de llenado (en onzas) de una máquina dispensadora de jugos sigue una distribución normal, por lo que se toman 25 botellas de forma aleatoria. Los datos del volumen de llenado obtenidos de la muestra se encuentran almacenados en el vector volumen.
Hipótesis
\(H_0:\) el volumen de llenado (en onzas) sigue una distribución normal.
\(H_1:\) el volumen de llenado (en onzas) no sigue una distribución normal.
Nivel de significancia: 0.05 (Hipotético).
Analisis descriptivo
## [1] 11.8144
## [1] 1.4036
## [1] 5 1
##
## One-sample Kolmogorov-Smirnov test
##
## data: volumen
## D = 0.21516, p-value = 0.1703
## alternative hypothesis: two-sided
##
## Shapiro-Wilk normality test
##
## data: volumen
## W = 0.8161, p-value = 0.0004272
Ejemplo en R
Se mide las concentraciones de cortisol en dos grupos de mujeres antes de dar a luz. Al grupo 1 se le practicó una cesárea de urgencias después de inducido el parto. Las del grupo 2, dieron a luz mediante operación cesárea o vía vaginal después de presentarse el trabajo de parto expontáneamente.
Verifique normalidad en los conjuntos de datos usando α = 0.05.
Verifique la igualdad de varianzas entre los grupos de datos
Según la prueba de varianzas, que prueba recomienda para comparar las medias entre los grupos de madres
###Ingresamos los datos como vectores de los dos grupos de madres
grupo1=c(411,466,432,409,381,363,449,483,438,381)
grupo2=c(584,553,516,688,650,590,574,700,831,688,478,689)
## Prueba de normalidad
shapiro.test(grupo1)
##
## Shapiro-Wilk normality test
##
## data: grupo1
## W = 0.96658, p-value = 0.8575
shapiro.test(grupo2)
##
## Shapiro-Wilk normality test
##
## data: grupo2
## W = 0.95245, p-value = 0.673
#prueba para saber si provienen de la misma distribución
ks.test(grupo1,grupo2)
## Warning in ks.test(grupo1, grupo2): cannot compute exact p-value with ties
##
## Two-sample Kolmogorov-Smirnov test
##
## data: grupo1 and grupo2
## D = 0.91667, p-value = 0.0002089
## alternative hypothesis: two-sided
## Prueba de igualdad entre varinzas
var.test(grupo1,grupo2)
##
## F test to compare two variances
##
## data: grupo1 and grupo2
## F = 0.16182, num df = 9, denom df = 11, p-value = 0.0108
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.04510143 0.63304938
## sample estimates:
## ratio of variances
## 0.1618194
## prueba de diferencias entre medias
t.test (grupo1,grupo2,paired=FALSE,conf.level=0.95)
##
## Welch Two Sample t-test
##
## data: grupo1 and grupo2
## t = -6.7277, df = 14.996, p-value = 6.787e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -272.7363 -141.4970
## sample estimates:
## mean of x mean of y
## 421.3000 628.4167
\[H_0:grupo1∼grupo2\]
\[H_1:grupo1≁grupo2\]
Es una prueba no paramétrica para identificar diferencias entre dos poblaciones basadas en el análisis de dos muestras independientes.
Se usa cuando los conjuntos de datos no cumplen los requisitos de la prueba de t-Student y la normal, (normalidad de los datos y tamaño de muestra mayor a 30)
Para realizar la prueba las observaciones de las dos muestras deben estar en orden ascendente.
También se conoce con otros nombres: Mann–Whitney–Wilcoxon, Wilcoxon rank-sum test y Wilcoxon–Mann–Whitney. Por ello está disponible en R por medio de la función wilcox.test.
La prueba se basa en una comparación de cada observación de una muestra \(x_i\) con cada observación en la segunda muestra \(y_i\) Si las muestras tienen la misma mediana, entones cada observación tiene un 50% de probabilidad de ser mayor o menor que la observación correspondiente de la otra muestra. Por tanto plantea las hipotesis:
\[H_o:P(x_i>y_i)=0.5\] \[H_1: P(x_i>y_i) \neq 0.5\]
Ejemplo Prueba de wilcoxon en R
Los datos siguientes datos corresponden a constantes de permeabilidad de la membrana chorioamnion en humanos (una membrana placentaria) medida a las 12 y 26 semanas de edad gestacional.
realice una prueba de normalidad para verificar la normalidad en los conjuntos de datos
Asumiendo que los datos no son normales, pruebe a un nivel de significancia de α = 0.05 para chequear la alternativa, mayor permeabilidad de la membrana chorioamnion para el inicio del embarazo.
x=c(0.80, 0.83, 1.89, 1.04, 1.45, 1.38, 1.91, 1.64, 0.73, 1.46)
y=c(1.15, 0.88, 0.90, 0.74, 1.21)
# prueba no parametrica dewilcoxon
wilcox.test(x,y, alternative = "g")
##
## Wilcoxon rank sum exact test
##
## data: x and y
## W = 35, p-value = 0.1272
## alternative hypothesis: true location shift is greater than 0
##PRUEBA DE NORMALIDAD
shapiro.test(x)
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.91129, p-value = 0.29
shapiro.test(y)
##
## Shapiro-Wilk normality test
##
## data: y
## W = 0.91538, p-value = 0.5006
Para estimar los parámetros de una distribución de probabilidad discreta (poisson y bonimial), se requiere la función goodfit del paquete vcd. Esta función también realiza la prueba de bondad y ajuste y sus argumentos son: variable de interés, tipo de distribución y método. Se usará el test de Chi-cuadradado a través del argumento “MinChisq”
En el supermercado doña Celia, se está estudiando el comportamiento del número de personas que llegan cada hora. Se analizaron 20 horas, cuyos datos se consignan a continuación:
Análisis exploratorio Se analiza los gráficos para determinar una distribución hipotética.
En este caso, la variable de interés registra un número de eventos por unidad de tiempo, por lo que se sugiere analizar el ajuste a una distribución poisson. Se muestra la respectiva prueba de hipótesis. Sea X el número de clientes que visitan Celia Express.
\(H_0:\)X∼Poisson
\(H_1:\)X≁Poisson
Se realizará el análisis con un α=0.01
## $lambda
## [1] 13.60833
## Warning in summary.goodfit(gf): Chi-squared approximation may be incorrect
##
## Goodness-of-fit test for poisson distribution
##
## X^2 df P(> X^2)
## Pearson 19.30042 19 0.4377217
Los siguientes datos corresponden al rendimiento por hectárea de cierta nueva variedad de trigo, medido en 9 lotes experimentales:
3,35; 3,92; 4,26; 3,36; 3,72; 4,19, 3,42; 4,38; 4,5.3
Realice una prueba de normalidad sobre el vector de datos
Construya un intervalo de confianza al 90% de confianza para el rendimiento promedio de la nueva variedad de trigo si suponemos que el rendimiento por hectárea se distribuye aproximadamente normal.
Para la salida de R construya una prueba de hipótesis
Verifique la hipótesis que el rendimiento medio es mayor que 4
#vector de datos
T<-c(3.35,3.92,4.26,3.36,3.72,4.19,3.42,4.38,4.5)
#Prueba de normalidad sobre el vector T
shapiro.test(T)
##
## Shapiro-Wilk normality test
##
## data: T
## W = 0.89424, p-value = 0.2205
#Tabulación de datos
table(T)
## T
## 3.35 3.36 3.42 3.72 3.92 4.19 4.26 4.38 4.5
## 1 1 1 1 1 1 1 1 1
#histograma de los datos
hist(T,breaks=3,col=4)
#gráfico de densidad de dtos
plot(density(T))
##prueba t de dos colas
t.test(T,conf.level=0.90)
##
## One Sample t-test
##
## data: T
## t = 25.674, df = 8, p-value = 5.681e-09
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
## 3.617526 4.182474
## sample estimates:
## mean of x
## 3.9
##prueba t de cola superior
t.test(T,conf.level=0.90,alternative="greater",mu=4)
##
## One Sample t-test
##
## data: T
## t = -0.65831, df = 8, p-value = 0.7356
## alternative hypothesis: true mean is greater than 4
## 90 percent confidence interval:
## 3.687817 Inf
## sample estimates:
## mean of x
## 3.9
Dos variables aleatorias X e Y son llamadas independientes si la distribución de probabilidad de una de las variables no es afectada por la presencia de la otra. Asuma que \(Oij\) es la frecuencia observada de eventos que pertenecen a ambos, la i−ésima categoría de X y la j−ésima categoría de Y. Además, suponga que eij son las correspondientes frecuencias esperadas si X e Y son independientes.
Prueba de hipótesis \[H_0: \quad Los\quad datos\quad son \quad independientes\] \[H_1: \quad Los\quad datos\quad no \quad son \quad independientes\]
Estadístico:
\[ \large \chi^2=\sum_{i,j}^n \frac {(o_{ij}-e_{ij})^2}{e_{ij}}\]
Se usan los datos de la base survey de la librería MASS de R, que corresponden a 237 observaciones provenientes de una encuesta a estudiantes de estadística de una Universidad en Australia.
## Sex Wr.Hnd NW.Hnd W.Hnd Fold Pulse Clap Exer Smoke Height
## 1 Female 18.5 18.0 Right R on L 92 Left Some Never 173.00
## 2 Male 19.5 20.5 Left R on L 104 Left None Regul 177.80
## 3 Male 18.0 13.3 Right L on R 87 Neither None Occas NA
## 4 Male 18.8 18.9 Right R on L NA Neither None Never 160.00
## 5 Male 20.0 20.0 Right Neither 35 Right Some Never 165.00
## 6 Female 18.0 17.7 Right L on R 64 Right Some Never 172.72
## 7 Male 17.7 17.7 Right L on R 83 Right Freq Never 182.88
## 8 Female 17.0 17.3 Right R on L 74 Right Freq Never 157.00
## 9 Male 20.0 19.5 Right R on L 72 Right Some Never 175.00
## 10 Male 18.5 18.5 Right R on L 90 Right Some Never 167.00
## 11 Female 17.0 17.2 Right L on R 80 Right Freq Never 156.20
## 12 Male 21.0 21.0 Right R on L 68 Left Freq Never NA
## 13 Female 16.0 16.0 Right L on R NA Right Some Never 155.00
## 14 Female 19.5 20.2 Right L on R 66 Neither Some Never 155.00
## 15 Male 16.0 15.5 Right R on L 60 Right Some Never NA
## 16 Female 17.5 17.0 Right R on L NA Right Freq Never 156.00
## 17 Female 18.0 18.0 Right L on R 89 Neither Freq Never 157.00
## 18 Male 19.4 19.2 Left R on L 74 Right Some Never 182.88
## 19 Male 20.5 20.5 Right L on R NA Left Some Never 190.50
## 20 Male 21.0 20.9 Right R on L 78 Right Freq Never 177.00
## 21 Male 21.5 22.0 Right R on L 72 Left Freq Never 190.50
## 22 Male 20.1 20.7 Right L on R 72 Right Freq Never 180.34
## 23 Male 18.5 18.0 Right L on R 64 Right Freq Never 180.34
## 24 Male 21.5 21.2 Right R on L 62 Right Some Never 184.00
## 25 Female 17.0 17.5 Right R on L 64 Left Some Never NA
## 26 Male 18.5 18.5 Right Neither 90 Neither Some Never NA
## 27 Male 21.0 20.7 Right R on L 90 Right Some Never 172.72
## 28 Male 20.8 21.4 Right R on L 62 Neither Freq Never 175.26
## 29 Male 17.8 17.8 Right L on R 76 Neither Freq Never NA
## 30 Male 19.5 19.5 Right L on R 79 Right Some Never 167.00
## 31 Female 18.5 18.0 Right R on L 76 Right None Occas NA
## 32 Male 18.8 18.2 Right L on R 78 Right Freq Never 180.00
## 33 Female 17.1 17.5 Right R on L 72 Right Freq Heavy 166.40
## 34 Male 20.1 20.0 Right R on L 70 Right Some Never 180.00
## 35 Male 18.0 19.0 Right L on R 54 Neither Some Regul NA
## 36 Male 22.2 21.0 Right L on R 66 Right Freq Occas 190.00
## 37 Female 16.0 16.5 Right L on R NA Right Some Never 168.00
## 38 Male 19.4 18.5 Right R on L 72 Neither Freq Never 182.50
## 39 Male 22.0 22.0 Right R on L 80 Right Some Never 185.00
## 40 Male 19.0 19.0 Right R on L NA Neither Freq Occas 171.00
## 41 Female 17.5 16.0 Right L on R NA Right Some Never 169.00
## 42 Female 17.8 18.0 Right R on L 72 Right Some Never 154.94
## 43 Male NA NA Right R on L 60 <NA> Some Never 172.00
## 44 Female 20.1 20.2 Right L on R 80 Right Some Never 176.50
## 45 Female 13.0 13.0 <NA> L on R 70 Left Freq Never 180.34
## 46 Male 17.0 17.5 Right R on L NA Neither Freq Never 180.34
## 47 Male 23.2 22.7 Right L on R 84 Left Freq Regul 180.00
## 48 Male 22.5 23.0 Right R on L 96 Right None Never 170.00
## 49 Female 18.0 17.6 Right R on L 60 Right Some Occas 168.00
## 50 Female 18.0 17.9 Right R on L 50 Left None Never 165.00
## 51 Male 22.0 21.5 Left R on L 55 Left Freq Never 200.00
## 52 Male 20.5 20.0 Right L on R 68 Right Freq Never 190.00
## 53 Male 17.0 18.0 Right L on R 78 Left Some Never 170.18
## 54 Male 20.5 19.5 Right L on R 56 Right Freq Never 179.00
## 55 Male 22.5 22.5 Right R on L 65 Right Freq Regul 182.00
## 56 Male 18.5 18.5 Right L on R NA Neither Freq Never 171.00
## 57 Female 15.5 15.4 Right R on L 70 Neither None Never 157.48
## 58 Male 19.5 19.7 Right R on L 72 Right Freq Never NA
## 59 Male 19.5 19.0 Right L on R 62 Right Freq Never 177.80
## 60 Male 20.6 21.0 Left L on R NA Left Freq Occas 175.26
## 61 Male 22.8 23.2 Right R on L 66 Neither Freq Never 187.00
## 62 Female 18.5 18.2 Right R on L 72 Neither Freq Never 167.64
## 63 Female 19.6 19.7 Right L on R 70 Right Freq Never 178.00
## 64 Female 18.7 18.0 Left L on R NA Left None Never 170.00
## 65 Female 17.3 18.0 Right L on R 64 Neither Freq Never 164.00
## 66 Male 19.5 19.8 Right Neither NA Right Freq Never 183.00
## 67 Female 19.0 19.1 Right L on R NA Neither Freq Never 172.00
## 68 Female 18.5 18.0 Right R on L 64 Right Freq Never NA
## 69 Male 19.0 19.0 Right L on R NA Right Some Never 180.00
## 70 Male 21.0 19.5 Right L on R 80 Left None <NA> NA
## 71 Female 18.0 17.5 Right L on R 64 Left Freq Never 170.00
## 72 Male 19.4 19.5 Right R on L NA Right Freq Heavy 176.00
## 73 Female 17.0 16.6 Right R on L 68 Right Some Never 171.00
## 74 Female 16.5 17.0 Right L on R 40 Left Freq Never 167.64
## 75 Female 15.6 15.8 Right R on L 88 Left Some Never 165.00
## 76 Female 17.5 17.5 Right Neither 68 Right Freq Heavy 170.00
## 77 Female 17.0 17.6 Right L on R 76 Right Some Never 165.00
## 78 Female 18.6 18.0 Right L on R NA Neither Freq Heavy 165.10
## 79 Female 18.3 18.5 Right R on L 68 Neither Some Never 165.10
## 80 Male 20.0 20.5 Right L on R NA Right Freq Never 185.42
## 81 Male 19.5 19.5 Left R on L 66 Left Some Never NA
## 82 Male 19.2 18.9 Right R on L 76 Right Freq Never 176.50
## 83 Female 17.5 17.5 Right R on L 98 Left Freq Never NA
## M.I Age
## 1 Metric 18.250
## 2 Imperial 17.583
## 3 <NA> 16.917
## 4 Metric 20.333
## 5 Metric 23.667
## 6 Imperial 21.000
## 7 Imperial 18.833
## 8 Metric 35.833
## 9 Metric 19.000
## 10 Metric 22.333
## 11 Imperial 28.500
## 12 <NA> 18.250
## 13 Metric 18.750
## 14 Metric 17.500
## 15 <NA> 17.167
## 16 Metric 17.167
## 17 Metric 19.333
## 18 Imperial 18.333
## 19 Imperial 19.750
## 20 Metric 17.917
## 21 Imperial 17.917
## 22 Imperial 18.167
## 23 Imperial 17.833
## 24 Metric 18.250
## 25 <NA> 19.167
## 26 <NA> 17.583
## 27 Imperial 17.500
## 28 Imperial 18.083
## 29 <NA> 21.917
## 30 Metric 19.250
## 31 <NA> 41.583
## 32 Metric 17.500
## 33 Imperial 39.750
## 34 Metric 17.167
## 35 <NA> 17.750
## 36 Metric 18.000
## 37 Metric 19.000
## 38 Metric 17.917
## 39 Metric 35.500
## 40 Metric 19.917
## 41 Metric 17.500
## 42 Imperial 17.083
## 43 Metric 28.583
## 44 Imperial 17.500
## 45 Imperial 17.417
## 46 Imperial 18.500
## 47 Metric 18.917
## 48 Metric 19.417
## 49 Metric 18.417
## 50 Metric 30.750
## 51 Metric 18.500
## 52 Metric 17.500
## 53 Imperial 18.333
## 54 Metric 17.417
## 55 Metric 20.000
## 56 Metric 18.333
## 57 Imperial 17.167
## 58 <NA> 17.417
## 59 Imperial 17.667
## 60 Imperial 18.417
## 61 Metric 20.333
## 62 Imperial 17.333
## 63 Metric 17.500
## 64 Metric 19.833
## 65 Metric 18.583
## 66 Metric 18.000
## 67 Metric 30.667
## 68 <NA> 16.917
## 69 Metric 19.917
## 70 <NA> 18.333
## 71 Metric 17.583
## 72 Metric 17.833
## 73 Metric 17.667
## 74 Imperial 17.417
## 75 Metric 17.750
## 76 Metric 20.667
## 77 Metric 23.583
## 78 Imperial 17.167
## 79 Imperial 17.083
## 80 Imperial 18.750
## 81 <NA> 16.750
## 82 Imperial 20.167
## 83 <NA> 17.667
## [ reached 'max' / getOption("max.print") -- omitted 154 rows ]
## Sex Wr.Hnd NW.Hnd W.Hnd Fold Pulse Clap Exer Smoke Height
## 1 Female 18.5 18.0 Right R on L 92 Left Some Never 173.00
## 2 Male 19.5 20.5 Left R on L 104 Left None Regul 177.80
## 3 Male 18.0 13.3 Right L on R 87 Neither None Occas NA
## 4 Male 18.8 18.9 Right R on L NA Neither None Never 160.00
## 5 Male 20.0 20.0 Right Neither 35 Right Some Never 165.00
## 6 Female 18.0 17.7 Right L on R 64 Right Some Never 172.72
## M.I Age
## 1 Metric 18.250
## 2 Imperial 17.583
## 3 <NA> 16.917
## 4 Metric 20.333
## 5 Metric 23.667
## 6 Imperial 21.000
## Sex Wr.Hnd NW.Hnd W.Hnd Fold Pulse Clap Exer Smoke Height
## 232 Male 18.0 16.0 Right R on L NA Right Some Never 180.34
## 233 Female 18.0 18.0 Right L on R 85 Right Some Never 165.10
## 234 Female 18.5 18.0 Right L on R 88 Right Some Never 160.00
## 235 Female 17.5 16.5 Right R on L NA Right Some Never 170.00
## 236 Male 21.0 21.5 Right R on L 90 Right Some Never 183.00
## 237 Female 17.6 17.3 Right R on L 85 Right Freq Never 168.50
## M.I Age
## 232 Imperial 20.750
## 233 Imperial 17.667
## 234 Metric 16.917
## 235 Metric 18.583
## 236 Metric 17.167
## 237 Metric 17.750
## Sex Wr.Hnd NW.Hnd W.Hnd Fold
## Female:118 Min. :13.00 Min. :12.50 Left : 18 L on R : 99
## Male :118 1st Qu.:17.50 1st Qu.:17.50 Right:218 Neither: 18
## NA's : 1 Median :18.50 Median :18.50 NA's : 1 R on L :120
## Mean :18.67 Mean :18.58
## 3rd Qu.:19.80 3rd Qu.:19.73
## Max. :23.20 Max. :23.50
## NA's :1 NA's :1
## Pulse Clap Exer Smoke Height
## Min. : 35.00 Left : 39 Freq:115 Heavy: 11 Min. :150.0
## 1st Qu.: 66.00 Neither: 50 None: 24 Never:189 1st Qu.:165.0
## Median : 72.50 Right :147 Some: 98 Occas: 19 Median :171.0
## Mean : 74.15 NA's : 1 Regul: 17 Mean :172.4
## 3rd Qu.: 80.00 NA's : 1 3rd Qu.:180.0
## Max. :104.00 Max. :200.0
## NA's :45 NA's :28
## M.I Age
## Imperial: 68 Min. :16.75
## Metric :141 1st Qu.:17.67
## NA's : 28 Median :18.58
## Mean :20.37
## 3rd Qu.:20.17
## Max. :73.00
##
##
## Freq None Some
## Heavy 7 1 3
## Never 87 18 84
## Occas 12 3 4
## Regul 9 1 7
## Warning in chisq.test(tbl): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: tbl
## X-squared = 5.4885, df = 6, p-value = 0.4828
## [,1] [,2]
## Heavy 7 4
## Never 87 102
## Occas 12 7
## Regul 9 8
##
## Pearson's Chi-squared test
##
## data: ctbl
## X-squared = 3.2328, df = 3, p-value = 0.3571