Prueba de U (Mann Whitney) para muestras independientes y Pareada en R.

January 20, 2011
By

This post was kindly contributed by R para Chibchombianos - go there to comment and to read the full post.

Después de haber visto las pruebas de T y T pareada vamos a explorar sus correspondientes pruebas parametricas que serian la prueba de U (tambien llamada Mann Whitney ya que Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947) ver : http://es.wikipedia.org/wiki/Prueba_U_de_Mann-Whitney

Basicamente lo que pretenden estas pruebas es lo mismo que buscan las pruebas de T de student, solo que dependiendo de los datos (normalidad, homogeneidad de varianzas) se deben utilizar parametricas o no parametricas. 

Para empezar debo recordar que como siempre debo cambiar mi directorio y utilizar un directorio especifico donde tengo mis matrices de datos.

Los datos que utilizaremos en este ejemplo pertenecen a la cantidad de coliformes encontrados en dos cuerpos de agua a los cuales se les ha aplicado distintos tipos de tecnicas de cloracion, asi de esta manera "Wtra" y "Wotra" son los tratamientos y las medidas se tomaron a lo largo de los cuerpos de agua!
Para la construccion de la matriz, como ya lo he dicho en otros posts se puede hacer en excel o con un editor de texto y se guarda en formato .csv en el directorio que escojamos.
la matriz es la siguiente:

  Wtra Wotra
1    44    32
2    48    40
3    36    44
4    32    44
5    51    34
6    45    30
7    54    26
8    56    NA
9   142    NA
10  148    NA


teniendo ya nuestros datos empezamos con el analisis:


>ej5 <- read.csv("ej5.csv",header=T)
#(llamo a R el archivo que cree en formato .CSV (separado por comas) !!se puede crear en excel y guardarlo en formato .csv pero se deben cambiar los ";" por "," y los decimales deben estar separados por "." no por ",")


>ej5
#(asi puedo ver lo que tiene mi archivo ej5 y garantizar que no hayan errores en el archivo)


>attach (ej5)
#(para tomar mis columnas como objetos)


>var.test(Wtra,Wotra)
#(inspecciono mi homogeneidad de varianzas para aplicar U o T )
resultados:

  F test to compare two variances
data:  Wtra and Wotra
F = 36.2299, num df = 9, denom df = 6,
p-value = 0.0003016alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
   6.559339 156.503082
sample estimates:
ratio of variances
           36.2299



>shapiro.test(Wtra)
# (realizo prueba de normalidad para mis datos con el tratamiento "Wtra")
resultados:

 Shapiro-Wilk normality test
data:  Wtra
W = 0.6804,
p-value = 0.0005097


>shapiro.test(Wotra)
# (realizo prueba de normalidad para mis datos con el tratamiento "Wotra")
resultados:

Shapiro-Wilk normality test

data:  Wotra
W = 0.9189,
p-value = 0.4607


>wilcox.test(Wtra,Wotra,paired=FALSE,conf.level=0.95)
# (por ultimo realizo mi prueba de U para varianzas no homogeneas (sí mi prueba de homogeneidad de varianzas me lo indica). El argumento "paired=FALSE" es el que me indica que los datos provienen de muestras independientes, si mis datos provenieran del mismo cuerpo de agua a distintos tiempos utilizariamos la U pareada y el argumento a utilizar seria "paired=TRUE")
resultados:

Wilcoxon rank sum test with continuity correction
data:  Wtra and Wotra
W = 61.5, p-value = 0.01092alternative hypothesis: true location shift is not equal to 0

Mensajes de aviso perdidos
In wilcox.test.default(Wtra, Wotra, paired = FALSE, conf.level = 0.95) :
  cannot compute exact p-value with ties



>boxplot (Wtra,Wotra)
# (exploro mis datos graficamente para revisar las diferencias)

Hasta la vista!!!


Tags: , , ,

Comments are closed.