"áRboles de compRomiso pondeRado": un método paRa ResumiR difeRentes hipótesis filogenéticas en R.

El 9 de Octubre de 2012, la revista Cladistics, publico en la web a manera de “Early view” un artículo, acerca de un nuevo método de consenso, para resumir distintas hipótesis/árboles/topologias resultantes de un análisis filogenético.
El titulo en ingles del articulo es Weighted compromise trees: a method to summarize competing phylogenetic hypotheses,  y sus autores son Michael J. Sharkey, Stephanie Stoelb, Daniel R. Miranda-Esquivel  y Barabara J. Sharanowski.


Nota_1:Realmente no estoy muy seguro de la “traducción” del nombre del método que puse en el titulo de este post, pero fue el que me pareció que se acercaba más.

Básicamente, como lo dicen en el resumen, el método corrige un “sesgo” inherente al método de consenso de la mayoría, cuando los árboles iniciales son dependientes (no muestran independencia) debido a la ambigüedad en sus clados terminales.

Nota_2: como es característica en R para Chibchombianos, el fin ultimo del blog es la implementación de análisis en R, más no la explicación de los métodos que utilizamos, en orden de promover el uso de R. Si alguien quiere instruirse más acerca de este nuevo método de consenso, puede consultar directamente  el artículo, que es de tan solo 5 paginas y es muy fácil de entender. 

Acompañado con el artículo, D.R. Miranda, escribió una función para la implementación del nuevo método, utilizando el paquete “ape” en R, el código puede ser descargado desde Google code/Wconsensus, y para utilizarlo solo tenemos que descargar el archivo “wconsensus.R”, que es la extensión que contiene el código de la función. (en la lista de descargas, también esta disponible un archivo comprimido, que contiene algunos archivos de ejemplo y explicación para utilizar la función)

Para explicar como utilizar la función se debe construir un archivo con extensión .tre , que contenga los árboles iniciales para realizar el consenso, en nuestro ejemplo utilizaremos 5 árboles iniciales, teniendo como terminales a las tortugas ninjas y su maestro 😛 (que hago? crecí con las tortugas ninjas!! y los Motorratones)

el archivo debe lucir así, y debe ser guardado como “tortugas.tre”:


>setwd("~/Escritorio")
#Escojo el directorio en el que esta mi archivo (tortugas.tre) con los árboles iniciales y el archivo de la función (wconsensus.R).

> source("wconsensus.R")
#Cargo la función a mi
área de trabajo.

> tortugas <-read.tree("tortugas.tre")

#Leo el archivo de árboles iniciales.


> plot(tortugas)

#Grafíco (opcional/si quiero ver los árboles!) los árboles iniciales.





> consenso_tortugas <- wconsensus(tortugas, collapse= TRUE, cutvalue =0.65)#Realizo el consenso, con un valor de corte de 0.65 para colapsar nodos.
> summary(consenso_tortugas)
#Reviso el valor y número de nodos y las
estadísticos
del consenso.

Phylogenetic tree: consenso_tortugas

Number of tips: 5
Number of nodes: 4
Branch lengths:
mean: 0.8888889
variance: 0.02469136
distribution summary:
Min. 1st Qu. Median 3rd Qu. Max.
0.6667 0.7500 1.0000 1.0000 1.0000
No root edge.
Tip labels: Leonardo
Miguel_angel
Rafael
Donatelo
Splinter
Node labels: 1
0.6667
0.7778
0.6667


> plot(consenso_tortugas)
#Grafíco el árbol consenso

Árbol consenso con un nivel de corte de 0.7 (cutvalue=0.7)

Árbol consenso con un nivel de corte de 0.8 (cutvalue=0.8)

En el próximo post, para ir entrando a lenguaje de programación de manera "suuuaaave", exploraremos un poco, la manera en la que fue escrita esta función de consenso y su código. Hasta entonces!! Buena eneRgía!! Y como dirían los chicos que tengo como portada del blog (Martin de Francisco y Santiago Maure): "Que se los coma el vejete del Jaime Barón"


Ciekawe informacje o Polsce pod ręką…

Pisząc jakiś czas temu o raporcie z Narodowego Spisu Powszechnego narzekałem, że jest nudny jak flaki z olejem i trudno oczekiwać by przeciętny obywatel z zainteresowaniem go przeczytał. Jest to bolączka wielu raportów, mających postać kilkusetstronicowych cegieł najeżonych tabelkami i wykresami. Spróbujmy inaczej! Zbierzmy ciekawe informacje o Polsce i pokażmy je tak, by chciało się […]

如何学习数据科学

本文翻译自一篇博客文章,作者是一名软件工程师,他描述了在五年时间内学习数据科学的经历和心得,他的学习途径包括了自学(书籍、博客、小项目),课程学习,教学讨论,会议交流和…

Kunnallisvaalit sosiaalisessa mediassa

Datavaalit-sivustolla ylläpidettävään sosiaalisen median aggregaattiin on tätä kirjoitettaessa kasautunut dataa 987 ehdokkaan Twitter-syötteestä ja 2553 ehdokkaan Facebook-sivulta yhteensä 419975 päivitystä. Profiilien osoitteet on poimittu Ylen vaalikoneesta sekä ehdokkaiden omien ilmoitusten perusteella. Esimerkeissä käytetty data on saatavilla CSV-dumppina GitHubin avoindata-repositoryn kautta. … Lue loppuun