Category: Spanish

Introducción al programa estadístico R: el niño (yo) ya aprendió a sentarse en la vasenilla!!! :P

Dandome “contentillo” y justificando mi pereza, he de contarles que estos 5 meses no fueron del todo vanos, y no abandone completamente mi fiel y mas que justa causa, al difundir y vender R como un buen amante…para los solitarios habidos de software libre y sencillo.
Así pues, durante el ” II Seminario de Biodiversidad y Conservación de Especies amenazadas, humedales, ecosistemas críticos”, organizado por el “Grupo de Investigación y Estudios en Ciencias Biológicas” (Con el cual estoy muy agradecido, especialmente con Fernando Cediel, quien tuvo la “loca e irracional” idea de invitarme y con Natalia Rey, quien estuvo por ahí pendiente de los materiales necesarios para el curso (incluido el refrigerio! 😛 )) , tuve la oportunidad de dictar mi primer curso de manejo y estadística básica en R.
El curso tuvo una duración de 3 días (5, 6 y 7 de Septiembre, 2 horas cada día) y una asistencia de aproximadamente 28 estudiantes de distintos lugares del país;  En un principio estuve un poquitin asustado con la idea, pero por la gracia de la buena onda, todo salio muy bien!
Gran parte del material que utilice en el curso provino de “R para Chibchombianos”, y otra parte es complementaria a cabos que tenia sueltos (por ejemplo, la terminación de los post de exploración de los datos, previa a un análisis estadístico, basado en el articulo de Alain Zuur y colaboradores), para de esta forma reunir toda la información mostrada en el blog y otra adicional, compilada en un solo lugar.

De este modo, en este post, quiero compartirles via Google Docs (POR CIERTO, VIVA GOOGLE DOCS!!) todas las diapositivas que utilice en el curso, con comandos, información y todo el resto de cosas adicionales.
Las diapositivas contienen aveces imágenes escogidas por mi, de pintores que me gustan y fotógrafos  que me gusta poner para hacer las presentaciones mas “firmes” y para compartir Arte, Ciencia, Software y vida juntos!!
La presentación esta organizada de la siguiente manera:

*Primer día: INTRODUCCIÓN AL PROGRAMA ESTADÍSTICO R
     -Presentación
     -Instalación de R
     -Paquetes
     -Repositorios
     -Argumentos y comandos
     -Objetos
     -Vectores
     -Matrices
     -Arrays
     -Data Frames
     -Listas
     -Factores
     -Entrada y manejo de datos (incluido desde excel)
     -Exportando datos y gráficos desde R

*Segundo día: ESTADÍSTICA DESCRIPTIVA Y UNIVARIADA EN R
     -Frecuencias e Histogramas
     -Tendencia central
     -Normalidad
     -Homogeneidad de varianzas
     -Outliers
     -Mas exploración de datos (recomendadisimo!!)
     -T y T pareada
     -U y U pareada
     -Chi cuadrado
     -Test de proporciones
     -Anova de un factor
   
*Tercer día: ESTADÍSTICA MULTIVARIADA EN R
     -Anova de dos factores
     -Manova
     -Kruskal-Wallis & “adonis”
     -Clusters (bastante de esto!)
     -Análisis discriminante
     -Análisis de correspondencia canónica 
     -Componentes principales (PCA)
     -Escalamiento multidimensional simple
     -Perspectivas y ejercicios de R

ESPERO LES SEA DE GRAN AYUDA ESTAS DIAPOSITIVAS, EN ESPECIAL PARA MUCHAS COSAS QUE AÚN NO HABÍA COMPARTIDO CON UDS.
TODAVÍA NO SE SI ALCANCE A HACER EL ULTIMO POST DEL AÑO O SI ME TOCA QUEDÁRSELOS DEBIENDO PARA EL OTRO AÑO!
DE TODOS MODOS Y POR SI LOS TABANOS (LAS MOSCAS), LES AGRADEZCO MUCHO A LOS SEGUIDORES DEL POST, A LAS PERSONAS QUE ME LEEN POR AHÍ Y ESPERO QUE EL OTRO AÑO SEA REALMENTE PRODUCTIVO PARA TODOS EN CONJUNTO Y EN EN INDIVIDUAL!!

El futuro próximo y/o lejano de R para Chibchombianos, después de dos años de cambiar pañales!

Después de 5 meses de inactividad en el blog, vuelve “R para Chibchombianos” la semana próxima con la intención de finalizar un ciclo que desde hace rato estaba sin concluir (me refiero al manejo básico de R,  fundamentos de estadística descriptiva, univariada y multivariada).
Esto simplemente con la intención de dejar atrás el manejo básico de R, para adentrarnos en temas un poco mas avanzados, ya que el próximo 16 de Diciembre el blog cumplirá dos años de haberse creado y creo que el primer objetivo que era el entendimiento de las cosas básicas de R esta completo (o por lo menos lo estará la próxima semana).
Seguramente muchas cosas habrán hecho falta, pero siento que es imposible llegar a cubrirlas todas, solo espero que haya sido de gran ayuda el blog para las personas que no tenían ni idea de las ventajas de utilizar R y que haya sido una muy buena y muy fácil forma de empezar a entender R.
Que vendrá para la posteridad?
Bien, habiendo completado esta parte, creo que ahora me dedicare a lo mio y empezare a abordar cosas mas avanzadas, tanto para Biología en particular como para el publico en general:

-Ecología
-Sistemática Filogenética y taxonomía
-Manejo de datos geográficos
-Morfometría geométrica !!!!
-modelos estadísticos en general y ecológicos
-Estadística no-frecuentista
-funciones, código y lenguaje de programación !!!!

La transición hacia estos nuevos objetivos del blog  sera muy divertida y en ocasiones también sera un poquito tediosa, sobre todo lo relacionado con programación (puesto que es de lo que menos se), pero sera quizás una muy buena forma de aprender muchas cosas juntos.

Espero que en los años venideros sea muy productivo el blog (mas de lo que pudo ser estos dos primeros años) y que les guste todas las cosas que van a ver.

NO OLVIDEN LA PRÓXIMA SEMANA “OJEAR” EL ULTIMO POST DE ESTE PRIMER CICLO, SERÁ INTERESANTE (BUENO, ESO LO DIRÁN USTEDES, PARA MI LO ES!), MUY CONCISO Y CONTENDRÁ MUCHA INFORMACIÓN (YA DISPONIBLE EN EL BLOG Y NUEVA INFORMACIÓN)  EN UN ESPACIO REDUCIDO, A MANERA DE RESUMEN DE TODA LA PRIMER PARTE DE “R PARA CHIBCHOMBIANOS”!!

“firme”-mente

BROSSY

Conglomerados y Discriminante

Las técnicas para buscar casos parecidos de nuestra base de datos y agruparlos son conocidas como Análisis de Conglomerados. El Análisis Discriminante se usa para estimar parámetros que permiten identificar las características de grupos ya conocidos. Ambas técnicas son muy usadas, así como los Árboles de Decisión (Chi-squared Automatic Interaction Detector – CHAID). Las tres […]