R con R

October 3, 2011
By

This post was kindly contributed by Farmacovigilancia nerd2!=nerd - go there to comment and to read the full post.


Res un programa estadístico. Probablemente sea el programa más comúnmente usado en ámbitosacadémicos, pero su uso está creciendo exponencialmente y extendiendoel tipo de usuarios de académicos a empresariales o gubernamentales, porejemplo.
Su ventaja principales que se trata de software “open source”. Esto quiere decir que además de sergratuito, cualquiera (bueno, cualquiera que sepa un poco de programación) puedahacer programitas que funcionen dentro de R, que realicen tareas específicasque antes no se realizaban o modificar los que ya estaban hechos, ydistribuirlos como “paquetes” que pueden agregarse al programa como extensionesdel mismo. Así hay programas que realizan desde cálculos complejos hastagráficos impactantes difíciles de crear con otro software.
Esto hizo que enlos últimos años la actividad de creación y distribución de paquetes explotaray puede decirse que prácticamente cualquier técnica estadística que uno puedaleer en una publicación, tiene al menos una implementación en R.
La Farmacovigilancia no se quedó afuera de estemovimiento, ya que existe un paquete específico para realizar detección deseñales llamado “PhViD".
Las desventajas deR tienen que ver con que su interfase no es amigable ni intuitiva y que si unotiende grandes volúmenes de datos (digamos, millones de casos), tiende avolverse lento e ineficiente. Esto último puede mejorarse mediante algunostrucos o variantes del programa madre.
Para aquellos a losque nos gustan los datos, la falta de amigabilidad de R se compensa ampliamentecon la capacidad de hacer prácticamente cualquier cosa.
Si quieren irteniendo un panorama de las capacidades gráficas de R, pueden visitardiferentes galerías que aparecen en Internet, como: http://addictedtor.free.fr/graphiques/
O http://research.stowers-institute.org/efg/R/
Los que quieran tener una idea de todo lo que se puede hacer con R, pueden visitar el excelente blog R-bloggers dedicado solamente a él.

Bueno, veremos cómodescargar e instalar R y nociones básicas para operarlo.

Descarga
La página oficiales http://cran.r-project.org/
Desde ahí puededescargarse el instalador. Si eligen la versión para Windows, les dará 2opciones. Deben elegir la “base” y allí los llevará al link para descargar laúltima versión.

Instalación
Luego dedescargado, le dan doble click al archivo y siguen las instrucciones. Lessugiero que acepten todas las opciones que les da por defecto y no se metan ahacer cambios hasta que conozcan del tema, ya que cualquier opción que hayanelegido durante la instalación puede luego ser cambiada.

Primeros pasos
Voy a mostrar lasreglas generales para manejarse en R. No se asusten, al principio es bastanteintimidante. Van a ver que después de un rato se van acostumbrando.

Primero que nada,hagamos una operación básica. Escribimos “2+3” y presionamos “Enter”. 
> 2+3 
[1] 5 
El símbolo “>”está siempre al comienzo de una línea en blanco en la consola, la cual sedenomina “línea de comando”, y nos indica en qué lugar escribir. 
Lo que sigue son los comandos en sí. Como ven, el hecho de que hayaespacios o no entre números y operadores no tiene ninguna importancia. Siestán, es para mayor legibilidad. 
La segunda línea muestra el resultado de la operación y vemos queconsta de 2 partes. La primera parte es “[1]” y solamente indica el número deelemento correspondiente al primero de la línea.


 


La segunda parte es el resultado en sí, que en este caso es igual a5.

Ahora bien, seguramente al hacer operaciones más extensas que lasuma anterior querremos guardar el resultado para poder usarlo más tarde. Paraeso se crea un “objeto” que lo contenga. En principio, el concepto de objeto essimilar al concepto de variable. De tal modo, podemos asignar el resultado dela operación anterior a un objeto de la siguiente manera:

> x=2+3

Ahora “x” contiene el resultado de la operación anterior. Cada vezque necesitemos usar ese valor, podemos hacerlo usando su nombre o sea “x”:

> x
[1] 5

Podríamos crear otro objeto con otro valor, por ejemplo:

> y=5+8
> y
[1] 13

Y luego hacer operaciones con esos objetos, por ejemplo:

> y-x
[1] 8

Las variables x e y son objetos de R. Los objetos en R puedencontener todo tipo de elementos y muchas veces contienen varios tipos. Siqueremos ver la lista de objetos que estamos usando en la sesión de R podemosusar el método “objects” de la siguiente manera: 
> objects()
[1] "x" "y"

Los métodosse escriben con paréntesis al final. Vemos que este método nos devuelve lalista de objetos en memoria, que está constituida por los elementos, “x” e “y”.El concepto de objeto es bastante complejo en un principio, pero baste decirque pueden albergar diferente tipo de contenidos, no solamente valores sinotablas, listados, matrices, funciones y mucho más. Veremos otros alcances delconcepto cuando esto sea necesario.

Para reutilizar comandos anteriores y no tener que tipearlos cada vez que son requeridos, R guarda un historial en memoria. Estehistorial puede rememorarse usando las flechas del teclado hacia arriba oabajo. Cada vez que presionamos hacia arriba aparece la siguiente instrucciónescrita, en el orden inverso en que fueron introducidas. Si queremosreutilizarla presionamos “Enter”. También podemos editarla antes de utilizarla.

También es importante saber que R es sensible a mayúsculas ("case sensitive"). Por ejemplo, no es lo mismo escribir "Objects()" que "objects()", ni "x" que "X".

Lo último que explicaré es que cada vez que abrimos unasesión de R, se crea un ambiente que se llama “espacio de trabajo” o“workspace” en inglés. Este workspace contiene todos los objetos y el historialde comandos utilizados. Al finalizar la sesión, R pregunta si queremosguardarla, si decimos que sí guarda todo el contenido del workspace y losobjetos estarán allí al reiniciar R.
 




Si esto les parece interesante, ya saben...
Comenten que es bienvenido. ;-)

Tags:

Comments are closed.