INTRODUCCIÓN AL MANEJO DEL SOFTWARE R Santiago Benitez-Vieyra. Lab. de Ecología Evolutiva – Biología Floral, IMBIV (UNC-CONICET) [email protected] Curso Métodos en Ecología Evolutiva (2011), Doctorado en Ciencias Biológicas, Universidad Nacional de Córdoba Presentamos una lista de recursos estadísticos para problemas comunes en Ecología Evolutiva. En particular, usaremos en cada vez que sea posible software libre, por las múltiples ventajas que posee, tanto económicas como de libertad de uso e independencia tecnológica. R R es un lenguaje para análisis estadístico y programación gratuito, de libre circulación y que puede ser copiado, distribuido y modificado a voluntad. Presenta numerosas ventajas 1- Es actualmente el software que ofrece más funciones y aplicaciones para la creación de gráficos de alta calidad, debido a que colaboradores de todo el mundo producen paquetes para aplicaciones a problemas particulares o desarrollando determinadas técnicas estadísticas. Cada usuario puede, además, crear sus propias funciones y rutinas ad hoc combinando las funciones existentes. 2- Existe una amplia comunidad de usuarios, por lo que existe una gran oferta de ayudas para aquellos que se inician en el uso del programa, incluyendo foros de discusión en internet y una creciente bibliografía. 3- R es una lingua franca para el intercambio de ideas en el ámbito científico, como puede advertirse en el número creciente de trabajos que citan este software y en la presencia de rutinas en este lenguaje publicadas como material suplementario en revistas internacionalmente prestigiosas. Entre las funciones y paquetes de R de aplicación en ecología evolutiva se encuentran. Paquete Rcmdr (R Commander): Es una interfaz creada para la enseñanza de estadística, por lo que es recomendable para aquellos que se introducen al R. Es particularmente útil para el ajuste de modelos de selección fenotípica, utilizando tanto modelos lineales ordinarios como modelos lineales generalizados. Paquete mgcv: Creado para el ajuste de modelos aditivos generalizados, permite ajustar regresiones no paramétricas del tipo cubic-splines para visualizar la relación entre un rasgo y la adecuación. Paquete fields: Permite visualizar superficies de selección entre combinaciones de caracteres y la adecuación. Paquetes nlme y lme4: Creado para el ajuste de modelos mixtos normales y generalizados. Utilizado para el cálculo de la varianza genética y la heredabilidad de caracteres fenotípicos. Paquetes ape (Analysis of Phylogenetics and Evolution), ade4 y apTreeshape: Utilizados para construcción de filogenias, métodos comparativos, reconstrucción de estados ancestrales. Paquetes sem, openMx, y lavaan: Utilizados para análisis de senderos y modelado de ecuaciones estructurales. Instalación de R en Windows Entrar a http://cran.r-project.org/ Seleccionar Windows, seleccionar base Seleccionar Download R 2.13.0 for Windows (o la última versión disponible) Guardar el archivo R-2.13.0-win32.exe en cualquier parte de la computadora, ejecutarlo y seguir las instrucciones de instalación. Instalación de paquetes específicos 1- Desde el mismo programa: Seleccionar Paquetes-Instalar Paquetes. Seleccionar el repositorio CRAN desde donde se bajará el paquete (utilizar uno cercano). Seleccionar un paquete de la lista despegable. 2- Desde internet: Entrar a http://cran.r-project.org/ Seleccionar Packages, seleccionar el paquete deseado Descargar el archivo .zip para el sistema operativo deseado Abrir R y seleccionar Paquetes - Instalar paquetes a partir de archivos zip locales Seleccionar el archivo .zip 3- Carga de paquetes Para que un paquete esté disponible en una sesión de trabajo seleccionar Paquetes – Cargar paquetes y elegirlo en la lista desplegable que se abre. Alternativamente puede cargarse escribiendo en la consola principal de R library(nombre_del_paquete) Instalación de R Commander (Rcmdr) 1-Abrir R y seleccionar Paquetes – Instalar paquetes (la computadora debe estar conectada a internet) 2-Seleccionar el espejo CRAN, de preferencia uno geográficamente cercano. 3-Seleccionar Rcmdr de la lista de paquetes 4-Seleccionar paquetes – cargar paquetes – Rcmdr 5-En muchos casos no se van a bajar otros paquetes necesarios para que Rcmdr funcione, el programa les va a preguntar si desean bajar esos paquetes desde CRAN (aceptar). 6-Cuando los paquetes hayan terminado de bajar, intenten cargar el paquete Rcmdr. Si está listo aparecerá una nueva ventana del programa. Uso básico del R commander 1- Apertura del programa e ingreso de datos. 1.1 Seleccionar Paquetes- Cargar Paquetes y Rcmdr de la lista desplegable. Alternativamente, escribir en la consola principal de R. Se abrirá una nueva ventana. library(Rcmdr) 1.2 Preparación de los datos. Los nombres de las columnas en las bases de datos no deben tener espacios ni comenzar con números. Los datos faltantes no deben dejarse en blanco, sino señalarse con NA. 1.3 Para ingresar los datos desde un archivo .txt seleccionar Datos – Importar datos y la opción 1. Elegir un nombre para los datos (pueden ingresarse varias bases de datos, siempre que se les asignen distintos nombres). Para ingresar datos desde un archivo de Excel elegir la opción 2. en este caso se abrirá una ventana para seleccionar la hoja que contiene los datos. 1 2 2 Manipulación de Datos 2.1 Los datos pueden manipularse seleccionando Editar conjunto de datos. 2.2 Algunas opciones son: crear nuevas variables (opción 1), tipificar (estandarizar) variables (opción 2), convertir una variable numérica en factor (opción 3, útil si hemos codificado los niveles de un factor con números) 1 2 3 3 Análisis estadísticos y gráficos 3.1- Los análisis estadísticos básicos se encuentran en la sección Estadísticos. Notar que las pruebas a posteriori y de comprobación de supuestos se hallan en la ventana Modelos, ya que para realizarse requieren que exista un modelo activo. Existe una gran variedad de gráficos disponibles. 3.2- Rcmdr es una interfaz gráfica. La consola superior muestra los comandos que son enviados a R para ser calculados. La consola inferior muestra los resultados de los análisis.