UNIDAD 2: INTRODUCCIÓN AL LENGUAJE DE PROGRAMACiÓN R Técnicas Inteligentes en Bioinformática Máster en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia Artificial Francisco J. Romero Campero Universidad de Sevilla CONTENIDOS 1. El lenguaje de programación R 2. Concepto de variable 3. Tipos de datos simples 4. Operaciones aritmético-lógicas EL LENGUAJE DE PROGRAMACIÓN R o Un programa informático es una secuencia de instrucciones que un ordenador puede entender. o Los programas informáticos se escriben en un archivo de texto siguiendo un lenguaje de programación. o A la secuencia de instrucciones que componen un programa informático la denominaremos código fuente. EL LENGUAJE DE PROGRAMACIÓN R o El ordenador sólo es capaz de entender un único lenguaje: código máquina. El programador necesita traducir su código fuente a código máquina antes de ejecutarlo. o Existen dos tipos de lenguajes de programación: Compilados: El programador debe escribir todo el código fuente antes de pasarlo a código máquina y ejecutarlo. Interpretados: El programador puede escribir y ejecutar su código fuente instrucción a instrucción. EL LENGUAJE DE PROGRAMACIÓN R o R es un lenguaje de programación interpretado. o R se utiliza para: Análisis de datos Cálculos estadísticos Representación de gráficos o R se utiliza para el análisis estadístico de datos de laboratorio en biología molecular. o http://cran.r-project.org/ EL ENTORNO DE PROGRAMACIÓN o Un entorno de programación es un programa informático que nos permite: Escribir código en un lenguaje de programación Compilar el código Ejecutar instrucción a instrucción o En este curso se utilizará RkWard como entorno de programación para R Software libre Requiere GNU/Linux http://rkward.sourceforge.net EL ENTORNO DE PROGRAMACIÓN CONTENIDOS 1. El lenguaje de programación R 2. Concepto de variable 3. Tipos de datos simples 4. Operaciones aritmético-lógicas CONCEPTO DE VARIABLE o Elemento fundamental de cualquier lenguaje de programación. o Son espacios reservados en la memoria que pueden cambiar de contenido. Se identifican con una cadena de caracteres. o Una variable tiene un nombre que la identifica en el código fuente y un contenido (dato) que puede variar. ASIGNACIÓN DE VARIABLES o o La asignación de variables es una instrucción que permite definir el nombre de una variable y asociarle un contenido. Ejemplo: a <- -2.5 b <- TRUE seq.adn <- “ATGCTAGATCGC” o o o En R, los nombres de variables deben comenzar por una letra seguida de más letras, dígitos o los caracteres punto (.) o subrayado (_). Se diferencia entre mayúsculas y minúsculas. En R, para saber el contenido de una variable, basta con escribir su nombre. También se puede usar el operador = en lugar de <- GESTIÓN DE VARIABLES EN R o Todas las variables asignadas quedan salvadas en un espacio de trabajo. o Podemos listar las variables del espacio de trabajo actual mediante la instrucción ls() o Podemos borrar una variable del espacio de trabajo mediante la instrucción rm(nombre_de_variable) CONTENIDOS 1. El lenguaje de programación R 2. Concepto de variable 3. Tipos de datos simples 4. Operaciones aritmético-lógicas TIPOS DE DATOS SIMPLES o Numéricos 3, -4, 0.45… Saber si un dato es numérico: is.numeric(dato) o Lógicos True, False Saber si un dato es lógico: is.logical(dato) o Caracteres ‘a’, ‘c’, ‘g’, ‘t’ Saber si un dato es carácter: is.character(dato) o Cadenas “atgctagatcgc” CONTENIDOS 1. El lenguaje de programación R 2. Concepto de variable 3. Tipos de datos simples 4. Operaciones aritmético-lógicas OPERACIONES ARITMÉTICAS Operación Operador en R Suma + Diferencia - Producto * División / División entera %/% Módulo (resta) %% Potencia ^ OPERACIONES ARITMÉTICAS o Ejemplo en R: a <- 4 b <- 3 suma <- a + b diferencia <- a – b producto <- a * b division <- a / b potencia <- a ^ b division_entera <- a %/% b modulo <- a %% b OPERACIONES DE COMPARACIÓN o Devuelven un valor lógico (true o false) Sentencia Código en R Mayor que > Mayor o igual que >= Menor que < Menor o igual que <= Igual que == Distinto que != OPERACIONES LÓGICAS o Reciben y devuelven valores lógicos Sentencia Código en R AND && OR || NOT ! Operando sobre vectores Sentencia Código en R AND & OR | OPERACIONES LÓGICAS o Comportamiento del operador AND A B A && B FALSE FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE OPERACIONES LÓGICAS o Comportamiento del operador OR A B A || B FALSE FALSE FALSE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE OPERACIONES LÓGICAS o Comportamiento del operador NOT A !A FALSE TRUE TRUE FALSE PRECEDENCIA DE OPERADORES o o o Podemos combinar en una expresión varias operaciones aritméticas y lógicas. Los operaciones se agrupan automáticamente según un orden de precedencia Por ejemplo: El producto y la división tienen mayor precedencia que la suma y la diferencia. A <- 3 * 5 + 10 / 2 Primero se evalúa 3 * 5 y 10 / 2, luego se suman los resultados obteniendo el valor 20 que se asigna a la variable A. PRECEDENCIA DE OPERADORES o Precedencia de operadores en R: 1. 2. 3. 4. 5. 6. 7. o Potencia Producto, división, división entera y módulo Suma y diferencia Mayor, mayor o igual, menor, menor o igual, igual y distinto que. AND, OR NOT Asignación Podemos modificar la precedencia de operadores usando paréntesis. Ejemplo: a <- 3 * (5 + 10) / 2 This work is licensed under the Creative Commons AttributionNonCommercial NoDerivs 3.0 Unported License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-nd/3.0/. Estas transparencias están basadas en el material docente desarrollado por Francisco J. Romero Campero e Ignacio Pérez Hurtado de Mendoza para la asignatura Informática Aplicada a la Bioquímica del Grado Conjunto en Bioquímica por la Universidad de Sevilla y la Universidad de Málaga (Andalucía Tech). Este trabajo está liberado bajo la licencia Creative Commons Attribution-NonCommercial NoDerivs 3.0 Unported License.