#Empezando en R ¿ Qué es R? R es un lenguaje estadístico especialmente diseñado para el tratamiento de datos, cálculo y desarrollo gráfico. Permite trabajar fácilmente con vectores, matrices y diversas herramientas para el análisis estadístico de datos. Actualmente hay algunas plataformas en línea para trabajar en R como la de www.kaggle.com . Además, hay aplicaciones de escritorio como R Studio que se utilizará en el desarrollo del curso y en las evaluaciones. ##Tipos de datos Existen varios tipos de datos en R, por ahora se presentará ejemplos de los más importantes. • numeric (cantidades) – integer (números enteros) – doble (número decimales) • character (tipo texto) • factor (tipo factor) • logical (tipo booleano) Resultados en la consola de R pi ## [1] 3.141593 typeof(pi) ## [1] "double" typeof("abc") ## [1] "character" typeof(TRUE) ## [1] "logical" typeof(FALSE) ## [1] "logical" Operadores aritméticos • + para la suma • - para la resta • * para la multiplicación • / para la división • %% para la división entera, muestra el módulo • ^ para la potencia Resultados en la consola de R 1+2 ## [1] 3 1-2 ## [1] -1 1*2 ## [1] 2 1/2 ## [1] 0.5 10/3 ## [1] 3.333333 10%%3 ## [1] 1 2^3 ## [1] 8 Operadores relacionales • < Menor que • <= Menor o igual que • > Mayor que • >= Mayor o igual que • == Exactamente igual a • != No es igual a Resultados en la consola de R 5<3 ## [1] FALSE 5 <= 3 ## [1] FALSE 5>3 ## [1] TRUE 5 >= 3 ## [1] TRUE 5 == 3 ## [1] FALSE 5 != 3 ## [1] TRUE Operadores lógicos • & conjunción entre dos datos de tipo logical • disyunción entre dos datos de tipo logical • ! negación de dato de tipo logical Resultados en la consola de R TRUE & TRUE ## [1] TRUE FALSE | FALSE ## [1] FALSE !TRUE ## [1] FALSE Objetos en R En R todo resultado es un objeto, se puede trabajar con varias clases de objetos; algunos de ellos son estándar en cualquier lenguaje de programación y otros son objetos específicos de R, objetos pensados para ser manejados con propósitos estadísticos. Los más importantes que se van a utilizar son: vectores, matrices, listas y dataframes. ##Vectores Son la estructura de datos más sencilla con la que trabaja R (de una dimensión). Nota: Permite un sólo tipo de dato Resultados en la consola de R: Creando un vector x<-c(2,4,6,8,10) # creación de objeto tipo vector asignado a x length(x) # longitud del vector x ## [1] 5 Dataframes Un data.frame (tabla de datos) es el objeto más habitual para almacenar datos. La forma de pensar en un data.frame es considerar que cada fila representa a un individuo de una muestra o población y el correspondiente valor para cada columna se corresponde con la medición de alguna variable para ese individuo (fila-individuo, columna-variable) Nota: Permite columnas de diferentes tipos. Resultados en la consola de R: Creando un dataframe x<-c(2,4,6,8,10) # creación de objeto tipo vector asignado a x y<-c(1,2,3,4,5) # creación de objeto tipo vector asignado a y z= c("a", "b", "c", "d", "e") data=data.frame(x,y,z) # creación de datafra,e dim(data) # dimensiones del dataframe ## [1] 5 3 names(data) # nombres de las columnas del dataframe ## [1] "x" "y" "z" head(data) # ver primeras filas del dataframe ## x y z ## 1 2 1 a ## 2 4 2 b ## 3 6 3 c ## 4 8 4 d ## 5 10 5 e data$x #mostrar la columna denomida x ## [1] 2 4 6 8 10 data$y #mostrar la columna denomida y ## [1] 1 2 3 4 5 data$z #mostrar la columna denomida z ## [1] "a" "b" "c" "d" "e" Paquetes o librerías en R El software R puede ser expandido con paquetes o librerías. Cada paquete o librería es una colección de funciones o datos creadas para atender tareas específicas. Hay paquetes o librerías únicamente para cargar datos al espacio de trabajo para hacer prácticas por ejemplo gapminder. Hay librerías con funciones para trabajo gráfico, una de las más utilizadas es ggplot2. Hay librerías para tareas avanzadas como visualización geoespacial, análisis multivariante, mineria de datos, conexión a bases de datos y muchas otras cosas más. Intalación y llamado de paquetes o librerías Podemos instalar paquetes usando la función install.packages(), dando como argumento el nombre del paquete que deseamos instalar, entre comillas dobles. Una vez concluida la instalación de un paquete, se podrá usar sus funciones llamando o invocando la librería con el siguiente comando library(). Como argumento se coloca el nombre del paquete que quieres utilizar como se muestra a continuación en un ejemplo. Resultados en la consola de R #install.packages("gapminder") library(gapminder) head(gapminder,3) ## # A tibble: 3 x 6 ## country continent year lifeExp pop gdpPercap ## <fct> <fct> <int> <dbl> <int> <dbl> ## 1 Afghanistan Asia 1952 28.8 8425333 779. ## 2 Afghanistan Asia 1957 30.3 9240934 821. ## 3 Afghanistan Asia 1962 32.0 10267083 853.