Subido por FULCO ALEXANDER PINCAY FIGUEROA

Práctica Inicial- Empezando en R (2)

Anuncio
#Empezando en R
¿ Qué es R?
R es un lenguaje estadístico especialmente diseñado para el tratamiento de datos, cálculo y desarrollo
gráfico. Permite trabajar fácilmente con vectores, matrices y diversas herramientas para el análisis
estadístico de datos. Actualmente hay algunas plataformas en línea para trabajar en R como la de
www.kaggle.com . Además, hay aplicaciones de escritorio como R Studio que se utilizará en el desarrollo
del curso y en las evaluaciones.
##Tipos de datos
Existen varios tipos de datos en R, por ahora se presentará ejemplos de los más importantes.
•
numeric (cantidades)
–
integer (números enteros)
–
doble (número decimales)
•
character (tipo texto)
•
factor (tipo factor)
•
logical (tipo booleano)
Resultados en la consola de R
pi
## [1] 3.141593
typeof(pi)
## [1] "double"
typeof("abc")
## [1] "character"
typeof(TRUE)
## [1] "logical"
typeof(FALSE)
## [1] "logical"
Operadores aritméticos
•
+ para la suma
•
- para la resta
•
* para la multiplicación
•
/ para la división
•
%% para la división entera, muestra el módulo
•
^ para la potencia
Resultados en la consola de R
1+2
## [1] 3
1-2
## [1] -1
1*2
## [1] 2
1/2
## [1] 0.5
10/3
## [1] 3.333333
10%%3
## [1] 1
2^3
## [1] 8
Operadores relacionales
•
< Menor que
•
<= Menor o igual que
•
> Mayor que
•
>= Mayor o igual que
•
== Exactamente igual a
•
!= No es igual a
Resultados en la consola de R
5<3
## [1] FALSE
5 <= 3
## [1] FALSE
5>3
## [1] TRUE
5 >= 3
## [1] TRUE
5 == 3
## [1] FALSE
5 != 3
## [1] TRUE
Operadores lógicos
•
& conjunción entre dos datos de tipo logical
•
disyunción entre dos datos de tipo logical
•
! negación de dato de tipo logical
Resultados en la consola de R
TRUE & TRUE
## [1] TRUE
FALSE | FALSE
## [1] FALSE
!TRUE
## [1] FALSE
Objetos en R
En R todo resultado es un objeto, se puede trabajar con varias clases de objetos; algunos de ellos son
estándar en cualquier lenguaje de programación y otros son objetos específicos de R, objetos pensados
para ser manejados con propósitos estadísticos. Los más importantes que se van a utilizar son: vectores,
matrices, listas y dataframes.
##Vectores
Son la estructura de datos más sencilla con la que trabaja R (de una dimensión).
Nota: Permite un sólo tipo de dato
Resultados en la consola de R: Creando un vector
x<-c(2,4,6,8,10) # creación de objeto tipo vector asignado a x
length(x) # longitud del vector x
## [1] 5
Dataframes
Un data.frame (tabla de datos) es el objeto más habitual para almacenar datos. La forma de pensar en
un data.frame es considerar que cada fila representa a un individuo de una muestra o población y el
correspondiente valor para cada columna se corresponde con la medición de alguna variable para ese
individuo (fila-individuo, columna-variable)
Nota: Permite columnas de diferentes tipos.
Resultados en la consola de R: Creando un dataframe
x<-c(2,4,6,8,10) # creación de objeto tipo vector asignado a x
y<-c(1,2,3,4,5) # creación de objeto tipo vector asignado a y
z= c("a", "b", "c", "d", "e")
data=data.frame(x,y,z) # creación de datafra,e
dim(data) # dimensiones del dataframe
## [1] 5 3
names(data) # nombres de las columnas del dataframe
## [1] "x" "y" "z"
head(data) # ver primeras filas del dataframe
## x y z
## 1 2 1 a
## 2 4 2 b
## 3 6 3 c
## 4 8 4 d
## 5 10 5 e
data$x #mostrar la columna denomida x
## [1] 2 4 6 8 10
data$y #mostrar la columna denomida y
## [1] 1 2 3 4 5
data$z #mostrar la columna denomida z
## [1] "a" "b" "c" "d" "e"
Paquetes o librerías en R
El software R puede ser expandido con paquetes o librerías. Cada paquete o librería es una colección de
funciones o datos creadas para atender tareas específicas. Hay paquetes o librerías únicamente para
cargar datos al espacio de trabajo para hacer prácticas por ejemplo gapminder. Hay librerías con
funciones para trabajo gráfico, una de las más utilizadas es ggplot2. Hay librerías para tareas avanzadas
como visualización geoespacial, análisis multivariante, mineria de datos, conexión a bases de datos y
muchas otras cosas más.
Intalación y llamado de paquetes o librerías
Podemos instalar paquetes usando la función install.packages(), dando como argumento el nombre del
paquete que deseamos instalar, entre comillas dobles. Una vez concluida la instalación de un paquete,
se podrá usar sus funciones llamando o invocando la librería con el siguiente comando library(). Como
argumento se coloca el nombre del paquete que quieres utilizar como se muestra a continuación en un
ejemplo.
Resultados en la consola de R
#install.packages("gapminder")
library(gapminder)
head(gapminder,3)
## # A tibble: 3 x 6
## country continent year lifeExp pop gdpPercap
## <fct>
<fct> <int> <dbl> <int> <dbl>
## 1 Afghanistan Asia
1952 28.8 8425333 779.
## 2 Afghanistan Asia
1957 30.3 9240934 821.
## 3 Afghanistan Asia
1962 32.0 10267083 853.
Descargar