Notas sobre R - Universitat de Barcelona

Anuncio
Graficos
Paquetes
SQL
Notas sobre R
Alex Sánchez i Francesc Carmona
Department d’Estadı́stica
Universitat de Barcelona
16 de juny de 2006
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Introducción
R tiene grandes posibilidades para hacer gráficos.
demo(graphics)
http://addictedtor.free.fr/graphiques
Idea: la visualización es parte integral del análisis y la
comunicación de los resultados
Los gráficos deben ser en primer lugar estadı́sticos.
También pueden ser estéticos.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Tipos de funciones gráficas en R
Funciones de alto nivel
Permiten crear los gráficos básicos
plot, hist, boxplot, pairs,...
Funciones de bajo nivel
Permiten modificar los gráficos creados
points, lines, text, axis,...
Gráficos Trellis: Permiten describir situaciones complejas, a
menudo multivariantes, con un sólo gráfico organizado en
paneles.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Los dispositivos gráficos
Cuando creamos un gráfico en R dirigimos la salida hacia un
dispositivo o “driver”.
Por defecto es la pantalla.
Hay muchos formatos disponibles:
’postscript’,’pdf’,’png’,’jpeg’,’bmp’,...
La utilización de los distintos drivers aumenta la flexibilidad y
potencia de R
Podemos crear gráficos de gran calidad, de manera automàtica.
Podemos crear grandes cantidades de gráficos mediante scripts
para tratamientos masivos de datos.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Los pasos para crear un gráfico
Una forma tı́pica de crear gráficos puede ser:
Llamar el driver hacia el que se dirigirá la salida
Establecer los parámetros por defecto (Ajustes previos al
gráfico)
Crear el gráfico utilizando funciones de alto nivel (Ajustes al
crear el gráfico)
Modificar el gráfico con funciones de bajo nivel (Ajustes
prosteriores al gráfico)
Restablecer los parámetros
Cerrar el dispositivo de salida.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
plot() y compañı́a
La instrucción básica para crear un gráfico es plot()
Se trata de una función genérica: Al ser R un lenguaje
orientado a objetos el resultado de la funcion será diferente
segun sobre que tipo de datos se aplique.
> opt <- par(bg = "yellow", mfrow = c(1,
+
1))
> barplot(VADeaths, beside = T, col = c("lightblue",
+
"mistyrose", "lightcyan", "lavender",
+
"cornsilk"), legend = rownames(VADeaths),
+
ylim = c(0, 100))
> title(main = "Death Rates in Virginia",
+
font.main = 3)
> par(opt)
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Ejemplo
100
Death Rates in Virginia
0
20
40
60
80
50−54
55−59
60−64
65−69
70−74
Rural Male
Rural Female
Urban Male
Urban Female
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Ajustes previos al gráfico: par()
La instrucción par() permie establecer un grandı́simo número
de opciones gráficas (? par)
A diferencia de otros programas, muchos aspectos de
configuración deben establecerse antes de crear el gráfico.
Las opciones deben restaurarse despues de su utilización
> library(DAAG)
> attach(elasticband)
> oldpar <- par(cex = 1.5, mex = 1.5,
+
bg = "grey")
> plot(distance ~ stretch)
> par(oldpar)
> detach(elasticband)
> detach(package:DAAG)
Alex Sánchez i Francesc Carmona
Notas sobre R
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Paquetes
SQL
●
160
●
●
●
●
120
distance
●
●
42 44 46 48 50 52 54
stretch
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Ajustes al crear el gráfico
La mayoria de instrucciones admiten un numero mı́nimo de
parámetros para definir cosas como el tı́tulo (main) o las
etiquetas (xlab, ylab)
> library(DAAG)
> attach(elasticband)
> oldpar <- par(cex = 1.5, mex = 1.5)
> plot(distance ~ stretch, main = "Analisis de elastici
+
xlab = "Estiramiento", ylab = "Distancia",
+
sub = "Tomado de 'Using R...'",
+
xlim = c(40, 60), ylim = c(100,
+
200))
> par(oldpar)
> detach(elasticband)
> detach(package:DAAG)
Alex Sánchez i Francesc Carmona
Notas sobre R
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Paquetes
SQL
180
●
140
●
●
●
●
●
●
100
Distancia
Analisis de elasticidad
40
45
50
55
60
Estiramiento
Tomado de 'Using R...'
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Ajustes despues del gráfico: con funciones de bajo nivel
Una vez dibujado el gráfico podemos añadirle lineas o texto
facilmente. ylab)
> library(DAAG)
> attach(elasticband)
> oldpar <- par(cex = 1.5, mex = 1.5)
> plot(distance ~ stretch, main = "Analisis de elastici
+
xlab = "Estiramiento", ylab = "Distancia")
> abline(lm(distance ~ stretch))
> text(stretch, distance, rownames(elasticband),
+
pos = 2, cex = 0.8, col = "red")
> par(oldpar)
> detach(elasticband)
> detach(package:DAAG)
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Analisis de elasticidad
2 ●
160
4 ● 7 ●
1 ●
6 ●
120
Distancia
3 ●
5 ●
42 44 46 48 50 52 54
Estiramiento
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Otros ajustes (1): Varios gráficos por pantalla
Probablemente las opciones más utilizadas sean mfrow() y
mfcol()
Permiten representar más de un gráfico por pantalla
organizándolos por filas o columnas.
> library(MASS)
Attaching package: 'MASS'
The following object(s) are masked _by_ .GlobalEnv :
Cars93
> attach(Animals)
> par(mfrow = c(2, 2), pch = 16)
> plot(body, brain)
Alex Sánchez i Francesc Carmona
Notas sobre R
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Paquetes
SQL
Attaching package: 'MASS'
The following object(s) are masked _by_ .GlobalEnv :
Cars93
Varias formas de representar la relacion peso altura
●
●
0
60
●
●●
20000
40
sqrt(brain)
●
●
●
●
20
●
0
4000
2000
0
brain
●
●
60000
0
body
50 100
200
300
● ●
4
6
8
●
g(brain)
2.0
.5
ain)^0.1
●
●
●● ●
● ●●
●
●
●●
sqrt(body)
●
●
● ●
● ●
●
●
●●●
●
●●
●
●●
●
●
●
●
●
●
●
● ●
●●
●
●● ●
● ●●
●
●
Alex
●
● Sánchez i Francesc Carmona
●
●
●
●
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Más ejemplos
La mejor forma de aprender a utilizar los parámetros es
probando que efecto producen sobre los gráficos.
Una buena fuente de ejemplos esta en la página web del libro
“R graphics” de Paul Murrell http://www.stat.auckland.
ac.nz/~paul/RGraphics/rgraphics.html
El codigo contenido en este script:
http://www.stat.auckland.ac.nz/~paul/RGraphics/
examples-stdplots.R realiza los gráficos de la página
siguiente.
Alex Sánchez i Francesc Carmona
Notas sobre R
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
6
Bird 131
4
●
2
●
● ●
● ●
0
●
●
0
●
4
2
●
●
●
8
12
16
4
0
Histogram of Y
0.5
0.4
Density
6
Responses per Second
Responses per Travel
Graficos
Paquetes
SQL
0.3
0.2
0.1
0.0
−3
−2
−1
0
Travel Time (s)
200
3
30
100
54.3
54.6
50
41
26.9
18.1
11.7
Rural
Male
30.9
37
20.3
11.7
8.7
24.3
15.4
Rural
Female
Urban
Male
35.1
19.3
13.6
8.4
tooth length
66
0
2
35
71.1
150
50
1
Y
25
●
20
15
10
Ascorbic acid
Orange juice
5
0
Urban
Female
0.5
0.5
1
1
2
2
Vitamin C dose (mg)
Cherry
Blueberry
z
Apple
y
Vanilla
x
Other
Boston Cream
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
R permite una cierta interacción con interactuar con los
gráficos en pantalla.
identify() Permite etiquetar puntos, colocando el cursor
sobre ellos y haciendo un clic con el botón izquierdo.
locate() Permite obtener las coordenadas del punto,
colocando el cursor sobre ellos y haciendo un clic con el botón
izquierdo.
La interacción finaliza si se alcanza el total de puntos
solicitados o se pulsa el botón derecho.
library(UsingR);attach(florida)
plot(BUSH, BUCHANAN, xlab="Bush", ylab="Buchanan")
identify(BUSH, BUCHANAN, County)
locator()
detach(florida);detach(package:UsingR)
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
La libreria lattice
El paquete lattice es muy útil para describir gráficamente
datos multivariantes.
La idea consiste en que el gráfico está formado por un cierto
número de paneles.
Normalmente cada uno de ellos corresponde a alguno de los
valores de una variable que condiciona.
Las funciones se escriben con la notación de la fórmula del
modelo.
En los gráficos univariantes como los histogramas, la variable
respuesta, a la izquierda, se deja vacı́a.
Alex Sánchez i Francesc Carmona
Notas sobre R
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Paquetes
SQL
Un grafico Trellis básico
Attaching package: 'MASS'
The following object(s) are masked _by_ .GlobalEnv :
Cars93
20
B
30
40
50
O
Percent of Total
20
15
10
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Representación de una variable condicionada por los
valores de otra
Attaching package: 'MASS'
The following object(s) are masked _by_ .GlobalEnv :
Cars93
O
●
B
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Notación de fórmula en gráficos Trellis
Attaching package: 'MASS'
The following object(s) are masked _by_ .GlobalEnv :
Cars93
O
M
●
●
F
B
M
●
Alex Sánchez i Francesc
Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Introducción
Una de las caracterı́sticas de R es que promueve el hecho de
que si alguien crea algo que considera útil para la comunidad
pueda ponerlo al alcance de los demas usuarios de R .
Obviamente una posibilidad es escribir una función y hacer
público el código, pero la experiencia ha demostrado que el
codigo creado asi no resulta sencillo de reutilizar.
Con el fin de hacer que el proceso de difusión se pueda
realizar de manera sencilla, y a la vez fiable se ha introducido
la posibilidad de crear paquetes o librerias.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Carga de funciones desde un archivo
El sistema más sencillo para ejecutar código pre-existente es
incluirlo desde un archivo.
Esto se puede hacer con la función source. Por ejemplo la
instrucción
> source("C:/cursos/R/analizar.R")
leerá todo el código en R contenido en el archivo analizar.R
Si el código no contiene errores se ejecutará, o bien si se trata
sólo de funciones quedaran disponibles para ser invocadas.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes de R
Una librerı́a o paquete (”package”) es una colección de objetos
creados y organizados siguiendo un protocolo fijo que
garantiza un soporte mı́nimo para el usuario ası́ como la
ausencia de errores (de sintaxis) en la programación.
Los pasos necesarios para la creación de un paquete son
1
2
3
4
5
6
Creación de los objetos que contendrá el paquete (funciones
y/o datos).
Creación del esqueleto del paquete
Redacción de la documentación. Retoques.
Compilación del paquete en Linux y creación de la versión para
windows.
Instalación
Prueba y publicación.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Creación de las funciones
Un paquete puede contener cualquier tipo de objetos de R :
funciones, datos etc.
Lo primero que debe hacerse es programar las funciones y
preparar los datos. El proceso de creación vigila que no hayan
errores sintácticos pero no controla si hay errores lógicos.
El ejemplo que se presenta a continuación crea una función
para resumir los datos de un data frame.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Una función de resumen
resums <- function(dataFrame,fName){
sink(paste(fName,"txt",sep="."))
pdf(paste(fName,"pdf",sep="."))
resumeixUna<-function(dataFr,colum){
x<-dataFr[,colum]
nomx<-names(dataFr)[colum]
if (is.numeric(x)){
hist(x,main=nomx); nomx; print(summary(x))
}else{if (is.integer(x)){
barplot(table(x),main=nomx);nomx; print(summary(x))
}else{if (is.factor(x)){
plot(x,main=nomx); nomx; print(summary(x))}}}}
for (i in 1:ncol(dataFrame))
resumeixUna(dataFrame,i)
dev.off(); sink()}
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Esqueleto del paquete
R proporciona una función package.skeleton que permite
automatizar el proceso de creación de un paquete creando los
directorios, los ficheros de documentación y otros objetos
necesarios.
La única información necesaria es el nombre del paquete y la
lista de objetos que va a necesitar.
La instrucción siguiente crea el esqueleto de un paquete
llamado IDESCATasanchez
> package.skeleton(name = "IDESCATasanchez",
+
list = "resums")
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Estructura del paquete
El resultado de invocar la función package.skeleton() es
una carpeta con una serie de directorios y archivos similares a
los que se encuentran en cualquier paquete.
La carpeta man contiene la documentación
La carpeta src contiene el codigo que formará parte del
paquete
La carpeta R contendrá el codigo compilado al finalizar la
instalación
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Retoque de la documentación
En la carpeta man se encuentran varios archivos: Uno con el
nombre del paquete y otro (u otros)para ada función que
hayamos creado.
Estos archivos, con extensión .Rd deben editarse para icluir en
ellos la documentación que deseamos que el paquete contenga.
En principio se trata de archivos LateX, pero apenas es
preciso conocer este lenguaje porue los lugares en donde
debemos escribir estan indicados por comentarios.
La documentación que redactemos será la que aparezca al
invocar la ayuda del paquete.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Creación de paquetes
Una vez creada la documentación y hechos los retoques
necesarios debemos finalizar la preparación del paquete.
La instrucción R CMD check IDESCATasanchez verificará que
no haya errores de sintaxis o no se generen warnings.
La instrucción R CMD build IDESCATasanchez compilará el
paquete generando un archivo IDESCATasanchez.tar.gz listo
para su instalacion.
La instrucción R CMD INSTALL IDESCATasanchez instalará el
paquete dejándolo listo para su uso.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Bases de datos relacionales
Outline
1
2
3
Introdución
Instrucciones de alto nivel
Ajuste de parámetros
Más ejemplos
Identificación de puntos en la región gráfica
Graficos Trellis
Graficos
Reutilización del codigo
Creación de los objetos del paquete
Creación del esqueleto del paquete
Redacción de la documentación. Retoques
Compilación e instalación
Paquetes
Bases de datos relacionales
SQL
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Bases de datos relacionales
Sistemas de gestión de bases de datos
Una base de datos relacional es una base de datos formada
por un conjunto de tablas relacionadas entre si por un
conjunto de relaciones.
Un RDBMS es un sistema para el majejo de las tablas y
relaciones (p.ej. Access lo es).
Cada tabla tiene un conjunto de campos (columnas)que define
el tipo de informacion que se almacena en ellas.
Cada fila contiene un registro (individuo o caracterı́stica).
Los registros de las tablas pueden cobinarse para formar
unidades complejas de información a través de las relaciones,
que pueden ser de tipo: una a una, una a muchas o muchas a
muchas.
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Bases de datos relacionales
SQL
El lenguaje de consulta estructurado (SQL) es un lenguaje
estandar e independiente de la plataforma para manipular
bases de datos relacionales.
Se trata de un estándar ANSI, que en principio deberian
incorporar todos ls RDBMS.
En la práctica la mayoria incorporan implementaciones propias.
Un buen recurso para aprender SQLes visualizar las consultas
de ACCESS en modo SQL o utilizar un tutorial, como, por
ejemplo: http://sqlzoo.net/
Alex Sánchez i Francesc Carmona
Notas sobre R
Graficos
Paquetes
SQL
Bases de datos relacionales
Manejo de bases de datos con SQL desde R
Hay diversos recursos para manejar bases de datos en SQL
desde R :RDBI, RMySQL, RSQL, RODBC,...
El paquete RODBC que cumplen el estandar ODBC (”Open
Database Connectivity”) utilizando SQL desde R .
Esto resulta especialmente interesante para trabajar con
ACCESS desde R .
El script Access-R muestra como utilizarlo con una base de
datos de ejemplo llamada PECES.MDB
Alex Sánchez i Francesc Carmona
Notas sobre R
Descargar