Introducción a Postgresql History! 1977-1985 Michael Stonebraker Inicia postgreSQL como Ingres en la Universidad de Berkeley, California. 1986, comprado por Computer Associates. 1989, Liberada la primera versión como Postgres. 1994-95 dos estudiantes graduados de Berkeley Jolly Chen y Andrew Yu añaden SQL a Postgres y lo llaman Postgres95. 1996, (1000 colaboradores) Se decidió quitar el 95 al nombre para liberarse de la cronología y nace PostgreSQL. Ultima version al momento 8.3.7, 8.4 en test y 8.5 en desarrollo. Presentación Es el SGBD Open Source mas potente del mercado. Posee casi 30 años de desarrollo. Licencia BSD de Berkeley. Esta en la vanguardia de la investigacion en al tecnología transaccional. Es ACID. Es segura. Tiene alternativas comerciales de muchísima calidad. Ej: EnterpriseDB, CyberTech(Alemania), etc. Tiene otras alernativas (forks) FastDB, Bizgres, etc. Presentación Es un motor Objeto-Relacional [*]. Cliente/servidor Extensible Multiples conectores desde lenguajes de programación. Lenguaje procedimental propio (PL/pgsql) y extendido (PL/PERL, PL/PYTHONu, PL/JAVA, PL/RUBY, PL/R, C, C++...) Presentación Puede conectarse por OBDC, OLE DB y JBDC, además de los conectores propios de cada lenguaje. ¡ Cocomo de papel ! [*] El estandar SQL:2003 define las siguientes características que se peuden implementar en las bases Objeto relacionales: Rowtype Tipos definidos y rutinas por usuario. Poliformismo Herencia Tipos de referencia e identidad de objetos (el OID es uno de ellos) Tipos de colección (ARRAY, MULTISET, SET, LIST) Amplaición del SQL para hacerlo computacionalmente completo. Soporte para objetos de gran tamaño (BLOB y CLOB) Recursión. [*] El punto de vista de Stonebraker SGBD relacional Capacidades De búsqueda /soporte multiusuario SGBD O-R Mysql Sistemas De archivos r o y Ma ad d i oc l e v Postgresql SGBD OO Derby Complejidad de los datos y ampliabilidad DB4O or n Me ad d i oc l e v Arquitecturas comunes Backend Proceso Archivo/s Backend Cliente Cliente ... Servidor / Cluster de servidores Servidor Datos Derby – BerkeleyDB Mysql – Postgresql Firebird Oracle – DB2 - Greenplum Características Ppales. El modelo es de cliente/servidor (hoy en día el más común, pero no el único). Su lenguaje procedimental es muy similar al PL de Oracle, logrando una migración mas amena. Se adapta a los standares SQL:2003. Posee MVCC (Multi-Version Concurrency Control). Fue una de las pioneras (la primera fue InterBase) Posee WAL (Write Ahead LOG). Herencia de tablas. Puntos de recuperacion avanzados (savepoints, replicacion asincronica) Optimizador de consultas. Caracteristicas Ppales. Juegos de caracteres internacionales UNICODE e internacionalización. Tipo de tablas BerkeleyDB (las puede usar Mysql). Adicionales Tipos de datos accesorios: Números de presición arbitraria (creando numeros más complejos) Text de largo ilimitado. Figuras geometricas, con funciones asociadas. IpV4 y 6. Mac Address. Arrays. Postgis (necesita un capítulo aparte). Límites Maximo de la BD: ilimitado. De Tablas: 32 TB. De tupla: 1.6 TB. De campo: 1 GB Tuplas x tabla: ilimitado. Índices por tabla: ilimitado. 70 Rango de tamaño frecuente en comparación con otras BD (Terabytes) 60 50 40 Tamaño aproxim ado Tamaño aproxim ado 30 20 10 0 Mysql Postgresql Oracle Greenplum Indices Pueden ser definidos por el usuario: Binary Tree, hash, GIN y Gist. Basados en expresiones. parciales bitmaps. Avanzadas Restricciones Referential Integrity Constraints. Evita dropeos accidentales. Transacciones BEGIN – END- SAVEPOINTS. Anidacion de consultas avanzada. Conexiones encriptadas via SSL. Dominios, clustering, tablaspaces. TOAST (atributos comprimidos largos) Estructura Arquitectura de servicios Aplicacion Postgres postmaster psql Postgres Ámbitos y Esquemas de Conexión Inicio de Conexion postmaster frontend Auth backend frontend Query's backend Servidor frontend Cliente T i e m p o PostMaster Proceso principal. Se maneja como un servicio de sistema. Levanta la memoria compartida. Vigila solicitudes y esta al tanto de los movimientos. Realiza el enlazado a los archivos de datos. puede manejar varias bases de datos y usuarios. Uno x CLUSTER. Conexiones La comunicacion entre Back y front se realiza mediante sockets a traves del puerto 5432 (por defecto). Generalmente el archivo es /tmp/s.PGSQL.5432. Esquema Logico del cluster Repositorio que engloba varias bases de datos. Las bases de datos engloban un conjunto de esquemas, con 1 usuario minimo propietario. La sesion se abre solo contra la Base de datos, no contra Cluster, ni esquemas, ni Tablas. Por defecto se crean Template 0, ...1 y postgres. Tablespaces no se crean por defecto. Roles. usuarios. Son independientes del sistema. Jerarquia de Objetos Servidores Bases de datos Cast Lenguajes Esquemas ... Replicacion Tablas Vistas Tipos Funciones Sequences Funciones y Triggers Dominios Tablespaces. F. Agregación y conversiones Roles Group y User. Operadores ¿Homo paquetus u Homo compilatus ? Instalación Instalación Recomendada En linux a traves de RPM o APT-GET (Ej: ”rpm -i postgresql-8.3.rpm” o ”apt-get install postgresql-8.3”). En Windows tiene un asistente: PgInstaller: traducido al español, customizable (instalación silenciosa), paquete MSI: embebible en otros instaladores OneClickInstaller: más simple pero en ingles Ambos tienen el StackBuilder (apache, php, etc.). Soporta Win, Linux y MacOS. Lo que hay que saber por si las... #export PGDATA='/usr/local/postgresql/data' #su postgres /usr/lib/postgresql/<ver>/bin$initdb -l /var/log (...parametros extra) SE CREA UN CLUSTER NECESARIO PARA ARRANCAR #postmaster -D $PGDATA o #pg_ctl start & (para que quede en segundo plano) pg_ctl start stop (pg_ctl stop -m s[mart] f[ast] i[nmediate]) status restart kill register y unregister ps -ef |grep postgres .... ps -A |grep postgres Arranque automatico copiar el script de postgresql de las contrib a et/init.d/ chmod a+x postgresql-8.3 ln -s /etc..sql /etc/rc3.d/S12postgresql idem K02 o en debian con: update-rc.d postgresql defaults 98 02 Configuración y herramientas principales Archivos postgresql.conf pg_hba.conf pg_ident.conf main.pid (solo contiene el pid del proceso) (son iguales tambien en windows) Las rutas dependen mucho del paquete de instalacion, por defecto compilando desde fuentes es /usr/local/pgsql postgresql.conf Principales: listen_addresses='*' port log_destination=stderr max_connections log_rotatio_age ssl log_rotation_size max_stack_depth=2048 (pila) vacuum cliente pg_hba.conf Controla accesos de users desde ip's Tipos de conexiones TRUST, REJECT, MD5, PASSWD, CRYPT, KRB5.... TYPE-DATABASE-USR-ADDRESS-METHOD local all all 127.0.0.1/32 md5 local all all 0.0.0.0 ident sameuser Servidores Dedicados $sysctl -w vm.overcommit_memory=2 es por que el kernel 2.4 y superior mata al postmaster... Se recomienda que los procesos tengan prioridad -10 o mayor. Backups ! PITR, pg_dump, mirroring ACID ¿Que es? [A]tomicidad (transacciones indivisibles) [C]onsistencia [I]solation ,aislamiento (no se pueden ver entre transacciones) [D]urabilidad: exito de una transaccion que perdura. Solucion para [A] Sentencias de BEGIN, END, ROLLBACK, COMMIT y SAVEPOINT. Solucion [C] A partir de 7.*, gestor de integridad: not null check unique primary key fk -match full y partial Solucion [I] MVCC Solucion [D] WAL (write Ahead Log) /var/pg_xlog Acelera los tiempos de commit y de insercion y update. Monitoreo basico Monitor A traves de ps o top, free, vmstat, iostat. Para poder realizar estadisticas desde el catalogo debe estar activo el recolector de estadisticas en el postgresql.conf. tablas de catalogo: pg_stat_activity pg_stat_database pg_stat_all_databases pg_stat_all_indexes pg_locks .... Monitoreando I/O desde psql SELECT relfilenode, relpages FROM pg_class WHERE relname='tabla' SELECT ..... WHERE relname IN ('pg_toast_relfilenode','pg_toast','relfilenode') – desborde de TOAST. psql (herramienta cliente) El poder de la linea de comando... El psql permite hacer absolutamente todo lo que se puede hacer con el Postgresql. Inclusive, todo aquello que hacemos de forma grafica con el Pgadmin3. Ingreso La autenticacion puede ser configurada a traves de los archivos pg_hba.conf y pg_ident.conf. Estos controlan y realizan el nexo con entre los usuarios del sistema operativo y la base de datos. postgres$psql -Upostgres -Ddatabase Se recomienda el ident en sameuser. desde afuera... psql -l -Upostgres (lista las bases) psql template1 postgres -A -t -c ”select * from pg_database where encoding = 6” | while read D; do (tira el result set a $D) [Meta]comandos \c (conecta con otra base) \? \h <comando sql> \l (lista bases) \d[t|i|s|S|v] \o (redirecciona output) \H (html) \i (ejecutar comandos desde archivos) ¡Esta vez me tocaba a mi ! Referencias: Bibliografia Recomendada Practical Postgresql (www.commandprompt.org) www.postgresql.org/documentation www.pgfoundry.org www.planetpostgresql.org wiki.postgresql.org Ud. ya conoce Postgresql. ¿Que tal si lo prueba? Gracias por quedarse en su asiento SIN arrojar zapatos al disertante. file:///media/KINGSTON/PGDAY_JUNIN/INTRO_POSTGRES/unnoba.JPG