- E

Anuncio
Título
Experiencia de desarrollo de una distribución de software documental: AMPdoc
Title
Development experience of Information Science software distribution: AMPdoc
Autor
Prof. Manuel Blázquez Ochando. Departamento de Biblioteconomía y Documentación.
Facultad de Ciencias de la Documentación. Universidad Complutense de Madrid.
[email protected]
Resumen
La proliferación de software libre especializado en biblioteconomía y documentación ha resuelto
muchos problemas de automatización de unidades de información (bibliotecas, archivos,
centros de documentación) y ha creado otros nuevos, como la correcta configuración,
instalación y funcionamiento de los mismos. El propósito de crear una distribución de software
documental es facilitar a los usuarios un ecosistema de aplicaciones que potencialmente puedan
ser utilizadas de forma inmediata para gestionar archivos, repositorios web, flujos de trabajo,
congresos, revistas, editoriales, programas web-crawler, sistemas de gestión integral de
bibliotecas SIGB, sistemas de gestión de contenidos CMS y agregadores de contenidos. Para su
desarrollo se ha utilizado una distribución de servidor web AMP de tipo portable sobre la que se
han instalado los distintos programas y aplicaciones que combinadas permiten al profesional de
la información enfrentar cualquier necesidad de gestión automatizada de la documentación.
Palabras clave
Automatización de bibliotecas, Automatización de archivos, Automatización de museos,
Gestión de contenidos, Unidades de Información y Documentación, Software, Tecnologías
documentales, Tecnologías de la Información, Apache, PHP, MySQL, WAMP, Servidor web
Keywords
Library automation, Archive automation, Museum automation, CMS, Content Management
System, Software, Information Science Technology, Apache, PHP, MySQL, WAMP, Web Server
Introducción
La automatización de unidades y centros de información es una de las actividades más complejas
que pueden llevarse a cabo en el ámbito de las Ciencias de la Documentación. Automatizar
significa identificar procesos y trabajos que puedan ser desarrollados de forma autónoma,
guiada, asistida y metodológicamente normalizada, basada en una planificación previa. Además
del ejercicio intelectual que requiere la automatización de una unidad de información, debe en
todo caso soportarse en el desarrollo de las tecnologías de la información, materializándose en
aplicaciones informáticas que sirven al profesional de la biblioteca, archivo, museo o centro de
documentación. Es en estos pasos, donde se encuentran la mayor parte de las dificultades y
problemas de la automatización, por ejemplo la incoherencia entre la planificación y las
funciones que puede automatizar la aplicación informática, la carencia de aplicaciones
informáticas que resuelvan problemas concretos, las dificultades de instalación y configuración
del nuevo software, la adecuación del mismo a las necesidades planteadas, la elección y testado
comparativo de distintas aplicaciones, la posibilidad de probar distintas combinaciones de
aplicaciones y su interactividad, entre otros.
Desde el punto de vista didáctico y académico, la asignatura de Automatización de Unidades de
Información constituye uno de los pilares bajo los que debe consolidarse la nueva enseñanza de
la Documentación, basada en la evidencia de la catalogación, la biblioteconomía, la archivística,
los lenguajes documentales y la recuperación de información. La automatización como
enseñanza, puede aunar todos los conocimientos teóricos y relacionarlos de forma práctica en
una aplicación tangible, visible y visual que es percibida por los estudiantes como un
instrumento complementario en el desarrollo de su formación profesional e intelectual. La
automatización es un conocimiento transversal común en todos los ámbitos de la
Documentación, que debe ser potenciado y facilitado para lograr una mayor versatilidad en la
resolución de los problemas reales a los que el futuro profesional deberá enfrentarse. Estos
futuros problemas son el manejo de los sistemas de catalogación automatizada, la identificación
y descripción archivística automatizada, la migración de datos entre sistemas de información, la
programación y diseño de flujos de trabajo, el desarrollo de métodos de vigilancia informacional,
el desarrollo de entornos web para la gestión de contenidos, la gestión de repositorios y
colecciones digitales, entre otros.
Para poder hacer uso de las tecnologías de la Información y de la Documentación, se necesitaba
un importante conocimiento técnico para la instalación y configuración de las distintas
aplicaciones que potencialmente pueden ser utilizadas en un momento dado. De hecho, cada
vez en mayor medida, los requisitos de los programas informáticos que permiten la
automatización de bibliotecas, archivos y todo tipo de centros de información, implican la
instalación de un servidor web, bases de datos de alta capacidad y módulos de compilación
específicos para interpretar la programación en la que están codificadas las distintas
aplicaciones. Esto significa que el documentalista debe tener un alto grado de conocimiento de
del soporte de funcionamiento AMP (Servidores Apache HTTP, bases de datos MySQL y
programación en PHP). Aunque sería deseable, no puede admitirse en muchos casos destinar
excesivo tiempo en estas acciones. Por tanto, se fue creando la necesidad de una solución
técnica que posibilitara el acceso a múltiples aplicaciones documentales, sin necesidad de
realizar instalación y configuración alguna y que además permitiera su portabilidad inmediata
entre distintos ordenadores.
Origen de AMPdoc
Los problemas relacionados con la automatización, descritos anteriormente, fueron en gran
medida, resueltos con la creación de la primera distribución de software documental, diseñada
específicamente para resolver las necesidades de los profesionales de la información en sus
actividades docentes, investigadoras y profesionales. El fruto de este trabajo se denominó
AMPdoc1 y consiste en un software descargable que puede ser ejecutado en cualquier sistema
operativo Windows, en cualquier medio informático y desde cualquier soporte de
almacenamiento, permitiendo el acceso inmediato a 25 aplicaciones o programas directamente
relacionados con las actividades y procesos de la Documentación.
AMPdoc fue puesto en conocimiento de la comunidad científica el día 28 de febrero de 2014 y
desde entonces han sido creadas las versiones 1.0, 1.1 y 2.0 siendo ésta última, el motivo
principal del presente artículo. En origen AMPdoc disponía de 18 aplicaciones y en la última
versión ha sufrido una profunda transformación en cuanto a gestión y manipulación de las
aplicaciones instaladas, así como de la introducción de nuevas aplicaciones que amplían las
posibilidades originales del proyecto.
Desarrollo base de la distribución
AMPdoc es un desarrollo directo de la distribución Server2Go (Haberkern, T. 2007), cuyo
objetivo era la elaboración de un entorno de desarrollo AMP (Apache 2.2.15, MySQL 5.1.46 y
PHP 5.3.2) que fuera portable y configurable para cualquier propósito. Esto significa que tanto
AMPdoc como Server2Go pueden ser utilizados desde cualquier medio de reproducción, ya
fuere un disco duro externo, un pendrive o bien un equipo de sobremesa o portátil. La capacidad
de portabilidad es un requisito indispensable para los profesionales de la información, que a
menudo necesitan trasladar sus trabajos entre distintas localizaciones. En este sentido, se eligió
Server2Go entre otras opciones igualmente válidas como WampServer, UwAmp, EasyPHP, ZWAMP, por su completo soporte y experiencia de desarrollo previa, el empleo de puertos de
comunicación diferentes2 a los utilizados por defecto en el navegador web de escritorio y por la
posibilidad de simultanear su ejecución con otro servidor en un mismo equipo.
Tomando como base Server2Go, comenzó el desarrollo de la distribución AMPdoc. Se trata de
una profunda transformación de la configuración original atendiendo a los parámetros del
servidor web Apache, de la base de datos MySQL y del módulo de PHP, véase la tabla 1.
Servidor HTTP Apache – httpd.conf
-
Activación del módulo mod_rewrite.so
Base de datos MySQL – my.ini
1
Activación de método de almacenamiento en tablas InnoDB
AMPdoc. La denominación procede de las siglas Apache, MySQL, PHP y Documentación.
Puertos de comunicación diferentes. Server2Go inicia su servidor web con el puerto 4001, en vez del
puerto 80, que por defecto suele utilizarse en la comunicación http. Por otra parte, la base de datos
MySQL emplea el puerto 7188 en vez del 3306, utilizado por defecto en las instalaciones AMP estáticas
en el disco duro de un equipo. Esto significa que Server2Go y otra servidor web pueden ser ejecutados
simultáneamente y dar servicios distintos en un mismo equipo al no utilizar los mismos puertos de
comunicación.
2
Módulo PHP – php.ini
-
-
Tiempo máximo de ejecución ilimitado
Ampliación del límite de memoria de los programas 2048 M
Activación de la declaración de variables
Aumento a 80 M el tamaño máximo de archivos mediante envíos de tipo POST
(post_max_size)
Magic Quotes desactivadas
Tamaño máximo de carga de archivos ampliado a 80 M (upload_max_filesize)
Activación del permiso de uso de URLs externas como wrappers (allow_url_fopen)
Activación de extensiones de enlaces de librerías dinámicas DLL (php_cpdf.dll, php_curl.dll,
php_domxml.dll, php_mbstring.dll, php_exif.dll, php_fileinfo.dll, php_gd2.dll,
php_gettext.dll, php_java.dll, php_ldap.dll, php_openssl.dll, php_pdf.dll, php_pgsql.dll,
php_tokenizer.dll, php_xsl.dll, php_xslt.dll, php_yaz.dll, php_zlib.dll, php_pdo.dll,
php_sqlite.dll, php_mysql_libmysql.dll, php_mysqli_libmysql.dll, php_pdo_sqlite.dll,
php_pdo_pgsql.dll, php_pdo_mysql.dll, ixed.5.3.ts.win)
Ampliación del tamaño de cache de MySQL y MySQLi
Sin límite en el número máximo de conexiones a MySQL y MySQLi
Tabla 1. Parámetros configurados en AMPdoc
Específicamente el módulo mod_rewrite de Apache debe ser activado para permitir la
construcción de direcciones URL optimizadas para SEO en algunas de las aplicaciones instaladas.
En relación a las modificaciones de la configuración de MySQL se habilitó el motor de
almacenamiento de datos InnoDB, requerido para el funcionamiento de grandes volúmenes de
datos. La configuración de PHP resulta fundamental para la instalación de todas las aplicaciones,
ya que en su mayor parte, el tiempo de ejecución de scripts era insuficiente, siendo necesaria la
ampliación por tiempo ilimitado. En caso contrario, los programas no terminan de ejecutar los
procesos de instalación o cualquier otro proceso que implique más de 30 segundos. De igual
forma se incrementó la memoria destinada a la ejecución de programas PHP, así como el tamaño
de los archivos susceptibles de ser cargados o enviados por medio de variables de tipo POST,
que también intervienen en los procesos de instalación o importación de datos en las
aplicaciones. La activación del permiso de wrappers con enlaces externos, referido con el
parámetro allow_url_fopen, resulta esencial para que las aplicaciones puedan descargar
actualizaciones, en línea o para que los programas de rastreo de la web y de recopilación de
datos de repositorios OAI funcionen adecuadamente. Sobre las extensiones activas, cabe
destacar que las referidas son necesarias para el correcto funcionamiento de todas las
aplicaciones instaladas.
Aplicaciones y utilidades de AMPdoc
El principal propósito de AMPdoc es proporcionar un ecosistema de aplicaciones documentales
suficientemente variado compara cubrir todas las necesidades de gestión de la información en
cualquier institución y organización. En este sentido se definió un método que permitiera elegir
adecuadamente todas las aplicaciones susceptibles de ser instaladas, véase tabla 2.
1. La aplicación debe ser compatible con la versión de Apache, MySQL y PHP
disponible en AMPdoc.
2. Las librerías y módulos requeridos para la instalación de la aplicación deben
estar disponibles en el propio programa o bien en la documentación o bien
desde el sitio web oficial del proveedor.
3. La aplicación debe ser una versión estable o de producción.
4. La aplicación debe poder ser utilizada en el contexto de la Documentación.
Tabla 2. Método de selección de aplicaciones para la distribución AMPdoc
Las aplicaciones deben poder ser instaladas convenientemente en la distribución AMPdoc de
acuerdo a la versión disponible del servidor y sus componentes, con independencia de su
complejidad. En este sentido, aplicaciones como el gestor de bibliotecas Koha y el gestor de
archivos Archivist Toolkit, no fueron seleccionados al requerir entornos de ejecución con Apache
Tomcat, o bien sistema operativo Linux, no siendo completamente multiplataforma. Por otra
parte las aplicaciones elegidas para AMPdoc, en todos los casos, disponen de las librerías y
módulos necesarios para su ejecución y se encuentran en versiones estables que han sido
probadas tanto por la comunidad de desarrolladores como por los usuarios. Finalmente, las
aplicaciones pueden encuadrarse en las categorías de gestión de bibliotecas, archivos, museos,
centros de documentación, departamentos de información empresarial, gestión de contenidos
CMS, blogs, lenguajes documentales, sector editorial, gestión de revistas, gestión de
conferencias, repositorios digitales, recuperación de información, agregación de contenidos,
wikis y posicionamiento web.
En la tabla 3, figuran todas las aplicaciones instaladas en AMPdoc. Obsérvese que en algunos
casos, se ha producido una actualización de las versiones de tales aplicaciones en el transcurso
de un año desde su instalación. Algunas de las más destacables son las relativas a la gestión de
bibliotecas como OpenBiblio, PMB y SLiMS (Müller, T. 2011). OpenBiblio es un programa para la
automatización sencilla de bibliotecas que sigue el patrón de catalogación y clasificación de la
Library of Congress de Estados Unidos. El programa PMB representa una opción de
automatización completa de bibliotecas siguiendo la tradición europea de organización
bibliográfica y de automatización de procesos documentales. El programa SLiMS, de origen
indonesio, irrumpe en los canales de información de la biblioteconomía occidental en el año
2014 y constituye una opción a tener en consideración por su completo abanico de opciones
(Azwar, M. 2014), comparable a PMB.
En la sección de archivos, el programa Archon de la Universidad de Illinois resulta clave para la
gestión uniforme de las colecciones archivísticas de acuerdo a las normas ISAD-G y el empleo de
EAD (Schwartz, S. W. et al. 2007). No obstante no ha podido instalarse aún una versión más
actualizada debido al cambio de plataforma de desarrollo que ha experimentado Archon y que
ha dado como resultado el desarrollo de un nuevo software denominado ArchivesSpace y que
ha fusionado el proyecto Archivist Toolkit con Archon. Debido a este motivo, se vienen buscando
programas que complementen a Archon en distribuciones de tipo AMP, encontrando ICA-AtoM.
Resulta de uso preferente para la descripción archivística al estar basado en los estándares del
Consejo Internacional de Archivos.
Aplicación
Versión en
AMPdoc1.0
Versión en
AMPdoc2.0
1
OpenBiblio
http://obiblio.sourceforge.net
0.7.1
0.7.2
2
PMB
http://www.sigb.net
5.13
5.14
3
SLiMS
http://slims.web.id
7
7.2
4
Archon
http://www.archon.org
2.23
2.23
5
ICA-AtoM
https://www.ica-atom.org
1.3.1
1.3.1
6
Omeka
https://omeka.org/
2.14
2.3
7
Joomla
http://www.joomla.org
3
3.2.0
8
Drupal
https://www.drupal.org
7.26
7.36
9
Concrete
http://www.concrete5.org
-
5.6.3
10
BEdita
http://www.bedita.com
-
3.5.1
11
BigTree
https://www.bigtreecms.org
4.0.2
4.2
12
Wordpress
https://wordpress.org
3.8.1
4.1.1
13
B2Evolution
http://b2evolution.net
-
5.2.2
14
TemaTres
http://www.vocabularyserver.com
-
1.81
15
OMP
https://pkp.sfu.ca/omp
1.0.0
1.1.1
16
OJS
https://pkp.sfu.ca/ojs
2.4.3
2.4.6
17
OCS
https://pkp.sfu.ca/ocs
2.3.5
2.3.6
Tipología
Bibliotecas
Archivos
Museos
CMS
Blogs
Lenguajes
documentales
Editorial
Conferencias
18
OHS
https://pkp.sfu.ca/ohs
2.3.2
2.3.2
Repositorios
19
MediaWiki
https://www.mediawiki.org
-
1.24.2
Wikis
20
CuteFlow
http://cuteflow.org
2.11.2
2.11.2
Workflow
21
SeoPanel
http://www.seopanel.in
3.4.0
3.6.0
22
Serposcope
http://serphacker.com
-
1.0.7
23
Selfoss
http://selfoss.aditu.de
-
2.12
24
TinyTinyRSS
https://tt-rss.org
V2014
V2015
25
PHPCrawl
http://phpcrawl.cuab.de
0.82
0.83
SEO
Posicionamiento
Web
Sindicación de
contenidos
Webcrawler
Tabla 3. Aplicaciones instaladas en AMPdoc
La especialización de Museos está representada por el programa Omeka ya documentado en los
trabajos de (Saorín Pérez, T. 2011) y (Alcaraz-Martínez, R. 2012), utilizado ampliamente en el
desarrollo de colecciones museográficas y exposiciones virtuales como las disponibles en el
Museo Metropolitano de Nueva York (Kucsma, J., Reiss, K., & Sidman, A. 2010). También se
estudió la posibilidad de instalar el programa Collective Access, mucho más completo y
sofisticado que Omeka, pero con mayores dificultades de configuración e instalación al requerir
módulos como elasticsearch (Martínez, R. A. 2014), que no estaban incluidos en el software y
que requerían su instalación en sistema operativo Linux.
Los gestores de contenidos CMS están representados por Joomla, Drupal, BigTree, Concrete y
BEdita. Éste último tiene la capacidad para relacionar semánticamente publicaciones,
documentos, eventos, galerías de imágenes, etiquetas, comentarios, archivos multimedia,
traducciones, noticias, direcciones, libros, entre otros contenidos, lo que lo convierte en una
opción de interés para desarrollar proyectos archivísticos y documentales (Feliciati, P. 2012).
El apartado de blogs lo componen las aplicaciones Wordpress y B2Evolution que permiten
gestionar o un blog o una red de blogs.
El programa TemaTres corresponde al ámbito de los lenguajes documentales y representa una
excelente opción para crear vocabularios controlados, ontologías y tesauros.
En relación a la PKP (Public Knowledge Projects) se instalaron todos los programas disponibles,
lo que permite gestionar revistas científicas con OJS (Willinsky, J. 2005), colecciones
monográficas de editoriales con OMS, gestionar congresos y conferencias con OCS y crear
repositorios OAI con herramientas de recopilación con OHS.
También se han integrado wikis mediante la aplicación MediaWiki, flujos de trabajo para la
edición de documentos mediante CuteFlow y un sencillo pero efectivo rastreador web,
PHPCrawler, que sirve notablemente en la labor didáctica y docente.
En cuanto a las aplicaciones de posicionamiento web destacan SeoPanel que es considerada la
herramienta de código abierto más relevante del sector y la emergente Serposcope
especializada en el seguimiento del ranking de palabras clave para el posicionamiento web. Estas
aplicaciones permiten crear estrategias de SEO-SEM que pueden ser utilizadas con fines
profesionales o divulgativos.
Completando la selección de programas instalados en AMPdoc, se seleccionaron los
agregadores de canales de sindicación TinyTinyRSS y Selfoss. Destinados al seguimiento de
noticias en formato RSS, pero con los que es posible realizar procesos de vigilancia
informacional, seguimiento y filtrado de contenidos.
Interfaz y dinámica de funcionamiento
La distribución AMPdoc dispone de una página de inicio que actúa a modo de menú rápido con
los accesos directos de todas las aplicaciones instaladas. Este apartado es importante para
facilitar el acceso inmediato a las utilidades y se ha visto modificado entre las versiones 1.0 y
2.0, tal como se observa en la figura 1.
AMPdoc 1.0
AMPdoc 2.0
Figura 1. Interfaz de la portada de AMPdoc
Entre las características que se han añadido a la nueva distribución AMPdoc 2.0 se encuentra la
capacidad de definir accesos inmediatos a las aplicaciones de trabajo que seleccione el usuario.
Suele suceder que entre todas las aplicaciones instaladas en AMPdoc, sólo una breve selección
son las más utilizadas. Para favorecer la inmediatez en la disponibilidad de los contenidos,
AMPdoc puede cargar simultáneamente tres aplicaciones distintas al inicializarse.
Otra característica del diseño de AMPdoc es la introducción de un sistema de gestión de
instalaciones. Ello permite al usuario desinstalar las aplicaciones que no va a utilizar, reduciendo
el tamaño de la distribución. El proceso de desinstalación es automático y borra todos los
archivos correspondientes al programa seleccionado, incluyendo la base de datos que emplea
en MySQL. Esto supone, que una vez desinstalada la aplicación no pueda volverse a instalar.
Para aquellos casos en los que el usuario no desea eliminar la aplicación pero si desea que
desaparezca de la página de accesos, AMPdoc incluye la posibilidad de deshabilitar dicha
aplicación. Con posterioridad siempre se puede volver a rehabilitar las aplicaciones,
manteniendo su correcto funcionamiento.
En relación a la puesta en marcha de AMPdoc el primer paso es su descarga completa. El
programa puede ser descargado desde el repositorio de software SourceForge en la dirección
[http://sourceforge.net/projects/ampdoc/]. El siguiente paso es descomprimir el programa y
ubicarse en la unidad de almacenamiento, disco o pendrive correspondiente. Finalmente se
ejecuta el archivo AMPdoc.exe que inicia el servidor AMP y pone en funcionamiento todas las
aplicaciones.
Conclusiones

AMPdoc aúna en una sola herramienta la mayor parte de las aplicaciones de gestión que
pueden ser utilizadas por el profesional de la información en los entornos bibliotecarios,
archivísticos y documentales. La distribución AMPdoc permite operar con 24 aplicaciones
distintas, combinar su uso, compararlas, testarlas y desarrollar trabajos de producción,
docentes y de investigación.

AMPdoc resulta de utilidad para la automatización de bibliotecas, archivos, museos,
colecciones digitales, la gestión editorial, el desarrollo de sitios web corporativos de
unidades de información y documentación, la gestión de flujos de trabajo, la gestión de
contenidos semánticos, la creación de vocabularios y lenguajes documentales, la enseñanza
de fundamentos de recuperación de información mediante rastreadores web, elaboración
de wikis y vigilancia informacional mediante agregadores y sindicación de contenidos.

AMPdoc no requiere ningún tipo de instalación o configuración especial, quedando todas
sus opciones y características abiertas y disponibles desde el momento en que se ejecuta
el programa. Esto significa que los problemas de instalación y configuración del soporte,
servidor, módulos y programas añadidos no suponen ningún problema para el profesional
o usuario destinatario. Esto permite democratizar y fomentar el uso y desarrollo de las
tecnologías de la Documentación.
Bibliografía

Abbal, L., Faivre, E. y Murail, T. (2014). EasyPHP. Disponible en: http://www.easyphp.org/

Alcaraz-Martínez, R. (2012). Omeka: exposiciones virtuales y distribución de colecciones
digitales. BiD: textos universitaris de biblioteconomia i documentació, (28).

Azwar, M. (2014). Membangun Sistem Otomasi Perpustakaan dengan Senayan Library
Management System (SLiMS). Jurnal Ilmu Perpustakaan & Informasi KHIZANAH ALHIKMAH, 1(1), 19-33.

Bourdon, R. (2015). WampServer. Disponible en: http://www.wampserver.com/

Cosca, B. 2013. Z-Wamp. Disponible en: http://www.easyphp.org/

Coz, G. (2014). UwAmp. Disponible en: http://www.uwamp.com/en/

Feliciati, P. (2012). Ask the users, il valore aggiunto della valutazione dei sistemi
informativi culturali on line coinvolgendo gli utenti: il caso del progetto “Una Città per gli
Archivi”. IL CAPITALE CULTURALE. Studies on the Value of Cultural Heritage, (5), 129-144.

Haberkern, T. (2007). Server2Go. Disponible en: http://www.server2go-web.de/

Kucsma, J., Reiss, K., y Sidman, A. (2010). Using Omeka to build digital collections: The
METRO case study. D-Lib magazine, 16(3), 2.

Martínez, R. A. (2014). CollectiveAccess, un sistema de gestión y difusión de colecciones
de museos, archivos y bibliotecas.

Müller, T. (2011). How to choose a free and open source integrated library system. OCLC
Systems & Services: International digital library perspectives, 27(1), 57-78.

Saorín Pérez, T. (2011). Exposiciones digitales y reutilización: aplicación del software libre
Omeka para la publicación estructurada. Métodos de información, 2(2), 29-46.

Schwartz, S. W., Prom, C. J., Rishel, C. A., y Fox, K. J. (2007). Archon: A unified information
storage and retrieval system for lone archivists, special collections librarians and curators.
Partnership: the Canadian Journal of Library and Information Practice and Research, 2(2).

Willinsky, J. (2005). Open journal systems: An example of open source software for
journal management and publishing. Library hi tech, 23(4), 504-519.
Descargar