LENGUAJES DE MARCAS Unidad 1. Introducción a los lenguajes de marcas. LM LENGUAJES DE MARCAS Tema 1 • Índice de contenido Objetivos................................................................................................................................3 Introducción. ..........................................................................................................................4 Concepto y justificación de los LM....................................................................................4 Evolución histórica de los lenguajes de marcas....................................................................5 Clasificación ..........................................................................................................................7 Página 2 de 7 LM LENGUAJES DE MARCAS Tema 1 Objetivos. El objetivo de este tema consiste en introducirse en los conceptos básicos de los lenguajes de marcas, conocer las distintas fases por las que se ha ido imponiendo esta tecnología, los distintos organismos involucrados en sus recomendaciones, y las ventajas que su uso puede proporcionar. Recurso básico: El artículo de la Wikipedia correspondiente a Lenguaje de marcado En el se describen muchos conceptos que serán desarrollados en temas posteriores. Se trata de un tema totalmente introductorio, por lo que nos centraremos en una primera toma de contacto con la terminología, que en muchos casos será totalmente nueva, y en temas posteriores se irá completando en su significado. Estos apuntes básicos deben entenderse como un pequeño guión de los materiales y recursos que entre todos completaremos y ampliaremos mediante la colaboración en el foro y el glosario. Página 3 de 7 LM LENGUAJES DE MARCAS Tema 1 Introducción. Concepto y justificación de los LM Un LM es un tipo de lenguaje que combina el texto con una información adicional sobre ese mismo texto. La información adicional puede referirse al formato de presentación o la estructura del texto. Los lenguajes de marcas no son equivalentes a los lenguajes de programación, ya que no contienen instrucciones de operatividad, y se limitan a controlar y presentar de una forma determinada el texto que contienen. Podría decirse que son sistemas para la descripción de la información contenida en documentos. Se puede observar que el uso de los archivos binarios reporta muchas ventajas (fácil de gestionar por el ordenador, más compacto, etc.), pero los archivos de texto también tienen sus ventajas (la principal es que es un formato de intercambio universal). Quizá lo ideal sería tener un formato que combine la universalidad de los archivos de texto con la eficiencia de almacenamiento y las capacidades de formateo de los archivos binarios. Esta idea de llegar a un formato de datos universal no es nueva. De hecho, desde que existen los ordenadores, los programadores han intentado crear modos de intercambio de información entre los diferentes programas informáticos. Página 4 de 7 LM LENGUAJES DE MARCAS Tema 1 SGML (Standard Generalized Markup Language) fue uno de los primeros intentos en el que se pretendía combinar un formato de dato universalmente intercambiable con la posibilidad de almacenar los datos con información acerca de su presentación y formato. Fue creado para que se transformara en un estándar para el marcaje de los datos y tuvo aceptación en los grandes sistemas de gestión de documentos. Pero cuando se debe tratar con gran cantidad de datos complejos SGML se vuelve un lenguaje muy complicado. En este curso veremos otras alternativas que cumplen sus recomendaciones pero simplifican su aplicación. Evolución histórica de los lenguajes de marcas. El nombre de lenguajes de marcas proviene de los usos del trabajo en las imprentas, ya que una marca era una anotación que se hacía en el manuscrito para señalar al tipógrafo como debía imprimir un fragmento de texto, informando sobre tamaños, estilos, y tipos de letra que se debía utilizar. Esta práctica dio lugar al oficio específico de los marcadores, creándose una serie de marcas reconocidas para cada fin de un estilo de aplicación. Este concepto fue asumido posteriormente en el uso y composición de documentos en el tratamiento informático. En los años 60, IBM intentó resolver sus problemas asociados al tratamiento de documentos en diferentes plataformas a través de un lenguaje de marcas denominado Página 5 de 7 LM LENGUAJES DE MARCAS Tema 1 GML (Generalized markup Language o Lenguaje de marcas generalizado). GML libera al creador del documento de preocupaciones específicas del formato del documento tales como especificación de la fuente, línea espaciamiento, y disposición de página requerida por Script. Usando GML, un documento está marcado con las etiquetas que definen cuáles son el texto, en términos de párrafos, listas, tablas, y así sucesivamente. El documento se puede entonces ajustar al formato automáticamente para varios dispositivos simplemente especificando un perfil para el dispositivo. Por ejemplo, es posible ajustar a formato un documento para una impresora laser o para una pantalla simplemente especificando un perfil para el dispositivo sin cambiar el documento. El principal problema, antes de usar GML, era que cada aplicación utilizaba sus propias marcas para describir los diferentes elementos. Las marcas son códigos que indican a un programa cómo debe tratar su contenido y así, si se desea que un texto aparezca con un formato determinado, dicho texto debe ir delimitado por la correspondiente marca que indique como debe ser mostrado en pantalla o impreso. Y lo mismo ocurre con todas las demás características de cualquier texto. Conociendo este sistema y conociendo a la perfección el sistema de marcas de cada aplicación sería posible pasar información de un sistema a otro sin necesidad de perder el formato indicado. Más tarde GML pasó a manos de ISO y se convirtió en SGML (ISO 8879), Standart Generalized Markup Language. Esta norma es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos más conocidos son el HTML y el RTF. Página 6 de 7 LM LENGUAJES DE MARCAS Tema 1 Clasificación Existen varios criterios de clasificación de los LM. Uno de los más clarificadores puede ser el que se hace en función del uso que se hace de ellos: • Marcaje para describir contenidos del texto, como en una base de datos • Marcaje para describir el formato de los textos, llamado también Marcado de presentación, como puede ser un tratamiento de textos • Marcaje para describir conjuntamente contenido y formato. En este caso tenemos el conocido HTML Otra posible clasificación, quizás la más extendida, es la expuesta en la Wikipedia: • De presentación: Indica el formato del texto (información para el maquetado). • De procedimientos: Orientado también a la presentación pero, en este caso, se indican los procedimientos que deberá realizar el Software de representación. • Descriptivo o semántico: Describen las diferentes partes en las que se estructura el documento pero sin especificar cómo deben representarse. Página 7 de 7