DR AF T Información Figura 1: El Templo de las Inscripciones, es un templo ceremonial-funerario construido en el año 675 d.c. por la civilización maya, situado en Palenque. Es la edificación más alta y de más importancia de las construcciones de la antigua ciudad situada en el estado mexicano de Chiapas. Fue construido, bajo el reinado de Pakal el Grande, (603 d. C.- 683 d. C.). Fue concebido únicamente para glorificar al mandatario Pakal en vida y albergar su cuerpo cuando muriera. A pesar de que el sitio y el templo se habı́a estudiado e investigado durante doscientos años, en el año 1949, el arqueólogo Alberto Ruz Lhuillier, descubrió el acceso a la tumba secreta del templo al mover una gran losa. El acceso habı́a sido sellado con escombro por los antiguos mayas por lo que para acceder a la tumba se escavo durante tres años. La escalera interior que desciende a la tumba está dividida en dos tramos, la entrada a la cripta se encuentra 1,50 metros debajo del nivel del suelo. Tanto el sarcófago y la losa que lo cubre, como los muros de la cripta, están decorados con bajorrelieves que muestran, entre otras cosas, la muerte de Pacal y su descenso al inframundo, donde toma la identidad de uno de los dos gemelos que, en el Popol Vuh, derrotaron a los señores del inframundo y alcanzaron la inmortalidad. palabra palabra Autor: Jorge Luis Zapotecatl López Correo electrónico: [email protected] Url: www.pensamientocomputacional.org 2 DR AF T c D.R. 2014 por Insituto Nacional de Astrofı́sica, Óptica y Electrónica Luis Enrique Erro 1, Tonantzintla, Puebla, México C.P. 72840 Teléfono: (222) 247.29.40 Contacto: [email protected] Índice general Índice general 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DR AF T 1. Información 1.1. Introducción . . . . . . . . . . . . . 1.2. Diferencia entre datos e información 1.3. Caracterı́sticas de la información . 1.4. Representación . . . . . . . . . . . 1.4.1. Representando números . . 1.4.2. Representando texto . . . . 1.4.3. Representando Imágenes . . 1.5. Compresión . . . . . . . . . . . . . 1.5.1. Compresión en imágenes . . 1.5.2. Compresión en texto . . . . 1.6. Corrección de errores . . . . . . . . 1.7. Criptografı́a . . . . . . . . . . . . . 1.7.1. Cifrado por sustitución . . . 1.7.2. Descifrando el código maya 1.8. Aplicando la información . . . . . . Bibliografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 9 10 12 14 14 17 18 19 19 22 23 24 29 31 3 ÍNDICE GENERAL DR AF T 4 Capı́tulo 1 1.1. DR AF T Información Introducción Actualmente, vivimos inmersos en la era de la información. Las computadoras no cesan de producir cambios en la manera de trabajar de cada individuo y de las organizaciones debido a su capacidad de transformar datos en información. Los sistemas basados en computadoras son de uso creciente como medios para la creación, almacenamiento y transferencia de información. En suma, gracias a la web, millones de personas tienen acceso fácil e inmediato a una cantidad extensa y diversa de información en lı́nea. La información es un conjunto organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje. La información es la materia prima fundamental para el responsable de la toma de decisiones porque aumenta su conocimiento. Basado en la información, el usuario tiene mayor certeza de desarrollar la solución adecuada a un determinado problema y tomar decisiones con mayor certidumbre entre un conjunto de alternativas posibles. Por ejemplo, los sistemas de información (un conjunto de elementos orientados al tratamiento y administración de datos e información generados para cubrir un objetivo) son utilizados por los inversionistas para tomar decisiones en las que están en juego miles de millones de pesos o las compañı́as manufactureras los utilizan para hacer pedidos de suministros y distribuir bienes con mayor rapidez. 5 6 CAPÍTULO 1. INFORMACIÓN La teorı́a de la información se enfoca en analizar la estructura matemática y estadı́stica de los mensajes sin considerar su significado. La teorı́a de la información se orienta en la compresión de datos; la detección y corrección de errores; y la criptografı́a. Por lo que la información es uno de los conceptos centrales de la computación, y en general, prácticamente en cualquier investigación cientı́fica y de la vida cotidiana. Para el pensamiento computacional la información es uno de los tópicos principales en el proceso de solución de problemas. Entre los objetivos operativos del pensamiento computacional que se relacionan estrechamente con la información son los siguientes: Organizar datos de manera lógica y analizarlos 1.2. DR AF T Representar datos mediante abstracciones, como modelos y simulaciones Diferencia entre datos e información La información es uno de los recursos más valiosos e importantes en cualquier actividad de nuestra vida diaria o en el quehacer profesional. Sin embargo, es común que este término se confunda con el de datos. Los datos son la representación de realidades concretas en su estado primario. Por ejemplo, el peso de un vehı́culo o el nombre de un empleado. Para representar esas realidades es posible usar varios tipos de datos como son: números, letras, imágenes, audio o video. Los datos no tienen capacidad de comunicar un significado por si mismos. Para que los datos puedan ser útiles deben organizarse y relacionarse en forma significativa dentro de un contexto para transformarse en información. Por lo tanto, la información es un conjunto de datos organizados de tal modo que adquieren un valor adicional más allá del propio. Piensa en los datos como tablones de madera, en cuya condición tienen escaso valor más allá del que inherentemente tienen como objetos concretos (ver figura 1.1(a)). Mientras que si se define algún tipo de relación entre los tablones adquirirán un valor adicional. Por ejemplo, si los tablones se apilan de cierta manera pueden formar un banco (ver figura 1.1(b)). Por lo que el tipo de información creada depende de las relaciones definidas entre los datos existentes. 1.2. DIFERENCIA ENTRE DATOS E INFORMACIÓN (a) Tablas de madera (b) Banco Relaciones entre los datos crean información. DR AF T Figura 1.1: 7 En suma, la adición de datos nuevos o diferentes significa la posibilidad de redefinir las relaciones y de crear nueva información. Suponga que además de los tablones de madera dispusiéramos de clavos, entonces podrı́amos incrementar en gran medida el valor del producto final al construir una escalera o un corral (ver figuras 1.2(a) y 1.2(b)). (a) Escalera (b) Corral Figura 1.2: Relaciones entre los datos existentes y la adición de datos nuevos pueden crean información más valiosa. En forma similar, puedes establecerse reglas y relaciones para organizar los datos a fin de que provean útil y valiosa información. Por ejemplo, un administrador podrı́a considerar, más acorde con su propósito (es decir, más valioso) conocer las ventas mensuales totales que la cantidad de ventas de cada vendedor individual. De igual modo, un administrador podrı́a añadir 8 CAPÍTULO 1. INFORMACIÓN DR AF T datos de productos especı́ficos a sus datos de ventas para genera información sobre ventas mensuales desglosadas por lı́nea de productos. El conocimiento es la apreciación y comprensión de un conjunto de información y de la utilidad que puede extraerse de ella en beneficio de una tarea especı́fica. Por ejemplo, el comprender que mediante la escalera podemos cumplir con la tarea de subir a lugares más altos es el conocimiento extraı́do al apreciar que la manera en que fueron dispuestas las tablas nos permite escalar. La transformación de datos en información es un proceso o serie de tareas lógicamente relacionadas entre si y ejecutadas con el fin de producir un resultado definido. El proceso para definir relaciones entre datos requiere de conocimiento. Por ejemplo, parte del conocimiento necesario para hacer una escalera se fundamenta en la comprensión del hecho de que los peldaños deben colocarse horizontalmente y los postes en forma vertical. El acto de seleccionar o rechazar datos de acuerdo con lo conveniente que sean para tareas especı́ficas también se basa en el conocimiento empleado en el proceso de conversión de datos e información. En consecuencia, la información puede considerarse como datos provisto de mayor utilidad mediante la aplicación del conocimiento. El compuesto de datos, reglas procedimiento y relaciones que deben tomarse en cuenta para genera valor u obtener el resultado que se busca constituye la base de conocimientos. En algunos casos, los datos se organizan o procesan en forma mental o manual, en otros, el proceso se automatiza por medio de una computadora. En caso de un administrador, este puede calcular manualmente la suma de ventas de cada representante de ventas o utilizar para ello una computadora. Pero lo que importa no es tanto donde proceden los datos o como se los procesa, sino en la medida en que son utilices y valiosos. Este proceso de transformación se muestra en la figura 1.3. Figura 1.3: Proceso de transformación de datos en información. 1.3. CARACTERÍSTICAS DE LA INFORMACIÓN 1.3. 9 Caracterı́sticas de la información DR AF T La información debe poseer ciertas caracterı́sticas para que al usuario le resulte valiosa. Si la información no es exacta ni completa, se corre el riesgo de tomar decisiones desacertadas, que puede implicar costos de miles, e incluso millones de pesos a las organizaciones. Por ejemplo, un pronóstico inexacto de demanda futura de un producto que indique un considerable aumento en las ventas, pero dado el momento ocurre lo contrario, podrı́a exponer a una organización a invertir millones de pesos en el desarrollo de un producto innecesario. Además, si la información no es pertinente para la situación tratada, no se hace llegar en forma oportuna a los responsables de decisiones o es tan compleja que resulta incomprensible, cabe la posibilidad de que su valor para el usuario o una organización sea mı́nimo. Las caracterı́sticas que debe poseer la información son las siguientes: Exacta: La información exacta carece de errores. La información inexacta se genera cuando se insertan datos inexactos en el proceso de trasformación. Completa: La información completa contiene todos los datos necesarios. Por ejemplo, un informe de inversión que no incluyera todos los costos estarı́a incompleto. Simple: La información debe enfocarse en lo esencial. Un exceso de información hace que la información sea compleja e imposible identificar lo verdaderamente importante. Confiable: La información confiable tiene un sólido porcentaje de seguridad respecto a su veracidad. Depende de diversos factores como el método de recolección de datos o la fuente de información. Un rumor de fuente anonimia sobre la posibilidad de incremento en los precios del petróleo no serı́a confiable. Verificable: La información debe comprobarse si es correcta, quizá mediante la consulta de diversas fuentes al respecto. Oportuna: La información oportuna es la que se recibe en el momento adecuado o conveniente. Conocer las condiciones climáticas de la semana anterior no servirá de nada para decidir el atuendo de hoy. 10 CAPÍTULO 1. INFORMACIÓN Segura: La información debe estar protegida contra el acceso a usuarios no autorizados. Accesible: La información debe ser accesible para los usuarios autorizados en el formato adecuado y en el momento correcto. Económica: La información económica debe tener un costo relativamente barato. El valor de la información debe ser evaluado frente al costo de producirla. Pertinente: La información pertinente se relacionada y es adecuada en un contexto determinado. Información acerca de la reducción del precio del limón no serı́a pertinente para una empresa que fabrica automóviles. 1.4. DR AF T La información útil puede variar según el valor de cada uno de estos atributos. Por ejemplo, si se trata de datos de investigación de mercado es aceptable cierto grado de inexactitud y parcialidad, pero la oportunidad es esencial. La investigación de mercado podrı́a alertar sobre una inminente reducción sustancial de los precios de los competidores. El conocimiento de los detalles y del momento preciso en que habrá de ocurrir esa reducción de precios quizá no sea tan importante como el hecho de que se nos advierta con la anticipación suficiente para planear una respuesta. Por el contrario en los datos de contabilidad referente al uso de activos empresariales como efectivo, inventario y equipo son decisivos la exactitud, verificabilidad e integridad. Representación A lo largo de su historia, el hombre ha perfeccionando las formas de representar sus pensamientos y sentimientos para poder expresarlos e interpretarlos de manera más efectiva. En un principio se basó en la denominación de objetos y después fue creando su propio sistema de signos. Posteriormente, gracias a la invención del lenguaje el hombre pudo interpretar el mundo que lo rodea en un mayor nivel conceptual y comunicarse con otros seres humanos. Las primeras sociedades humanas se toparon muy pronto con el problema de determinar cuantos elementos formaban una colección de cosas o cual de dos conjuntos de entidades era mayor que otro. El hombre diseño una representación del concepto matemático del número para dar solución a dicho problema. 1.4. REPRESENTACIÓN 11 Figura 1.4: DR AF T La humanidad a lo largo de su historia ha creado diversos lenguajes y sistemas de numeración que representan dichos conceptos abstractos. Por ejemplo, los mayas crearon un sistema de numeración en base 20, fueron de las pocas civilizaciones que inventaron el concepto del cero, y desarrollaron un sistema de escritura completo de los más hermosos que han existido (ver figura 1.15). -Junpeelkun- Los mayas fueron grandes astrónomos, artistas, arquitectos y matemáticos. En su tiempo, construyeron ciudades majestuosas y sus artistas crearon un estilo de arte que hoy en dı́a se considera como uno de los más sobresalientes de la historia. A la izquierda se muestra su sistema de numeración en base 20 y a la derecha su sistema de escritura basado en glifos. El mensaje contenido en la estela maya (piedra tallada) es el siguiente: “Me llamo Alan. Soy estudiante y jugador de pelota. Mi madre se llama Marı́a. Ella trabaja en tejidos y es de Yaxchilán. Mi padre se llama Tomás. Él es agricultor y sabio. El es de Palenque”. Excepto en ciertas culturas, el sistema de numeración decimal es el sistema usado habitualmente en todo el mundo y en todas las áreas que requieren de un sistema de numeración. Es un sistema de numeración posicional en el que las cantidades se representan utilizando como base aritmética las potencias del número diez. El conjunto de sı́mbolos utilizado para representar las diez cifras son: 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9. Sin embargo hay ciertas áreas de estudio, por ejemplo, en las ciencias de la computación, donde se estudian y utilizan otros sistemas de numeración como el sistema binario. Se denomina sistema binario porque sólo utiliza dos dı́gitos como base, el 0 y 1. Cada cero o uno es llamado un “bit”, la palabra bit está formada por la contracción de binary digit. 12 CAPÍTULO 1. INFORMACIÓN 1.4.1. DR AF T El sistema binario es utilizado para representar la información en las computadoras porque es más sencillo de implementarlo en su hardware. Un bit usualmente se representa en la memoria principal de una computadora por una celda que se encuentra en dos niveles de voltaje (encendido o apagado). En los discos duros los bits son representados por la dirección de un campo magnético sobre una superficie revestida. En los discos compactos la parte de la superficie que corresponde a un bit puede reflejar (una cresta) o no reflejar la luz (un valle). Un bit por sı́ mismo no puede representar demasiado por lo que usualmente se juntan en grupos de ocho, lo que se le conoce como un “byte”, un byte puede representar números del 0 al 255. En las siguientes secciones se mostrará cómo representar diverso tipos de datos mediante secuencias de bits, como números, texto e imágenes. Representando números Un bit se representa por un 1 o 0 y es implementado en la memoria principal de una computadora por una celda que se encuentra en dos niveles de voltaje (encendido o apagado). Considera el conjunto de estelas mostradas en la figura 1.5, cada estela contiene puntos marcados en la cara que se encuentra boca arriba. El conjunto de estelas comienza con la estela que contiene un solo punto y cada estela que se encuentra a la izquierda contienen el doble de puntos de la estela adyacente que se encuentra a su derecha, en este caso, 1, 2, 4, 8 y 16. Figura 1.5: La estela que se encuentra a la izquierda contienen el doble de puntos. Cuándo la estela se encuentra boca arriba representa al 1 y cuando se encuentra volteada el 0 mediante la concha de caracol maya (ver figura 1.6). Es decir, el 1 significa que los puntos están visibles y el 0 indica que los puntos se encuentran ocultos. Para obtener el número decimal partir de la distribución de estelas mostrada en la figura 1.6 únicamente se suman los 1.4. REPRESENTACIÓN 13 puntos que se encuentran visibles. Por ejemplo, el número binario 01001 representa al número decimal 9. Figura 1.6: Visibilidad de los puntos. DR AF T Intenta escribir el número de mes en que naciste con un número binario, por ejemplo “Tukkul”nació el 1 de abril de 1987. Por lo que el número decimal a representar es 4, y se obtiene al colocar boca arriba la tercera estela que contiene 4 puntos y dejando volteadas todas las demás. Algunas caracterı́sticas interesantes de los números binarios son las siguientes: Dada una estela seleccionada, contiene el doble de puntos de la estela que se encuentra inmediatamente a su izquierda. Como puedes ver, sólo son necesarias algunas estelas para representar números muy grandes. Dada una estela seleccionada que se encuentra visible y todas las estelas que se encentran a su derecha también son visibles, el resultado de la suma de dichas estelas es el valor de la estela que se encuentra inmediatamente a la izquierda de la estela seleccionada menos 1. Por ejemplo, si seleccionas la tercer estela con valor de 4 y lo sumas con los valores de las estelas anteriores, el resultado es 1 + 2 + 4 = 7, que es el valor de la cuarta estela (con valor 8) menos 1. Otra caracterı́stica interesante de los números binarios es lo qué sucede cuando se pone un cero en el lado derecho del número. Si estamos trabajando en la base 10 (decimal), cuando se pone cero en el lado derecho del número, el número se multiplica por 10. Por ejemplo, 9 se convierte en 90. En la misma manera, cuando se agrega un cero del lado derecho de un número binario se multiplica por dos, por ejemplo 1001 = 9, se convierte en 10010 = 18. 14 1.4.2. CAPÍTULO 1. INFORMACIÓN Representando texto DR AF T Al representar textos en las computadoras se usa un código capaz de representar cualquier sı́mbolo que sea utilizado en cierto conjunto de idiomas. Por lo que se define un tamaño de representación fijo, por ejemplo, de 8 bits. Posteriormente se asocia a cada sı́mbolo alfabético uno de los números binarios posibles de 8 bits que lo represente. Dado que cada código mide lo mismo (8 bits en nuestro ejemplo) se le denomina código bloque. El código ASCII (American Standard Code for Information Interchange) es de 8 bits y fue ampliamente utilizado hasta fines del siglo pasado. No obstante, debido a que algunos paı́ses con otros idiomas necesitan utilizar códigos más grandes se diseño el código Unicode que es utilizado actualmente. Considera una simplificación del código ASCII como la mostrada en la figura 1.7 donde se utilizan cinco bits para representar el alfabeto. Figura 1.7: Código bloque con un tamaño de representación fijo de cinco bits. Por ejemplo, para representar el mensaje “ayuda”, necesitarı́as cinco estelas. Es decir, juntar bloques de cinco bits de la siguiente manera (la coma separa cada letra para visualizar con mayor claridad el bloque que la representa): 00001, 11100, 11000, 00101, 00001. Ahora intenta representar tu nombre, por ejemplo, “tukkul”en binario se escribe de la siguiente manera:10111, 11000, 01100, 01100, 11000, 01101. 1.4.3. Representando Imágenes Las pantallas de las computadoras se dividen en un cuadricula de pequeños puntos llamados pı́xeles (pixel es una palabra formada por el término picture elements). Los pı́xeles se pueden controlar independientemente para que emitan luz o no. Si consideramos unicamente el caso de pantallas en blanco y negro, el pixel emite luz blanca o no, en cuyo caso se ve negro. Las computadoras representan imágenes utilizando números binarios. Por lo que una manera muy simple de representar la imagen de la figura 1.8 1.4. REPRESENTACIÓN 15 DR AF T podrı́a ser mediante 342 bits (aproximadamente 42 bytes), 18 bits para cada uno de los 19 renglones. Usando la convención de escribir los renglones de izquierda a derecha y de arriba a abajo, los primeros tres renglones codifican ası́: 000000000000000000, 000000000000000000, 000000111111000000. Figura 1.8: Imagen en blanco y negro del planeta saturno. En pantallas a colores, los pı́xeles emiten luz de distintos colores (ver figura 1.9). En la figura 1.10 se muestra la imagen de Mario Bros que ha sido ampliada para mostrar los pı́xeles. La imagen puede ser representada utilizando únicamente tres estelas, es decir, tres bits que pueden representar los ocho colores mostrados. Por lo que en las imágenes de mapa de bits, o en los dispositivos gráficos, cada pı́xel se codifica mediante un conjunto de bits de longitud fija. Puede codificarse un pı́xel con un byte (8 bits), de manera que cada pı́xel admite hasta 256 variaciones de color. En las imágenes llamadas de color verdadero, normalmente se usan tres bytes (24 bits) para definir el color de un pı́xel, en total se puede representar 16, 777, 216 variaciones de color, La figura 1.11 muestra una imagen de 24 bits de las bellas e impresionantes cascadas de las nubes. 16 CAPÍTULO 1. INFORMACIÓN Figura 1.9: DR AF T -Paat- Guillermo González Camarena inventó en 1940 un sistema para transmitir televisión en color, el sistema tricromático secuencial de campos (conocido como STSC). Inventó también más tarde, en los años 1960, un sistema más simple para generar color, el sistema bicolor simplificado. González Camarena lanzó la televisión en color en México años antes que la implementación del NTSC. La NASA, durante la misión del Voyager 1 de 1979 para fotografiar al planeta Júpiter, se enviaron equipos electrónicos basados en el tricolor de González Camarena con lo que se pudo observar en plenitud a ese planeta tan lejano. Figura 1.10: La imagen se encuentra representada por grupos de tres bits que representan el color correspondiente a la imagen. DR AF T 1.5. COMPRESIÓN 17 Figura 1.11: Las cascadas de la nubes se encuentran ubicadas en el estado mexicano de Chiapas. Localizadas en la reserva de Montes Azules en los linderos de la Selva Lacandona, estas son formadas por el choque del rı́o Santo Domingo contra la roca, las caracterı́sticas geológicas y el entorno vegetal ofrecen múltiples espacios para visitar y explorar. Un lugar rodeado de selva y aguas, ideal para el turismo de aventura. 1.5. Compresión En la actualidad es de fundamental importancia almacenar datos en la computadora de manera eficiente porque tienen un espacio limitado para almacenar información y la cantidad de datos que se manejan crece constantemente. El acto de reducir el volumen de los datos tratables para representar una determinada información empleando una menor cantidad de espacio es denominado compresión. Los datos se comprimen antes de ser almacenados y se descomprimen cuando se necesitan, permitiendo que la computadora pueda almacenar más información y enviarla más rápido a través Internet. Aunque la capacidad de almacenamiento de las computadoras ha crecido a una velocidad increı́ble en los últimos años, las necesidades de almacenamiento han crecido aún más rápido, por lo que las técnicas de compresión continúan siendo de suma importancia en los sistemas de cómputo que deben manejar archivos enormes de imágenes, audio y video. En la actualidad, el proceso de compresión y descompresión que las computadoras aplican a los datos se realiza de manera ordinaria. 18 1.5.1. CAPÍTULO 1. INFORMACIÓN Compresión en imágenes DR AF T El tipo de imagen que frecuentemente se envı́a por fax consiste en una hoja blanca con algún texto, inmediatamente llama la atención la significativa cantidad de bits desperdiciados debido a que hay grandes bloques de pixeles de color blanco y cada pixel se representa por un bit. Por lo que el cientı́fico o ingeniero de la computación se pregunta, cómo comprimir una secuencia de bits en otra más pequeña sin perder información. Cabe mencionar, que muchos sistemas de comprensión permiten perder algo de información en aras de comprimir aun más. En las secciones anteriores se mostró como representar los números mediante bits. Cuando una computadora almacena una imagen en blanco y negro puede ser representada por números decimales porque lo único que necesita almacenar es cuáles pixeles son de color negro y cuáles son de color blanco. Ası́ se puede codificar una imagen escribiendo, renglón por renglón, el número consecutivo de pixeles blancos, seguido por el de negros, luego blancos, etc. Por ejemplo, los 3 primeros renglones de la carita de la figura 1.8 se puede representar con el conjunto de números decimales: 18, 18, 6, 6, 6. Recuerde que la representación de los tres primeros renglones de ésta imagen es: 000000000000000000, 000000000000000000, 000000111111000000, y tiene un longitud de 54 bits. La representación de la imagen mediante números decimales en términos de bits es: 10010, 10010, 00110, 00110, 00110, y tiene una longitud de 25 bits. Mediante la representación de números decimales, los primeros tres renglones se coprimieron aproximadamente el 50 %. Como se ha mencionado anteriormente, a menudo las imágenes de fax tienen grandes bloques de color blanco (los márgenes) o de color negro (una lı́nea horizontal). Para ahorrar espacio de almacenamiento en este tipo de imágenes se suelen utilizar una variedad de técnicas de compresión de datos. El método utilizado anteriormente para comprimir la imagen de la carita se denomina “Run-Length Encoding”(RLE), y es una manera eficaz para comprimir imágenes. Si las imágenes no se comprimen, entonces se toma mucho más tiempo en transmitirlas y se requiere mucho más espacio para almacenarlas. Esto hará poco factible el envı́o de faxes o poner fotos en una página web. Por ejemplo, las imágenes de fax generalmente se comprimen alrededor de una séptima parte de su tamaño original. Sin la compresión se tardarı́a siete veces más en transmitirse. 1.6. CORRECCIÓN DE ERRORES 19 Las imágenes de color también tienen mucha repetición de bloques de un mismo color. Para ahorrar la cantidad de espacio que se requiere para almacenar este tipo de imágenes, se utilizan una variedad de técnicas de compresión de datos como el JPEG. Las fotografı́as y las imágenes se comprimen a menudo a una décima parte o incluso una centésima parte de su tamaño original. Esto permite almacenar muchas más imágenes en un disco y significa que es posible verlas a través de la Web en menor tiempo. 1.5.2. Compresión en texto 1.6. DR AF T Una de las técnicas que las computadoras utilizan para comprimir texto es el principio de apuntadores a secuencias previas de texto. En la figura 1.12 se muestra el poema “Para Ustedes y Nosotros”escrito por Marı́a Monserrat Bertrán (tomado de Computer Science Unplugged), donde se aplica la técnica de apuntadores. Dicha técnica es denominada codificación “Ziv-Lempel”(LZ) y en la actualidad es conocida como “zip”en nuestras computadoras personales. Además, se utiliza también en el formato de imágenes “GIF”. Otros métodos, como el JPEG plantean que las letras más utilizadas deben tener códigos más pequeños, la clave Morse se basa en ésta idea. Corrección de errores Cuando los datos se almacenan en un disco o se transmiten de una computadora a otra, generalmente asumimos que los datos no cambian en el proceso. Sin embargo, debido a diferentes factores como la exposición a radiaciones magnéticas o eléctricas, por el calor, por daño fı́sico o por fallas de interferencia en el medio de transmisión se presentan errores en los datos. Imagina que estás depositando 1000 pesos en tu cuenta bancaria. El cajero escribe la cantidad del depósito y la envı́a a la computadora central. Pero ocurre una interferencia en la lı́nea mientras la cantidad está siendo enviada, y el código de 1000 es cambiado por 10,000. Esto quizá no será problema para ti, pero sı́ será un problema para el banco. Ahora, considera el caso donde se reciben datos desde una sonda espacial lejana, serı́a muy ineficiente esperar la retransmisión de los datos si ocurre un error (para obtener una señal de radio de Júpiter cuando se encuentra en su punto más cercano a la Tierra el tiempo que se tarda es aproximadamente media hora). CAPÍTULO 1. INFORMACIÓN DR AF T 20 Figura 1.12: El poema contiene 112 sı́mbolos (sin contar espacios en blanco). Al utilizar apuntadores sólo se necesitaron 71 sı́mbolos (y 18 apuntadores). Por lo que la computadora debe de estar dotada de un método de detección de errores capaz de reconocer cuando se han corrompido los datos y de un método de corrección de errores capaz de reconstruir los datos originales. La idea esencial para hacer frente a a errores es expandir los datos para que permitan representaciones capaces de garantizar que lo que se recupera de los datos, luego de enviarlos o almacenarlos, sea lo mismo que se envió o almacenó originalmente, o al menos que se puedan detectar errores. Considera la rejilla de 5 × 5 mostrada en la figura 1.13. Ahora, se añade otra fila y otra columna extras de manera que haya un número par de celdas coloreadas de negro en cada uno de los renglones y columnas. A la celda extra se le llama “celda de paridad”. Figura 1.13: la derecha. 21 DR AF T 1.6. CORRECCIÓN DE ERRORES Rejilla de 5 x 5 a la derecha y la misma rejilla con la adición de las celdas de paridad a Ahora si se colorea de blanco la celda del renglón 3 y la columna 3 (ver figura 1.14) ¿Qué notas en la fila y en la columna de esa celda? La respuesta es que tienen un número impar de celdas coloreadas. Las celdas de paridad se utilizan para mostrar cuando se ha cometido un error. Figura 1.14: Cuando se encuentran filas y columnas con un número impar de celdas coloreadas de negro se deduce donde ha ocurrido un error. 22 CAPÍTULO 1. INFORMACIÓN Técnicas similares a la mostrada anteriormente se utilizan en las computadoras. Al colocar bits de paridad es posible detectar no sólo si se ha producido un error, sino también en donde ha ocurrido. El bit incorrecto es cambiado de nuevo y con ello es realizada la corrección del error. 1.7. DR AF T Por supuesto, las computadoras suelen utilizar sistemas de control de errores más complejos que son capaces de detectar y corregir múltiples errores. El disco duro de una computadora asigna una gran cantidad de su espacio para la corrección de errores, de modo que trabaje de manera confiable incluso si fallan partes del disco. Este tipo de sistemas están estrechamente relacionados al esquema de paridad. Criptografı́a Los datos se pueden comprimir, expandir y también esconder. El objetivo básico de la criptografı́a es enviar un mensaje de manera que solamente el destinatario pueda entender su significado. Cabe mencionar, que existe otra área dedicada al ocultamiento de los mensajes denominada estenografı́a. La intención primaria de la criptografı́a es lograr que dos entidades diferentes (A y B) logren comunicarse de modo que sólo ellos puedan entender el significado del mensaje. Se presupone entonces la existencia de una tercera entidad, el enemigo, que está permanentemente al acecho procurando comprender lo que A y B se dicen. Para que el enemigo no tenga éxito, A y B deben enviarse mensaje cifrados. Por otra parte, el criptoanalisis se encarga de descifrar los mensajes secretos. Cifrar datos es entonces representarlos de tal forma que resulten incomprensibles para quien no esta autorizado. El proceso criptográfico básico es un método que recibe como entrada datos claros, comprensibles para cualquiera, y un elemento adicional llamado clave de cifrado. La salida del método es un mensaje cifrado. El mensaje cifrado es entonces transmitido o almacenado en un medio susceptible a ser intervenido por el enemigo. Por otro lado, el receptor del mensaje debe recuperar los datos originales, para lo cual ejecuta el mismo método, pero ahora para descifrar. El método de descifrado recibe como entrada el mensaje cifrado y una clave de descifrado (correspondiente al la clave de cifrado) con lo que se obtiene el mensaje original. 1.7. CRIPTOGRAFÍA 1.7.1. 23 Cifrado por sustitución DR AF T Uno de los cifrados más antiguos que se conoce es el cifrado de César, atribuido a Julio César. En este método cada letra del alfabeto se remplaza por la letra que se encuentra tres posiciones adelante. Es decir, a se vuele D, b se vuelve E, c se vuelve F,..., x se vuelve A, y se vuelve B y z se vuelve C. En los siguientes ejemplos el texto llano se mostrará en minúsculas y el texto cifrado en mayúsculas. Por ejemplo, la palabra mundo se vuelve PXQGR. Si el cifrado de César se desplaza k letras en lugar de sólo 3 se vuelve un método general de alfabetos desplazados circularmente, donde k se convierte en la clave del método. A los métodos en el que cada letra o grupo de letras se reemplaza por otra letra o grupo de letras para disfrazarla se les denomina cifrado por sustitución. El cifrado César se descifra con facilidad por lo que en la práctica ofrece muy poca seguridad en la comunicación. Otro método de sustitución más robusto es remplazar cada uno de los sı́mbolos del texto llano con alguna otra letra del alfabeto. El texto general de sustitución de sı́mbolo por sı́mbolo del alfabeto se llama sustitución monoalfabetica. Por ejemplo, texto llano: a b c d e f g h i j k l m n o p q r s t u v w x y z texto cifrado: Q W E R T Y U I O P A S D F G H J K L Z X C V B N M La clave es la cadena de 26 letras correspondiente al alfabeto por lo que el texto llano de la palabra mundo se transforma en el texto cifrado ZXYMG. El método de sustitución monoalfabetica parece razonablemente seguro debido a que el criptoanalista tendrı́a que probar entre las 26! ≈ 4 × 1026 claves posibles para descifrar la que se está utilizando. Incluso, si utilizará una computadora que obtuviera una solución en 1 nseg tardarı́a 1010 años en probar todas las claves. Sin embargo, puede descifrarse fácilmente al aprovechar las estadı́sticas de los lenguajes naturales. Por ejemplo, en el idioma inglés, la letra e es la más común, seguida de t, o, a, n, i, etc. Las combinaciones de dos letras más comunes son th, in, er, re y an. Las combinaciones de tres letras más comunes son the, ing, and e ion. Por lo que un criptoanalista comenzará por realizar un análisis de frecuencias que consiste en primero calcular la frecuencia de las letras que aparecen en el texto cifrado y luego asociar letras de texto llano a ellas. Una gran frecuencia de X podrı́a sugerir que las X son e, por lo que se asignarı́a ten- 24 CAPÍTULO 1. INFORMACIÓN tativamente X a e y la siguiente más común a la letra t. Posteriormente, probarı́a con combinaciones de tres letras comunes como tXe, lo que sugerirı́a fuertemente que X es h, y se continuarı́a en la misma manera tratando de adivinar mediante las palabras comunes y conociendo los patrones probables de las vocales y consonantes. El criptoanalista podrı́a tener que intentar varias combinaciones hasta descifrar el texto. 1.7.2. Descifrando el código maya DR AF T Por muchos años, los antiguos mayas fueron un misterio para el mundo. Nadie podı́a leer sus glifos, ni siquiera los mayas modernos. Sin embargo, en los últimos 30 años, muchı́simos glifos han sido descifrados. En la actualidad, representan una valiosa ventana al pasado precolombino revelando un poco su historia y su literatura al comprender mucho de lo que fue escrito en las estelas, vasijas, tapas de bóvedas, entre otros. El siguiente cuento está dedicado a Tatiana Proskouriakoff y a Yuri Knórozov quienes a través de su perseverancia y dedicación al trabajo superaron las adversidades y fueron los personajes clave en el desciframiento de la escritura maya. Texto en blanco La aurora de la vida de Tukkul fue hermosa y resplandeciente, un dı́a cuando caminaba junto a sus padres entre los campos verdes de su finca, les dijo entusiasmado, ¡miren un angelito se ha posado sobre aquel maguey! -No veo nada -pronunció su padre-. -¡Ay! ya no está, pero yo lo vi. Su madre le sonrió de forma serena y confiada. Los padres de Tukkul lo eran todo para él, se sentı́a amado y protegido a su lado. Desafortunadamente, cuando Tukkul tenı́a 12 años, sus padres fallecieron. Hasta ese momento, el pensamiento de Tukkul discurrı́a por la lı́nea de lo precioso y agradable. Ahora, su mente y su corazón percibı́an con claridad y dolor el otro aspecto de la realidad, la vida en su dimensión cruda y objetiva. Para Tukkul fue una dramática revelación porque aquel mundo perfecto en que habı́a creı́do se desvaneció, y ahora en medio de esa tempestad emocional, su mente buscaba una explicación para aquellas contradicciones de la vida, como lo efı́mero de la existencia. En el corazón de su alma se abrió un gran vacı́o debido a una intolerable ansiedad de comprender cuál era el sentido y propósito de la vida. Al paso de los años Tukkul decidió volverse un arqueólogo porque anhelaba encontrar respuestas a todas sus preguntas en las culturas antiguas. Habı́a estudiado en detalle a los sumerios, los egipcios, los griegos y las culturas mesoamericanas. Tukkul se volvió un arqueólogo muy famoso porque siendo muy joven descubrió en el templo de las inscripciones un acceso a una cámara secreta. Durante dos años de excavaciones hacia la cámara secreta, la fama influyó a Tukkul a adquirir un tropel de costumbres y modales mundanos. Tukkul se entregó completamente a una vida frı́vola que lo hizo un individuo vanidoso y ridı́culo. 1.7. CRIPTOGRAFÍA 25 DR AF T Siguiendo los rumores y la corriente popular estaba convencido que dentro de la cámara se encontraba una de las sonadas calaveras de cristal y que le otorgarı́a la inmortalidad. Finalmente el dı́a tan esperado llegó y Tukkul ingresó en la cámara secreta, pero no se encontraba la calavera de cristal, sólo una estela maya como la que se aprecia en la figura 1.15. Tukkul descifró el mensaje, pero no le dio importancia, se sentı́a profundamente decepcionado de su hallazgo (en está sección aprenderás como descifrar el mensaje). Figura 1.15: Estela maya dentro del templo de las inscripciones. Estaba anocheciendo por lo que decidió regresar al campamento, abatido y con un humor de perros ordenó que le trajeran un Té. Entonces, Ixim un joven sirviente, le dijo, mi madre dice que mientras se tenga salud y la conciencia tranquila... De pronto, se escuchó un tremendo ¡plaf! Tukkul le dio una cachetada con tal violencia que la nariz de Ixim comenzó a sangrar (Tukkul nunca habı́a agredido a alguien en su vida). Tukkul se retiró a su alcoba, mientras se arropaba con su bata de piel de ardilla, se sentı́a sumamente inquieto, y advirtió que el motivo de su inquietud no era el hecho de no encontrar la calavera de cristal, sino la cachetada que le habı́a dado al joven Ixim. Tenia una fuerte sensación de ser un infame, un salvaje, y se dijo a si mismo, por qué Hunab Kú (Dios supremo y creador de los mayas) no me llevo a mi también cuando mis padres murieron, se mordió los labios, la melancolı́a se apodero de él y cayó en un profundo sueño. En el sueño, Tukkul se encontraba en una exploración nocturna en la selva Lacandona y en un descuido resbalo y cayo dentro de un cenote. La caı́da lo dejó aturdido, se levantó con dificultad y percibió un olor fétido, se dio la vuelta y a la luz de la luna que entraba por el cenote, quedó horrorizado al ver un cuerpo en descomposición que se empezaba a levantar, el rostro purulento de aquel ser se burlaba de él. Tukkul comprendió que se encontraba en Xibalbá (el inframundo) y que el ser aterrador era el Dios de la muerte Ah Puch. Tukkul comenzó a correr, las piernas le temblaban, Ah puch estaba en su acecho. En el ajetreo Tukkul tropezó y tuvo como nunca antes la sensación de la proximidad de su muerte. En ese instante, Tukkul recordó varios pasajes de su vida y pensó -la vida no me ha arrebatado nada, ahora comprendo que nada me pertenece. Dejo de tener miedo y en lo más profundo de su espı́ritu tuvo un sentimiento de gratitud y bienaventuranza por todo lo que habı́a vivido. Estando en el suelo Tukkul pronunció: “bendigo todos los dı́as la salida del sol”y besó la tierra. Al instante, apareció Kukulkán y escupió un grano de maı́z en la tierra. El maı́z creció hasta volverse una enorme milpa que traspasó el subsuelo hasta llegar a la superficie, Tukkul aprovechó la oportunidad para escapar de Ah Puch y trepó por la milpa. Cuando salió a la superficie se encontraba en Palenque, en ese momento despertó. 26 CAPÍTULO 1. INFORMACIÓN Se levantó inmediatamente y se dirigió al cuarto de Ixim. Lo despertó y le dijo, Ixim, anoche te propicié una cachetada. ¡Perdóname! Ixim se estremeció, estaba confundido y asustado. Tukkul consideró que sus palabras no eran suficientes y se arrodillo a sus pies y volvió a pedirle perdón. Su sirviente se quedó perplejo, “¿Cree que merezco tanto?”y se abrazaron fraternalmente, Tukkul experimento una sensación que no pudo describir en palabras, -quizá este sentimiento es el lazo de vida que nos liga al mundo de los cielos, -se repetı́a continuamente-. DR AF T Al atardecer, Tukkul se encontraba en las escalinatas del templo de Palenque, reflexionando los acontecimientos de la noche anterior, -¿Y si la vida tiene un propósito pero se escapa de mi entendimiento y es inalcanzable? ¿Por qué tendrı́a que tener un propósito la vida? ¿Qué no serı́a más bello que no tenga un propósito y que cada uno sea libre de darle el suyo? ¿O quizá la vida en si misma es el propósito? Cuando Tukkul estaba más inmerso en sus cavilaciones, Ixchel, la hermanita de Ixim llego corriendo alegremente, se le acerco y le dijo, mirá al cielo sin pestañear y veras a los angelitos. Tukkul miró al cielo y transcurrió alrededor de un minuto en silencio. ¿Los ves? inquirió Ixchel. No veo nada pronunció Tukkul. -Pues yo, si. Los angelitos van destellando por el cielo como las luciérnagas. De pronto, Tukkul recordó el mensaje de la estela maya “No busques, simplemente párate y mira”y tuvo una revelación, el habı́a orientado sus esfuerzos en la búsqueda de una sabidurı́a oculta y milagrosa, creı́a que cuando obtuviera el conocimiento arcano se iluminaria de improviso, y podrı́a como en su infancia, ver a los ángeles y retornar al mundo agradable y hermoso. Sin embargo, ahora comprendı́a que la libertad espiritual de mantenerse digno o no ante la vida, ante sus retos y sus sufrimientos es lo que hace que tenga sentido y propósito. Ahora el propósito de su vida ya no era un enigma para Tukkul, tenia un innegable sentido de entrega a la simplicidad de la existencia, a la bondad y al amor, y él era lo suficientemente fuerte para implantar ese sentido en ella. Miro a Ixchel y pensó -ahora mismo estoy viendo un ángel, le sonrı́o y los dos se echaron a rodar alegremente por una pendiente lisa tapizada de suave césped. Texto en blanco La antigua escritura maya se compone de muchos signos y sı́mbolos llamados “glifos”similares a los iconos de la computadora con los que comúnmente asocias un archivo o un programa. Por muchos años el significado de los glifos mayas fue un misterio. El primer paso para su desciframiento fue contar los signos, si una escritura tiene entre 20 y 34 signos probablemente sea un alfabeto que representa sonidos simples, como nuestro alfabeto latino. Si tiene entre 80 y 100 signos probablemente esté basado en silabas. Si está basado en varios cientos de signos, entonces es logográfico porque cada signo se asocia a una de las miles de palabras completas, como la escritura china. Los escritos mayas tienen alrededor de 800 signos, demasiados para un alfabeto y pocos para representar todas las palabras de un idioma. 1.7. CRIPTOGRAFÍA 27 DR AF T Yuri Knorozov basado en “Relación de las cosas de Yucatán”del obispo español Diego de Landa y los códices mayas de los hermanos Villacorta propuso que era un sistema mixto que combinaba signos fonéticos (silabogramas) y signos para palabras completas (logogramas). En el caso de los signos fonéticos cada glifo representa una combinación consonante-vocal, es decir, una sı́laba. Los mayas usaban glifos para las vocales a, e, i, o, u y tenı́an sı́mbolos para la mayorı́a de las consonantes acompañadas por una vocal, por ejemplo, para ma, me, mi, mo y mu (ver figura 1.16). Como unicamente los mayas inventaron glifos para las sı́labas que terminaban en vocal, Knorozov supuso correctamente que una palabra maya formada por una combinación consonante-vocal-consonate era escrita con dos glifos y la vocal del segundo glifo no se pronunciaba. Por ejemplo, al escribir un sonido como la sı́laba tab, usaban las sı́labas ta + ba y no pronunciaban la última a. Una manera fácil de escribir esto es: ta-b(a). Los paréntesis indican que la última a es muda. Aunque la última vocal a es muda, por lo general en escritura maya la última vocal y la vocal anterior son idénticas, a esto se le llama la regla de la armonı́a. Por otro lado, los glifos que significan palabras completas y no son formadas con sı́labas son denominados logogramas. Por ejemplo, los logogramas que representan la palabra blanco (SAK), cielo (CHAN) y jaguar (BÁLAM) se muestran en la figura 1.16. Figura 1.16: Los mayas tenı́an sı́mbolos para la mayorı́a de las consonantes acompañadas por una vocal, por ejemplo, para ma, me, mi, mo y mu. Los glifos que significan palabras completas y no son formadas con sı́labas son denominados logogramas Posteriormente, los epigrafistas habı́an estado buscando un solo sı́mbolo para cada sonido silábico, hasta que David Stuart descubrió que un sonido podı́a tener varias representaciones diferentes. Por lo general, los mayas 28 CAPÍTULO 1. INFORMACIÓN DR AF T tenı́an más de una manera de escribir una sı́laba, lo cual es diferente en la mayorı́a de las lenguas modernas. Nosotros siempre escribimos el sonido ma como m+a, sin embargo, los mayas tenı́an muchos modos de escribir el sonido ma (ver figura 1.16). Los escribas mayas eran mujeres y hombres muy creativos e inteligentes, y a ellos les gustaba mucho divertirse cuando escribı́an su lengua por lo que les encantaban las sustituciones, preferı́an crear nuevas y originales formas de expresarse. Por eso, dos mujeres que se llamaban Marı́a podı́an deletrear sus nombres usando diferentes glifos mayas. Por ejemplo, vamos a escribir el nombre Marı́a con glifos mayas. Marı́a se puede dividir en las sı́labas ma-ri-a. No obstante, en el idioma antiguo maya no existı́a ningún sonido de “r ”, por lo tanto hay que reescribir Marı́a como si fuera ma-li-a. Posteriormente, obtienes los glifos relacionados a las silabas utilizando el silabario del anexo “glifos mayas”o puedes adquirirlo fácilmente en internet ingresando: silabario maya. El resultado se muestra en la figura 1.17. Figura 1.17: Aquı́ tienes una forma de cómo reunir las sı́labas para escribir el nombre Marı́a: Fı́jate que para escribir Marı́a, escalamos las sı́labas ma y li, los glifos mayas se leen usualmente de izquierda a derecha y de arriba a abajo. Puedes escoger para las sı́labas cualquier glifo que a ti te guste, después de todo, se trata de plasmar tu propio estilo. Como pudiste darte cuenta en el ejemplo anterior, los glifos pueden acomodarse de diversas maneras. Si te interesa profundizar en la escritura maya puedes consultar la página: www.famsi.org/spanish/mayawriting/. Finalmente, Tukkul pudo descifrar el mensaje de la estala maya de la figura 1.15 porque conoce de memoria el silabario maya y pudo sustituir las silabas de acuerdo a cada sibalograma como se muestra en la figura 1.18. 1.8. APLICANDO LA INFORMACIÓN 29 Figura 1.18: Mensaje descifrado. 1.8. Aplicando la información DR AF T La información es la materia prima fundamental para el responsable de la toma de decisiones porque aumenta su conocimiento. Basado en la información, el usuario tiene mayor certeza de desarrollar la solución adecuada a un determinado problema y tomar decisiones con mayor certidumbre entre un conjunto de alternativas posibles. Las computadoras y sistemas de información seguirán provocando cambios en la sociedad, las empresas y la vida de los individuos. El acceso a la información es de vital importancia en la sociedad porque le permite a cada individuo tener la posibilidad de crear, consultar, utilizar y compartir la información y el conocimiento, de tal manera que las comunidades y los pueblos puedan emplear plenamente sus posibilidades en la promoción de su desarrollo sostenible y en la mejora de su calidad de vida. Es sorprendente que toda la amplia variedad de entidades almacenadas en una computadora como lo son: texto, imágenes, música, videos o los programas para editar un archivo o un video juego, no sea más que secuencias de 0 y 1 llamados bits. Además, el cerebro también almacena: poemas, canciones, reglas de multiplicación, entre otras. Por lo que todos esos datos están representados de alguna forma en el cerebro. CAPÍTULO 1. INFORMACIÓN DR AF T 30 Bibliografı́a Bribiesca, E., Galaviz, J. y Rajsbaum, S.(2010), Información, Enciclopedia de conocimientos Fundamentales 5 UNAM Siglo XXI (pp. 604-632), México: UNAM. DR AF T Bell, T., Witten, L. y Fellows, M. (2008), Computer Science Unplugged, CS Unplugged. Starir, R. y Reynolds, G. (2000), Principios de sistemas de información, Thomson. Wing, J.M. (2008), Computational thinking and thinking about computing. Philosophical transactions of the royal society A, 3717-3725. Tanenbaum, A. S. (2003), Redes de computadoras, Preantice Hall. Pitts, M. y Matson, L. (2008), Escribir con Glifos Mayas: Nombres, lugares y oraciones simples, una introducción no técnica a los glifos mayas, The Aid and Education Project, Inc. 31