INDICE Pág. Introducción 2 Cargadores y Ligadores 3 Funciones Básicas del Cargador 3 Características del Cargador Dependientes de la Maquina 5 Relocalización 5 Tablas y Lógica de un Cargador Ligador 6 Características del Cargador Independientes de la Maquina 7 Búsqueda Automática en Biblioteca 7 Opciones del Cargador 7 Programas de Superposiciones 8 Opciones de Diseño del Cargador 9 Editores de Ligado 9 Ligado Dinámico 9 Cargadores de Arranque 10 Ejemplos de Cargadores y Ligadores Reales 11 Editor de Ligado del Sistema/370 11 Ligador del Sistema VAX 11 Cargador del CYBER 12 Anexos 13 Conclusiones 22 Bibliografía 23 INTRODUCCION En el trabajo que se presenta a continuación damos las definiciones de cargadores y ligadores, también hacemos referencia a las funciones básicas, características y opciones de diseño de estos programas del 1 sistema; además agregamos algunos ejemplos de cargadores y ligadores reales así como en la parte de anexos incluimos las tablas, códigos y diagramas sobre los que hacemos referencia. CARGADORES Y LIGADORES Un programa objeto contiene instrucciones traducidas y valores de datos del programa fuente, y especifica direcciones en memoria donde se cargarán estos elementos. Un cargador es un programa del sistema que realiza la función de carga (llevar el programa objeto a la memoria para su ejecución). Algunos sistemas tienen un ligador o editor de ligado (combina dos o más programas objeto independientes y proporciona la información necesaria para realizar referencias entre ellos) para realizar las operaciones de enlace, y un cargador separado para manejar la relocalización (modificar el programa objeto de forma que puede cargarse en una dirección diferente de la localidad especificada originalmente) y la carga. En la mayoría de los casos todos los traductores de programas (esto es, ensambladores y compiladores) de un sistema en particular producen programas objeto en el mismo formato, de esta forma puede usarse el cargador o ligador del sistema con independencia del lenguaje de programación fuente original. FUNCIONES BÁSICAS DEL CARGADOR Las funciones más importantes del cargador son colocar un programa objeto en la memoria e iniciar su ejecución. Se considera un cargador absoluto que podría ser utilizado como el tipo de ensamblador. En la figura 3.1(a) se muestra un ejemplo del programa objeto de dicho ensamblador. Como este cargador no necesita realizar las funciones de ligado y relocalización de programas, su operación es muy simple, pues todas las funciones se realizan en un solo paso. Se revisa el registro de encabezamiento para comprobar si se ha presentado el programa correcto para la carga (y que tendrá cabida en la memoria disponible). A medida que se lee cada registro de texto, el código objeto que contiene pasa a la dirección de memoria indicada. Cuando se encuentra el registro de fin, el cargador salta a la dirección especificada para iniciar la ejecución del programa cargado. En la figura 3.1(b) se muestra una representación del programa de la figura 3.1(a) después de la carga. El contenido de las localidades de memoria para las cuales no hay registro de texto se representa por xxxx. Esto indica que el contenido previo de esas localidades no se altera. En la figura 3.2 se muestra un algoritmo para la lógica del cargador sencillo analizado. Aunque este proceso es muy simple, hay un aspecto que merece ser comentado. En el programa objeto de ejemplo los bytes de código ensamblado se expresan en representación hexadecimal en forma de caracteres. Por ejemplo, el código de operación de máquina para una instrucción STL se representaría por el par de caracteres 14. Así durante la carga, cada pareja de bytes del registro del programa objeto debe empaquetarse en un byte. Es muy importante tener en cuenta que en la figura 3.1(a), cada carácter impreso representa un byte del registro del programa objeto. Por otra parte en la figura 3.1(b), cada carácter impreso representa un digito hexadecimal de la memoria (esto es, medio byte). Este método de representar un programa objeto es eficiente desde el punto de vista del espacio y el tiempo de ejecución por lo que la mayoría de las máquinas almacenan los programas objeto en forma binaria almacenándose cada byte en el programa objeto. Lógicamente, con este tipo de representación un byte puede contener cualquier valor binario. Hay que estar seguro de que las convenciones de archivo y dispositivos no hacen que algunos bytes del programa objeto sean interpretados como caracteres de control, en la que se indica el final de un registro con un byte que contiene un 00 hexadecimal, es inapropiada para usar con un programa objeto binario. CARACTERÍSTICAS DEL CARGADOR DEPENDIENTES DE LA MAQUINA 2 El cargador absoluto es simple y eficiente; sin embargo, este esquema tiene varias desventajas potenciales. Una de las más obvias es que el programador necesita especificar (al ensamblar el programa) la dirección real en la que se cargará la memoria. Si se trata de un computador muy sencillo con poca memoria, esto no crea muchas dificultades, ya que solo hay espacio para ejecutar un programa a la vez. En maquinas mas grandes y avanzadas, la situación no es tan fácil porque a menudo se quieren ejecutar a la vez varios programas independientes compartiendo la memoria. En esta sección se consideran el diseño e implantación de un cargador más complejo. Este cargador se encarga de la relocalización y ligado del programa, además de las funciones básicas. La necesidad de relocalizar los programas es una consecuencia directa del cambio a computadores mas grandes y potentes. La forma de efectuar la relocalización en un cargador también depende de las características de la maquina. Relocalización Los cargadores que permiten la relocalización de programas se denominan cargadores relocalizadores o relativos. El primer método se utiliza un registro de modificación para describir cada parte del código objeto que se ha de cambiar al relocalizar el programa. En la Fig. 3.3 se muestra un programa SIC/XE que se emplea para ilustrar este primer método de especificación de la relocalización. La mayoría de las instrucciones de este programa manejan direccionamiento relativo o inmediato. Las únicas partes del programa ensamblado que contienen direcciones reales son las instrucciones con formato extendido de las líneas 15, 35 y 65. En la Fig. 3.4 se muestra el código objeto correspondiente al código fuente de la Fig. 3.3. Obsérvese que hay un registro de modificación para cada valor que se ha de cambiar durante la relocalización (en este caso, 15, 35 y 65). Cada registro de modificación especifica la dirección inicial y la longitud del campo cuyo valor se va alterar y después describe la modificación a realizar. En este Ejemplo, todas las modificaciones suman el valor del símbolo COPY, que representa la dirección inicial del programa. Algunos computadores proporcionan una posibilidad de relocalización por hardware que elimina en parte la necesidad de que el cargador efectúe la relocalización de programas. Tablas y Lógica de un Cargador Ligador El algoritmo de un cargador ligador es mucho más complicado que el del cargador absoluto. La entrada de este cargador consta de un conjunto de programas objeto que se van a ligar. Una sección de control puede hacer una referencia externa a un símbolo cuya definición aparece mas adelante en este flujo de entrada. En ese caso, la operación de ligado requerida no se puede realizar hasta haber asignado una dirección al símbolo externo implicado. Así pues, un cargador ligador suele dar dos pasos sobre su entrada, al igual que hace un ensamblador. El paso 1 asigna direcciones a todos los símbolos externos, y el paso 2 realiza la carga, la relocalización y el ligado. La principal estructura de datos necesaria para el cargador ligador es una tabla de símbolos externos TABSE. Esta tabla, análoga a TABSIM del algoritmo del ensamblador, se usa par almacenar el nombre y la dirección de los símbolos externos en el conjunto de secciones de control que se está cargando. Otras dos variables importantes son DIRPROG (dirección de carga del programa) y DIRSC (dirección de la sección de control). DIRPROG es la dirección inicial de la memoria donde se va a cargar el programa ligado, DIRSC contiene la dirección inicial asignada a la sección de control que está examinando el cargador. CARACTERISTICAS DEL CARGADOR INDEPENDIENTES DE LA MAQUINA Con frecuencia se piensa que el cargado y el ligado son funciones de servicio del sistema operativo. La 3 conexión del programador con estos servicios no es tan directa como la que tiene con, por ejemplo, el ensamblador durante el desarrollo del programa. Por tanto, la mayoría de los cargadores tienen menos características diferentes que las que se pueden encontrar en un ensamblador típico. Búsqueda Automática en Biblioteca En la mayoría de los casos se emplea una biblioteca estándar del sistema, pero se pueden especificar para el cargador otras bibliotecas, mediante proposiciones de control o parámetros. En algunos sistemas, esta característica se denomina llamada automática a biblioteca o búsqueda en biblioteca. Opciones del Cargador Muchos cargadores tienen un lenguaje especial de mandatos que se utiliza para especificar opciones. En algunos sistemas, las opciones se especifican como parte de un lenguaje de control de trabajos que procesa el sistema operativo. Cuando se usa este enfoque el sistema operativo incorpora las opciones especificadas a un bloque de control que se pone a disposición del cargador cuando se le invoca. Lógicamente, la realización de tales opciones es la misma, con independencia del medio empleado para seleccionarla. Los cargadores a menudo incluyen otras opciones; una es la posibilidad de especificar la localidad donde se inicia la ejecución y otra es la posibilidad de controlar si el cargador debe intentar o no la ejecución del programa si se detectan errores durante la carga. Programas de Superposiciones Este método de implantación reduce la cantidad total de memoria requerida para el ensamblado. En la figura 3.12 (a) se muestra la estructura de superposiciones del programa de ejemplo. Las letras representan nombres de secciones de control y las líneas, transferencias de control entre estas secciones. La estructura de un programa de superposiciones se define al cargador utilizando mandatos; en la figura 3.13 se muestra un conjunto típico de mandatos para definir la estructura de superposiciones mostrada en la figura 3.12 (a). En la estructura 3.14 (a) se muestra la longitud y la dirección real inicial de cada segmento del programa de ejemplo, y la dirección real inicial. En la figura 3.14 (b) se muestran 3 de esas posibilidades; las demás se dejan como ejercicio. En la figura 3.15 (a) se representa el contenido de la memoria en un momento de la ejecución. Los segmentos 1, 2 y 4 están cargados y se están ejecutando las instrucciones de la sección de control A. Los segmentos 2 y 4 se cargaron en respuesta a transferencias de control previas. Las áreas de transferencia de control de los segmentos 2 y 4 contienen a las secciones de control B y H; las otras áreas contienen instrucciones que invocan a MANSUP. Por otra parte, supóngase que A ejecuta una llamada a B. El área de transferencia del segmento 6 contiene instrucciones que invocan a MANSUP, como se ilustra en la figura 3.15 (b). El segmento 4 debe eliminarse debido a que su segmento padre ha sido eliminado. Entonces el control se pasa al punto de entrada del segmento 6, completando la transferencia de control a D. [véase fig. 3.15 (c)]. OPCIONES DE DISEÑO DEL CARGADOR En esta sección se analiza algunas alternativas comunes de organización de las funciones de carga, incluidas la relocación y ligado. Los cargadores ligadores realizan el ligado y la relocación en el momento de la carga. Se analizan dos opciones: los editores de ligado, que realizan el ligado antes del momento de la carga, y el ligado dinámico, en el cuál la función de ligado se realiza en el momento de la ejecución. Editores de Ligado La diferencia fundamental entre un editor de ligado y un cargador ligador se ilustra en la figura 3.16. Primero se ensambla o compila el programa fuente, produciendo un programa objeto (que puede contener varias 4 secciones de control diferentes). Un cargador ligador realiza todas las operaciones de ligado y relocalización, incluyendo búsqueda automática en bibliotecas, si se especifica, y carga el programa de ligado directamente en la memoria para su ejecución. Por otro lado, un editor de ligado produce una versión ligada del programa (llamada a menudo módulo de carga o imagen ejecutable), que se escribe en un archivo o biblioteca para su ejecución posterior. Cuando el usuario está listo para ejecutar el programa ligado, se puede utilizar un cargador relocalizador simple para cargar el programa en la memoria. La única modificación necesaria al código objeto es la suma de una dirección de carga real a los valores relativos del programa. El editor de ligado realiza la relocación de todas las secciones de control relativas al inicio del programa de ligado. Ligado Dinámico En esta sección se analiza un esquema que pospone la función de ligado hasta el momento de la ejecución: una subrutina se carga y liga al resto del programa al llamarla por primera vez. Este tipo de función se suele denominar ligado dinámico, cargado dinámico o carga por llamada. El ligado dinámico proporciona la posibilidad de cargar las rutinas sólo cuando y si se necesitan, también evita la necesidad de cargar la biblioteca completa para cada ejecución. Para realizar la carga y ligado de una subrutina llamada se pueden utilizar varios mecanismos distintos. En lugar de ejecutar una instrucción JSUB que hace referencia a un símbolo externo, el programa hace una solicitud de servicio de carga y llamada al sistema operativo. El parámetro de esta solicitud es el nombre simbólico de la rutina llamada. [Véase fig. 3.17(a)] El sistema operativo examina sus tablas internas para determinar si la rutina ya se ha cargado o no; en caso necesario, la rutina se carga desde la biblioteca de un usuario o desde el sistema especificado, como se ilustra en la figura 3.17(b). Entonces el control pasa del sistema operativo a la rutina llamada [Fig. 3.17(c)]. Cuando se completa el procesamiento de la subrutina llamada, vuelve a quien la llamó. Entones, el sistema operativo devuelve el control al programa que hizo la solicitud; este proceso se ilustra en la fig. 3.17(d). El control puede pasarse del cargador dinámico a la rutina llamada, como en la Fig. 3.17(e). Cargadores de Arranque Si el proceso de carga requiere más instrucciones de las que pueden leerse en un solo registro, el primer registro causa la lectura de otros y estos, a su vez, pueden originar la lectura aún de más registros; de ahí el término arranque (bootstrap). El primer registro suele denominarse cargador de arranque, y se coloca al inicio de todos los programas objeto que se van a cargar en un sistema vacío e inactivo. Esto incluye, por ejemplo, al propio sistema operativo y a todos los programas independientes que se ejecutan sin sistema operativo. EJEMPLOS DE CARGADORES Y LIGADORES REALES Editor de Ligado del Sistema/370 El formato de los programas objeto manejado por el editor de ligado del Sistema/370 es muy parecido al analizado para SIC/XE. El programa de salida del editor de ligado se llama módulo de carga, y puede cargarse en la memoria para su ejecución, y suele contener suficiente información para permitir que el editor de ligado los reprocese. El usuario tiene la posibilidad de especificar que un módulo de carga sea no editable, en cuyo caso puede omitirse gran parte de la información de control, para producir un módulo de carga más pequeño. El editor de ligado 370 puede manejar programas de superposiciones, con diversas características extendidas. En cada segmento puede haber varios puntos de entrada. Para manejar esta característica, el editor de ligado crea automáticamente tablas de entradas en todos los segmentos que contienen una llamada que puede causar 5 superposiciones. El proceso de superposiciones tiene lugar automáticamente al llamar a un segmento. La mayoría de los sistemas 370 disponen de un cargador ligador, así como de un editor de ligado. El cargador ofrece menos opciones y posibilidades que las que presenta el editor de ligado. Si no se necesitan las funciones especializadas del editor de ligado, por razones de eficiencia se recomienda utilizar el cargador. Ligador del Sistema VAX El ligador de VAX es un editor de ligado. La acción del ligador en la creación de las secciones de imagen está controlada por el ensamblador o compilador por medio de una secuencia de mandatos que forman parte del programa objeto. El ligador usa una pila interna como almacenamiento de trabajo. Los mandatos del programa objeto pueden especificar el apilamiento de valores a partir de diversas fuentes, guardar valores de la pila en la imagen que se esta creando y realizar operaciones con valores de la pila. El lenguaje de mandatos ofrece una gran diversidad de posibilidades: hay mas de 50 códigos de mandatos posibles. El ligador de VAX puede generar tres tipos de imágenes. Una imagen ejecutable es aquella adecuada para la carga y ejecución; una imagen compartible no es ejecutable, pero el ligador puede reprocesarla. El tercer tipo de imagen que puede crear el ligador es una imagen de sistema, concebida para ser ejecutada directamente en la maquina VAX, sin los servicios del sistema operativo. El ligador de VAX realiza las funciones usuales de ligado y relocalización. Además, hace parte del trabajo que en otros sistemas realizan el ensamblador o el compilador. El ligador de VAX no utiliza programas de superposiciones, debido en parte a la gran memoria virtual de que disponible VAX. Cargador de CYBER El formato del programa objeto utilizado por el cargador de CYBER es un poco más complejo que el descrito para SIC/XE; sin embargo, dispone de la misma información básica. La técnica de máscara de bits es especialmente útil en CYBER, por no disponer de direccionamiento relativo. Una palabra de CYBER puede contener más de una instrucción, por lo que no es posible usar un solo bit de relocalización por palabra. El cargador de CYBER puede utilizar programas de superposiciones de un tipo más restringido que el descrito. Una estructura de superposiciones está limitada a un máximo de tres niveles. Cada segmento está identificado por un par ordenado de enteros, y un segmento solamente puede tener un punto de entrada. ANEXOS HCOPY 00100000107A T0010001E1410334820390010362810303010154820613C100300102A0C103900102D T00101E150C1036482061081033400000454F46000003000000 6 T0020391E041030001030E0205D30205D30203FD8205D3020575490392C205E38203F T002057 C1010364C0000F1001000041030E02079302064509039DC20792C1036 T002073073820644C000005 E001000 (a) Programa Objeto (b) Programa cargado en memoria comienza lee el registro de encabezamiento verifica el nombre del programa y la longitud lee el primer registro de texto mientras el tipo del registro <> `E' haz comienza {si el código objeto está en forma de caracteres, se convierte en una representación interna} pasa el código objeto a la localidad de memoria especificada lee el siguiente registro del programa objeto termina salta a la dirección especificada en el registro de fin 7 termina 8 9 10 (a) (b) Fig. 3.16 Procesamiento de un programa objeto por medio de (a) cargador ligador y (b) editor de ligado. Carga y ejecución MANEJA−ERROR • (b) FIGURA 3.17.Cargador y llamada de una Subrutina por medio de ligado dinámico. (c) (d) (e) 5 10 0000 0000 COPY FIRST STARD STL 0 RETADR 17202D 11 12 13 15 20 25 30 35 40 45 50 55 60 65 70 80 95 100 105 110 115 120 125 130 132 133 135 140 145 150 155 160 165 170 175 180 185 195 200 205 210 212 215 220 0003 0006 000A 000D 0010 0013 0017 001A 001D 0020 0023 0026 002A 002D 0030 0033 0036 1036 1038 103A 103C 1040 1043 1046 1049 104B 104E 1051 1053 1056 1059 105C 105D 105F 1062 1065 CLOOP ENDFIL EOF RETADR LENGTH BUFFER . . . RDREC RLOOP EXIT INPUT . . . WRREC WLOOP LDB BASE +JSUB LDA COMP JEQ +JSUB J LDA STA LDA STA +JSUB J BYTE RESW RESW RESB # LENGH LENGTH RDREC LENGTH #0 ENDFIL WRREC CLOOP EOF BUFFER #3 LENGTH WRREC @RETADR C'EOF' 1 1 1 4096 69202D CLEAR CLEAR CLEAR +LDT TD JEQ RD COMPR JEQ STCH TIXR JLT STX RSUB BYTE X A S # 4096 INPUT RLOOP INPUT A,S EXIT BUFFER,X T RLOOP LENGTH X'F1' B410 B400 B440 75101000 E32019 332FFA DB2013 A004 332008 57C003 B850 3B2FEA 134000 4F0000 F1 CLEAR LDT TD JEQ X LENGTH OUTPUT WLOOP B410 774000 E32011 332FFA 4B101036 032026 290000 332007 4B10105D 3F2FEC 032010 0F2016 010003 0F200D 4B10105D 3E2003 454F46 12 225 230 235 240 245 250 255 1068 106B 106E 1070 1073 1076 OUTPUT LDCH WD TIXR JLT RSUB BYTE END BUFFER,X OUTPUT T WLOOP X'05' FIRST 53C003 DF2008 B850 3B2FEF 4F0000 05 Figura 3.3 H,COPY ,000000,001077 T,000000,1D,17202D,69202D,4B101036,032026,290000,332007,4B10105D,3F2FEC,032010 T,00001S,13,0F2016,010003,0F200D,4B10105D,3E2003,454F46 T,001036,1D,410,B400,B440,75101000,E32019,332FFA,DB2013,A004,332008,57C003,B850 T,001053,1D,B2FEA,134000,4F0000,F1,B410,774000,E32011,332FFA,53C003,DF2008,B850 T,001070,07,3B2FEF,4F0000,05 M,000007,05+COPY M,000014,05+COPY M,000027,05+COPY E,000000 Figura 3.4 (Programa objeto con relocalización por medio de registros de modificación) CONCLUSIONES Este trabajo nos ayudo a comprender el significado y la importancia de los conceptos de cargadores y ligadores . Hemos visto la necesidad y utilidad de dichos programas y también aprendimos su funcionamiento. BIBLIOGRAFÍA Libro : Software de Sistemas. Autor : Leland L. Beck. Editorial : Addison. Software de Sistemas 20 13 Cargadores y Ligadores Unidad III Figura 3.12 Figura 3.1 Figura 3.13 Figura 3.14 Figura 3.15 Figura 3.15 Biblioteca Cargador ligador Programa(s) objeto Memoria Biblioteca Editor De ligado Programa(s) objeto Programas ligados Cargador Relocalizador Memoria Cargador Dinámico (parte del 14 sistema operativo) Programas de usuario Cargador Dinámico ) Programa de usuario MANEJA− ERROR Biblioteca Cargador Dinámico ) Programas de usuario MANEJA− ERROR Cargador Dinámico ) Programas de usuario MANEJA− ERROR Cargador Dinámico ) Programas de usuario MANEJA− ERROR Figura 3.2 Línea 15 Loc Código Objeto Proposición fuente Subrutina que lee un registro en el Buffer Subrutina que escribe el registro en el Buffer (b) 16