Archivo informático Un archivo informático es un conjunto de información que se almacena en una computadora y puede ser identificado por su ruta completa. Los archivos informáticos se llaman así porque son los equivalentes informáticos de los archivos en tarjetas, papel o microfichas del entorno de oficina tradicional. Los archivos informáticos facilitan una manera de organizar los recursos usados para almacenar permanentemente información dentro de una computadora. Es una colección de registros lógicamente relacionados, un registro es una estructura de campos o elementos de información lógicamente relacionados. Cada campo puede ser un item elemental o item de grupo (conjunto de item elementales). Los registros de un archivo se agrupan y almacenan juntos para algún propósito común, con una finalidad. Son ejemplo de archivos de información: de inventarios, de clientes, de proveedores, recolección de datos científicos para experimentos científicos y otros. Ventajas del almacenamiento de información en archivos Los datos se almacenan independientemente de la ejecución que luego se realizará con procesos con programas particulares. El archivo proporciona un medio de almacenamiento secundario permanente La información almacenada en archivos magnéticos luego pueden ser guardadas en espacios físicos para recuperación de la información en forma parcial o total, requeridos por programadores o usuarios que lo demanden. En un archivo de puede almacenar grandes volúmenes de información que no podrían almacenarse en la memoria principal. Contenido de los archivos En lo que concierne al sistema operativo, un archivo es, en la mayoría de los casos, simplemente un flujo unidimensional de bytes (números enteros en el intervalo de 0 a 255), que es tratado por el sistema operativo como una única unidad lógica. Un archivo de datos informático normalmente tiene un tamaño, que generalmente se expresa en bytes; en todos los sistemas operativos modernos, el tamaño puede ser cualquier número entero no negativo de bytes hasta un máximo dependiente del sistema. Depende del software que se ejecuta en la computadora el interpretar esta simplísima estructura básica como por ejemplo un programa, un texto o una imagen, basándose en su nombre y contenido. Los tipos especiales de archivos, como los nodos de dispositivo que representan simbólicamente partes del hardware, no consisten en un flujo de bytes y no tienen tamaño de archivo. La información de un archivo informático normalmente consiste de paquetes más pequeños de información (a menudo llamados registros o líneas) que son individualmente diferentes pero que comparten algún rasgo en común. Por ejemplo, un archivo de nóminas puede contener información sobre todos los empleados de una empresa y los detalles de su nómina; cada registro del archivo de nóminas se refiere únicamente a un empleado, y todos los registros tienen la característica común de estar 1 relacionados con las nóminas-esto es muy similar a colocar toda la información sobre nóminas en un archivador concreto en una oficina que no tenga ninguna computadora. Un archivo de texto puede contener líneas de texto, correspondientes a líneas impresas en una hoja de papel. La manera en que se agrupa la información en un archivo depende completamente de la persona que diseñe el archivo. Esto ha conducido a una idea de estructuras de archivo más o menos estandarizadas para todos los propósitos imaginables, desde los más simples a los más complejos. La mayoría de los archivos informáticos son usados por programas de computadora. Estos programas crean, modifican y borran archivos para su propio uso bajo demanda. Los programadores que crean los programas deciden que archivos necesitan, como se van a usar y (a menudo) sus nombres. En algunos casos, los programas de computadora manipulan los archivos que se hacen visibles al usuario de la computadora. Por ejemplo, en un programa de procesamiento de texto, el usuario manipula archivos documento a los que él mismo da nombre. El contenido del archivo documento está organizado de una manera que el programa de procesamiento de texto entiende, pero el usuario elige el nombre y la ubicación del archivo, y proporciona la información (como palabras y texto) que se almacenará en el archivo. Los archivos de una computadora se pueden crear, mover, modificar, aumentar, reducir y borrar. En la mayoría de los casos, los programas de computadora que se ejecutan en la computadora se encargan de estas operaciones, pero el usuario de una computadora también puede manipular los archivos si es necesario. Por ejemplo, los archivos de Microsoft Office Word son normalmente creados y modificados por el programa Microsoft Word en respuesta a las órdenes del usuario, pero el usuario también puede mover, renombrar o borrar estos archivos directamente usando un programa gestor de archivos como Windows Explorer. Identificación y organización de archivos 2 Los archivos y carpetas se organizan jerárquicamente En los sistemas informáticos modernos, los archivos siempre tienen nombres. Los archivos se ubican en directorios. El nombre de un archivo debe ser único en ese directorio. En otras palabras, no puede haber dos archivos con el mismo nombre en el mismo directorio. El nombre de un archivo y la ruta al directorio del archivo lo identifica de manera exacta entre todos los demás archivos del sistema informático-no puede haber dos archivos con el mismo nombre y ruta. El aspecto del nombre depende del tipo de sistema informático que se use. Las primeras computadoras sólo permitían unas pocas letras o dígitos en el nombre de un archivo, pero las computadoras modernas permiten nombres largos que contengan casi cualquier combinación de letras unicode y dígitos unicode , haciendo más fácil entender el propósito de un archivo de un vistazo. Algunos sistemas informáticos permiten nombres de archivo que contengan espacios; otros no. La distinción entre mayúsculas y minúsculas en los nombres de archivo está determinada por el sistemas de archivos. Los sistemas de archivos Unix distinguen normalmente entre mayúsculas y minúsculas, y permiten a las aplicaciones a nivel de usuario crear archivos cuyos nombres difieran solamente en si los caracteres están en mayúsculas o minúsculas. Microsoft Windows reconoce varios sistemas de archivos, cada uno con diferentes políticas en cuanto a la distinción entre mayúsculas y minúsculas. El popular antiguo sistema de archivos FAT puede tener varios archivos cuyos nombres difieran únicamente en las mayúsculas y minúsculas si el usuario utiliza un editor de discos para editar los nombres de archivo en las entradas de directorio. Las aplicaciones de usuario, sin embargo, normalmente no permitirán al usuario crear varios archivos con el mismo nombre pero con diferentes letras en mayúsculas y minúsculas. La mayoría de las computadoras organizan los archivos en jerarquías llamadas carpetas, directorios o catálogos. (El concepto es el mismo independientemente de la terminología usada.) Cada carpeta puede contener un número arbitrario de archivos, y también puede contener otras carpetas. Las otras carpetas pueden contener todavía más archivos y carpetas, y así sucesivamente, construyéndose un estructura en árbol en la que una «carpeta raíz» (el nombre varía de una computadora a otra) puede contener cualquier número de niveles de otras carpetas y archivos. A las carpetas se les puede dar nombre exactamente igual que a los archivos (excepto para la carpeta raíz, que a menudo no tiene nombre). El uso de carpetas hace más fácil organizar los archivos de una manera lógica. Cuando una computadora permite el uso de carpetas, cada archivo y carpeta no sólo tiene un nombre propio, sino también una ruta, que identifica la carpeta o carpetas en las que reside un archivo o carpeta. En la ruta, se emplea algún tipo de carácter especial -como un barra- para separar los nombres de los archivos y carpetas. Por ejemplo, en la ilustración mostrada en este artículo, la ruta /Payroll/Salaries/Managers identifica unívocamente un archivo llamado Managers que está en una carpeta llamada Salaries que a su vez está contenida en una carpeta llamada Payroll. En este ejemplo, los nombres de las carpetas y archivos están separados por barras; la superior o carpeta raíz no tiene nombre, y por ello la ruta comienza con una barra (si la carpeta raíz tuviera nombre, precedería a esta primera barra). 3 Muchos (pero no todos) sistemas informáticos usan extensiones en los nombres de archivo para ayudar a identificar que contienen. En computadoras Windows, las extensiones consisten de un punto al final del nombre del archivo, seguido de unas pocas letras para identificar el tipo de archivo. Una extensión .txt identifica un archivo de texto; la extensión .doc identifica cualquier tipo de documento o documentación, comúnmente en el formato de archivo de Microsoft Office Word; etc. Incluso cuando se utilizan extensiones en un sistema informático, el grado con el que un sistema informático los reconoce y trata puede variar; en algunos sistemas, son obligatorios, mientras que en otros sistemas, se ignoran completamente si están presentes. Clasificación de los archivos según la función que desempeñan ARCHIVO MAESTRO: Un archivo maestro es un conjunto de registros que se refieren a algún aspecto importante de las actividades de una organización, representa una visión estática de un momento de vida organizacional de una empresa, como por ejemplo el archivo de VENDEDORES, CLIENTES, archivo maestro de EMPLEADOS. Dependiendo de la cantidad de transacciones, cambios en los datos de los archivos maestros, el archivo maestro proporciona una imagen confiable en un momento determinado, sobre algunos aspectos de la vida de la empresa en el mundo real. El diccionario de palabras es un ejemplo de un archivo maestro, contiene la descripción de los datos, más que los datos mismos. ARCHIVO DE TRANSACCIONES: Un archivo de transacciones es un archivo temporal que persigue básicamente dos propósitos; uno es el de acumular datos de eventos en el momento que ocurran, y el segundo propósito es el de actualizar los archivos maestros para reflejar los resultados de las transacciones actuales. ARCHIVOS DE REPORTE: Los archivos de reporte contienen datos de los archivos maestros y de transacciones, para permitir el análisis del desempeño de la organización, almacenan datos resultados de procesos. ARCHIVOS DE TRABAJO: Los archivos de trabajo contienen datos de los archivos maestros y de transacciones, transitoriamente, es un espacio físico no permanente de apoyo auxiliar a los procesos informáticos para generar reportes o cambios en la estructuración de un archivo, organización o reorganización. ARCHIVOS DE PROGRAMA: Los archivos de programa contienen instrucciones, órdenes en un lenguaje de programación que serán ejecutadas para procesar datos almacenados en estructuras de datos. ARCHIVOS DE TEXTO: almacenan textos procesados por un procesador de textos o Base de datos documentales. Clasificación de los archivos según el modo de acceso a los archivos Es la manera que se usa para acceder a los registros almacenados en un archivo. Un programa solo lee un archivo declarado de entrada. Un programa solo escribe un archivo de salida de datos o registraciones. Un archivo de entrada salida de datos permite ser leído o escrito, admite modificaciones, según el contenido de los datos. Organización de archivos Es la técnica utilizada para representar y almacenar registros físicamente en un espacio de almacenamiento virtual. Organización secuencial: determina la secuenciación de registros en un archivo, los registros están dispuestos uno a continuación del otro en el orden en que fueron ingresados al espacio designado. 4 Organización relativa: cada registro ocupa un espacio físico según el valor del campo clave, único, generalmente el valor del campo clave indica la posición física que ocupa, en orden el registro en el archivo. Existen técnicas de reubicación de registros para compartir espacios no asignados a registros consecutivos en el almacenamiento. La organización más apropiada para un archivo en particular está determinada por las características operacionales, del medio de almacenamiento utilizado y por la naturaleza de las operaciones a ejecutar sobre los datos. El medio de almacenamiento elegido determina la velocidad de acceso a los datos en función de las operaciones y de la cantidad de transacciones que se realizarán con los registros. Los discos magnéticos almacenan archivos de acceso directo permitiendo esto un tiempo de acceso a cada registro directo, rápido. Los medios de almacenamientos en cintas son de acceso secuencial, lento. En términos físicos, la mayoría de los archivos informáticos se almacenan en discos duros -discos magnéticos que giran dentro de una computadora que pueden registrar información indefinidamente. Los discos duros permiten acceso casi instantáneo a los archivos informáticos. En computadoras muy grandes, algunos archivos informáticos pueden almacenarse en cinta magnética. Los archivos también se pueden almacenar en otros medios en algunos casos, como discos compactos grabables, unidades Zip, memorias transportables USB, etc. Operaciones sobre archivos: Las operaciones básicas que se ejecutan sobre los registros de archivos son: Creación: es la operación inicial, es la carga de los registros en el archivo. Es tarea tediosa la creación de archivos maestros y de transacciones, incluye la captura y validación de los datos. Algunas implementaciones primero asignan el espacio físico para el archivo y luego los datos son cargados en el espacio asignado, en ese esqueleto de archivo. Otros permiten la construcción del archivo, registro por registro. Esta operación se puede realizar en procesos por lotes o en procesos iteractivos, en línea. Cargar un archivo maestro iteractivamente puede demandar mucho trabajo y tiempo si el volumen de datos es muy grande. El modo de utilización y la naturaleza de las operaciones que se realizan con los datos guardados en archivos determinan el tipo de procesamiento que se realizará. Un archivo puede accederse por un programa en modo batch, (por lotes) fuera de los procesos de actualización en línea, o por programas que se ejecutan iteractivamente en línea. Actualización: son los cambios que se procesan en un archivo maestro para mejorar la eficiencia y validez de los datos almacenados. Los cambios pueden ser: adición de nuevos registros no existentes en el archivo, la modificación de datos de registros que ya están cargados en el archivo y la supresión o eliminación de registros (borrar). 5 La mayoría de los espacios de almacenamiento virtual permiten realizar los cambios en el mismo sitio, producir el cambio y regrabar en el registro a modificar, también en estos medios de guardado, se permite en los espacios libres reubicables agregar registros que no estaban. de esta manera se reutiliza el espacio asignado a registros que fueron eliminados. Para que se puedan realizar estas operaciones el archivo tiene que ser abierto como de entrada / salida de datos. En los medios de almacenamiento serial (cintas) que el acceso es secuencial para producir cambios en los registros, no se los puede actualizar en el mismo lugar, en este caso el programa utiliza al archivo maestro como Entrada, y genera un nuevo archivo de salida, con los datos del primero pero actualizados. Recuperación de información: Es el proceso por el cual se obtiene información significativa de un archivo. Existen dos: consulta y generación de reportes. La consulta produce un volumen de información mínimo, generalmente los procesos de consultas muestran los resultados en el monitor. Es un proceso, programa iteractivo. La generación de un reporte produce un informe, con un volumen de información que contiene varias páginas, generalmente se realizan diseños de impresión con determinados formatos y se utiliza el uso del dispositivo de salida, la impresora. Generalmente es un proceso en lotes. La mayoría de los sistemas de información requieren de ambas clases de recuperación de información. Esta recuperación puede ser comprensiva o selectiva. La primera Mantenimiento de un archivo: Protección de archivos Muchos sistemas informáticos modernos proporcionan métodos para proteger los archivos frente a daños accidentales o intencionados. Las computadoras que permiten varios usuarios implementan permisos sobre archivos para controlar quien puede o no modificar, borrar o crear archivos y carpetas. A un usuario dado se le puede conceder solamente permiso para modificar un archivo o carpeta, pero no para borrarlo; o a un usuario se le puede conceder permiso para crear archivos o carpetas, pero no para borrarlos. Los permisos también se pueden usar para permitir que solamente ciertos usuarios vean el contenido de un archivo o carpeta. Los permisos protegen de la manipulación no autorizada o destrucción de la información de los archivos, y mantienen la información privada confidencial impidiendo que los usuarios no autorizados vean ciertos archivos. Otro mecanismo de protección implementado en muchas computadoras es una marca de sólo lectura. Cuando esta marca está activada en un archivo (lo que puede ser realizado por un programa de computadora o por un usuario humano), el archivo puede ser examinado, pero no puede ser modificado. Esta marca es útil para información crítica que no debe ser modificada o borrada, como archivos especiales que son usados solamente por partes internas del sistema informático. Algunos sistemas incluyen también una marca oculta para hacer que ciertos archivos sean invisibles; esta marca la 6 usa el sistema informático para ocultar archivos de sistema esenciales que los usuarios nunca deben modificar. Respaldo de archivos Cuando los archivos informáticos contienen información que es extremadamente importante, se usa un proceso de respaldo (back-up) para protegerse contra desastres que podrían destruir los archivos. Hacer copias de respaldo de archivos significa simplemente hacer copias de los archivos en una ubicación separada de modo que se puedan restaurar si le pasara algo a la computadora, o si fueran borrados accidentalmente. Hay muchas maneras de hacer copias de respaldo de archivos. La mayoría de los sistemas informáticos proporcionan utilidades para ayudar en el proceso de respaldo, que puede llegar a consumir mucho tiempo si hay muchos archivos a salvaguardar. Copiar los archivos a otro disco duro en la misma computadora protege contra el fallo de un disco, pero si es necesario protegerse contra el fallo o destrucción de la computadora entera, entonces de deben hacer copias de los archivos en otro medio que puede sacarse de la computadora y almacenarse en un ubicación distante y segura. Sistemas de archivos y gestores de archivos La manera en que una computadora organiza, da nombre, almacena y manipula los archivos se denomina globalmente como su sistema de archivos. Todas las computadoras tienen al menos un sistema de archivos; algunas computadoras permiten usar varios sistemas de archivos diferentes. Por ejemplo, en las computadoras Windows más recientes, se reconocen los antiguos sistemas de archivos FAT y FAT32 de las versiones antiguas de Windows, además del sistema de archivos NTFS que es el sistema de archivos normal en las versiones recientes de Windows. NTFS no es más moderno que FAT32; ha existido desde que Windows NT se publicó en 1993. Cada sistema de archivos tiene sus propias ventajas y desventajas. La FAT estándar solamente permite nombres de archivo de ocho bytes (o ocho caracteres de solo 1 byte) (más una extensión de tres bytes/caracteres) sin espacios, por ejemplo, mientras que NTFS permite nombres mucho más largos que pueden contener espacios, y tener varias letres unicode. Puede llamar a un archivo Registros de nóminas en NTFS, mientras que en FAT estaría limitado a algo como nominas.dat (salvo que estuviera usando VFAT, una extensión de FAT que permite nombres de archivo largos). Los programas gestores de archivos son utilidades que le permiten manipular archivos directamente. Le permiten mover, crear, borrar y renombrar archivos y carpetas, aunque no le permiten realmente leer el contenido de un archivo o almacenar información en él. Cada sistema informático proporciona al menos un programa gestor de archivos para su sistema de archivos nativo. En Windows, el gestor de archivos usado más comúnmente es Windows Explorer. 7