Archivo informático

Anuncio
Archivo informático
Un archivo informático es un conjunto de información que se almacena en una
computadora y puede ser identificado por su ruta completa. Los archivos informáticos
se llaman así porque son los equivalentes informáticos de los archivos en tarjetas, papel
o microfichas del entorno de oficina tradicional. Los archivos informáticos facilitan una
manera de organizar los recursos usados para almacenar permanentemente información
dentro de una computadora.
Es una colección de registros lógicamente relacionados, un registro es una
estructura de campos o elementos de información lógicamente relacionados.
Cada campo puede ser un item elemental o item de grupo (conjunto de item
elementales). Los registros de un archivo se agrupan y almacenan juntos para algún
propósito común, con una finalidad. Son ejemplo de archivos de información: de
inventarios, de clientes, de proveedores, recolección de datos científicos para
experimentos científicos y otros.
Ventajas del almacenamiento de información en archivos
 Los datos se almacenan independientemente de la ejecución que luego se realizará
con procesos con programas particulares.
 El archivo proporciona un medio de almacenamiento secundario permanente
 La información almacenada en archivos magnéticos luego pueden ser guardadas en
espacios físicos para recuperación de la información en forma parcial o total,
requeridos por programadores o usuarios que lo demanden.
 En un archivo de puede almacenar grandes volúmenes de información que no
podrían almacenarse en la memoria principal.
Contenido de los archivos
En lo que concierne al sistema operativo, un archivo es, en la mayoría de los
casos, simplemente un flujo unidimensional de bytes (números enteros en el intervalo
de 0 a 255), que es tratado por el sistema operativo como una única unidad lógica. Un
archivo de datos informático normalmente tiene un tamaño, que generalmente se
expresa en bytes; en todos los sistemas operativos modernos, el tamaño puede ser
cualquier número entero no negativo de bytes hasta un máximo dependiente del sistema.
Depende del software que se ejecuta en la computadora el interpretar esta simplísima
estructura básica como por ejemplo un programa, un texto o una imagen, basándose en
su nombre y contenido. Los tipos especiales de archivos, como los nodos de dispositivo
que representan simbólicamente partes del hardware, no consisten en un flujo de bytes y
no tienen tamaño de archivo.
La información de un archivo informático normalmente consiste de paquetes
más pequeños de información (a menudo llamados registros o líneas) que son
individualmente diferentes pero que comparten algún rasgo en común. Por ejemplo, un
archivo de nóminas puede contener información sobre todos los empleados de una
empresa y los detalles de su nómina; cada registro del archivo de nóminas se refiere
únicamente a un empleado, y todos los registros tienen la característica común de estar
1
relacionados con las nóminas-esto es muy similar a colocar toda la información sobre
nóminas en un archivador concreto en una oficina que no tenga ninguna computadora.
Un archivo de texto puede contener líneas de texto, correspondientes a líneas impresas
en una hoja de papel.
La manera en que se agrupa la información en un archivo depende
completamente de la persona que diseñe el archivo. Esto ha conducido a una idea de
estructuras de archivo más o menos estandarizadas para todos los propósitos
imaginables, desde los más simples a los más complejos. La mayoría de los archivos
informáticos son usados por programas de computadora. Estos programas crean,
modifican y borran archivos para su propio uso bajo demanda. Los programadores que
crean los programas deciden que archivos necesitan, como se van a usar y (a menudo)
sus nombres.
En algunos casos, los programas de computadora manipulan los archivos que se
hacen visibles al usuario de la computadora. Por ejemplo, en un programa de
procesamiento de texto, el usuario manipula archivos documento a los que él mismo da
nombre. El contenido del archivo documento está organizado de una manera que el
programa de procesamiento de texto entiende, pero el usuario elige el nombre y la
ubicación del archivo, y proporciona la información (como palabras y texto) que se
almacenará en el archivo.
Los archivos de una computadora se pueden crear, mover, modificar, aumentar,
reducir y borrar. En la mayoría de los casos, los programas de computadora que se
ejecutan en la computadora se encargan de estas operaciones, pero el usuario de una
computadora también puede manipular los archivos si es necesario. Por ejemplo, los
archivos de Microsoft Office Word son normalmente creados y modificados por el
programa Microsoft Word en respuesta a las órdenes del usuario, pero el usuario
también puede mover, renombrar o borrar estos archivos directamente usando un
programa gestor de archivos como Windows Explorer.
Identificación y organización de archivos
2
Los archivos y carpetas se organizan jerárquicamente
En los sistemas informáticos modernos, los archivos siempre tienen nombres.
Los archivos se ubican en directorios. El nombre de un archivo debe ser único en ese
directorio. En otras palabras, no puede haber dos archivos con el mismo nombre en el
mismo directorio.
El nombre de un archivo y la ruta al directorio del archivo lo identifica de
manera exacta entre todos los demás archivos del sistema informático-no puede haber
dos archivos con el mismo nombre y ruta. El aspecto del nombre depende del tipo de
sistema informático que se use. Las primeras computadoras sólo permitían unas pocas
letras o dígitos en el nombre de un archivo, pero las computadoras modernas permiten
nombres largos que contengan casi cualquier combinación de letras unicode y dígitos
unicode , haciendo más fácil entender el propósito de un archivo de un vistazo. Algunos
sistemas informáticos permiten nombres de archivo que contengan espacios; otros no.
La distinción entre mayúsculas y minúsculas en los nombres de archivo está
determinada por el sistemas de archivos. Los sistemas de archivos Unix distinguen
normalmente entre mayúsculas y minúsculas, y permiten a las aplicaciones a nivel de
usuario crear archivos cuyos nombres difieran solamente en si los caracteres están en
mayúsculas o minúsculas. Microsoft Windows reconoce varios sistemas de archivos,
cada uno con diferentes políticas en cuanto a la distinción entre mayúsculas y
minúsculas. El popular antiguo sistema de archivos FAT puede tener varios archivos
cuyos nombres difieran únicamente en las mayúsculas y minúsculas si el usuario utiliza
un editor de discos para editar los nombres de archivo en las entradas de directorio. Las
aplicaciones de usuario, sin embargo, normalmente no permitirán al usuario crear varios
archivos con el mismo nombre pero con diferentes letras en mayúsculas y minúsculas.
La mayoría de las computadoras organizan los archivos en jerarquías llamadas
carpetas, directorios o catálogos. (El concepto es el mismo independientemente de la
terminología usada.) Cada carpeta puede contener un número arbitrario de archivos, y
también puede contener otras carpetas. Las otras carpetas pueden contener todavía más
archivos y carpetas, y así sucesivamente, construyéndose un estructura en árbol en la
que una «carpeta raíz» (el nombre varía de una computadora a otra) puede contener
cualquier número de niveles de otras carpetas y archivos. A las carpetas se les puede dar
nombre exactamente igual que a los archivos (excepto para la carpeta raíz, que a
menudo no tiene nombre). El uso de carpetas hace más fácil organizar los archivos de
una manera lógica.
Cuando una computadora permite el uso de carpetas, cada archivo y carpeta no
sólo tiene un nombre propio, sino también una ruta, que identifica la carpeta o carpetas
en las que reside un archivo o carpeta. En la ruta, se emplea algún tipo de carácter
especial -como un barra- para separar los nombres de los archivos y carpetas. Por
ejemplo, en la ilustración mostrada en este artículo, la ruta /Payroll/Salaries/Managers
identifica unívocamente un archivo llamado Managers que está en una carpeta llamada
Salaries que a su vez está contenida en una carpeta llamada Payroll. En este ejemplo,
los nombres de las carpetas y archivos están separados por barras; la superior o carpeta
raíz no tiene nombre, y por ello la ruta comienza con una barra (si la carpeta raíz tuviera
nombre, precedería a esta primera barra).
3
Muchos (pero no todos) sistemas informáticos usan extensiones en los nombres
de archivo para ayudar a identificar que contienen. En computadoras Windows, las
extensiones consisten de un punto al final del nombre del archivo, seguido de unas
pocas letras para identificar el tipo de archivo. Una extensión .txt identifica un archivo
de texto; la extensión .doc identifica cualquier tipo de documento o documentación,
comúnmente en el formato de archivo de Microsoft Office Word; etc. Incluso cuando se
utilizan extensiones en un sistema informático, el grado con el que un sistema
informático los reconoce y trata puede variar; en algunos sistemas, son obligatorios,
mientras que en otros sistemas, se ignoran completamente si están presentes.
Clasificación de los archivos según la función que desempeñan
ARCHIVO MAESTRO: Un archivo maestro es un conjunto de registros que se refieren a algún
aspecto importante de las actividades de una organización, representa una visión estática de un
momento de vida organizacional de una empresa, como por ejemplo el archivo de VENDEDORES,
CLIENTES, archivo maestro de EMPLEADOS.
Dependiendo de la cantidad de transacciones, cambios en los datos de los archivos maestros, el
archivo maestro proporciona una imagen confiable en un momento determinado, sobre algunos
aspectos de la vida de la empresa en el mundo real. El diccionario de palabras es un ejemplo de
un archivo maestro, contiene la descripción de los datos, más que los datos mismos.
ARCHIVO DE TRANSACCIONES: Un archivo de transacciones es un archivo temporal que
persigue básicamente dos propósitos; uno es el de acumular datos de eventos en el momento que
ocurran, y el segundo propósito es el de actualizar los archivos maestros para reflejar los
resultados de las transacciones actuales.
ARCHIVOS DE REPORTE: Los archivos de reporte contienen datos de los archivos maestros y de
transacciones, para permitir el análisis del desempeño de la organización, almacenan datos
resultados de procesos.
ARCHIVOS DE TRABAJO: Los archivos de trabajo contienen datos de los archivos maestros y de
transacciones, transitoriamente, es un espacio físico no permanente de apoyo auxiliar a los
procesos informáticos para generar reportes o cambios en la estructuración de un archivo,
organización o reorganización.
ARCHIVOS DE PROGRAMA: Los archivos de programa contienen instrucciones, órdenes en un
lenguaje de programación que serán ejecutadas para procesar datos almacenados en estructuras
de datos.
ARCHIVOS DE TEXTO: almacenan textos procesados por un procesador de textos o Base de
datos documentales.
Clasificación de los archivos según el modo de acceso a los archivos
Es la manera que se usa para acceder a los registros almacenados en un archivo.
Un programa solo lee un archivo declarado de entrada. Un programa solo escribe un
archivo de salida de datos o registraciones. Un archivo de entrada salida de datos
permite ser leído o escrito, admite modificaciones, según el contenido de los datos.
Organización de archivos
Es la técnica utilizada para representar y almacenar registros físicamente en un
espacio de almacenamiento virtual.
Organización secuencial: determina la secuenciación de registros en un archivo, los
registros están dispuestos uno a continuación del otro en el orden en que fueron
ingresados al espacio designado.
4
Organización relativa: cada registro ocupa un espacio físico según el valor del campo
clave, único, generalmente el valor del campo clave indica la posición física que ocupa,
en orden el registro en el archivo. Existen técnicas de reubicación de registros para
compartir espacios no asignados a registros consecutivos en el almacenamiento.
La organización más apropiada para un archivo en particular está determinada
por las características operacionales, del medio de almacenamiento utilizado y por la
naturaleza de las operaciones a ejecutar sobre los datos.
El medio de almacenamiento elegido determina la velocidad de acceso a los
datos en función de las operaciones y de la cantidad de transacciones que se realizarán
con los registros. Los discos magnéticos almacenan archivos de acceso directo
permitiendo esto un tiempo de acceso a cada registro directo, rápido. Los medios de
almacenamientos en cintas son de acceso secuencial, lento.
En términos físicos, la mayoría de los archivos informáticos se almacenan en
discos duros -discos magnéticos que giran dentro de una computadora que pueden
registrar información indefinidamente. Los discos duros permiten acceso casi
instantáneo a los archivos informáticos.
En computadoras muy grandes, algunos archivos informáticos pueden
almacenarse en cinta magnética. Los archivos también se pueden almacenar en otros
medios en algunos casos, como discos compactos grabables, unidades Zip, memorias
transportables USB, etc.
Operaciones sobre archivos:
Las operaciones básicas que se ejecutan sobre los registros de archivos son:
Creación: es la operación inicial, es la carga de los registros en el archivo. Es tarea
tediosa la creación de archivos maestros y de transacciones, incluye la captura y
validación de los datos. Algunas implementaciones primero asignan el espacio físico
para el archivo y luego los datos son cargados en el espacio asignado, en ese esqueleto
de archivo. Otros permiten la construcción del archivo, registro por registro. Esta
operación se puede realizar en procesos por lotes o en procesos iteractivos, en línea.
Cargar un archivo maestro iteractivamente puede demandar mucho trabajo y
tiempo si el volumen de datos es muy grande.
El modo de utilización y la naturaleza de las operaciones que se realizan con los
datos guardados en archivos determinan el tipo de procesamiento que se realizará.
Un archivo puede accederse por un programa en modo batch, (por lotes) fuera de
los procesos de actualización en línea, o por programas que se ejecutan iteractivamente
en línea.
Actualización: son los cambios que se procesan en un archivo maestro para mejorar la
eficiencia y validez de los datos almacenados. Los cambios pueden ser: adición de
nuevos registros no existentes en el archivo, la modificación de datos de registros que
ya están cargados en el archivo y la supresión o eliminación de registros (borrar).
5
La mayoría de los espacios de almacenamiento virtual permiten realizar los
cambios en el mismo sitio, producir el cambio y regrabar en el registro a modificar,
también en estos medios de guardado, se permite en los espacios libres reubicables
agregar registros que no estaban. de esta manera se reutiliza el espacio asignado a
registros que fueron eliminados. Para que se puedan realizar estas operaciones el
archivo tiene que ser abierto como de entrada / salida de datos.
En los medios de almacenamiento serial (cintas) que el acceso es secuencial para
producir cambios en los registros, no se los puede actualizar en el mismo lugar, en este
caso el programa utiliza al archivo maestro como Entrada, y genera un nuevo archivo de
salida, con los datos del primero pero actualizados.
Recuperación de información: Es el proceso por el cual se obtiene información
significativa de un archivo. Existen dos: consulta y generación de reportes.
La consulta produce un volumen de información mínimo, generalmente los procesos de
consultas muestran los resultados en el monitor. Es un proceso, programa iteractivo.
La generación de un reporte produce un informe, con un volumen de información que
contiene varias páginas, generalmente se realizan diseños de impresión con
determinados formatos y se utiliza el uso del dispositivo de salida, la impresora.
Generalmente es un proceso en lotes.
La mayoría de los sistemas de información requieren de ambas clases de recuperación
de información. Esta recuperación puede ser comprensiva o selectiva. La primera
Mantenimiento de un archivo:
Protección de archivos
Muchos sistemas informáticos modernos proporcionan métodos para proteger
los archivos frente a daños accidentales o intencionados. Las computadoras que
permiten varios usuarios implementan permisos sobre archivos para controlar quien
puede o no modificar, borrar o crear archivos y carpetas. A un usuario dado se le puede
conceder solamente permiso para modificar un archivo o carpeta, pero no para borrarlo;
o a un usuario se le puede conceder permiso para crear archivos o carpetas, pero no para
borrarlos. Los permisos también se pueden usar para permitir que solamente ciertos
usuarios vean el contenido de un archivo o carpeta. Los permisos protegen de la
manipulación no autorizada o destrucción de la información de los archivos, y
mantienen la información privada confidencial impidiendo que los usuarios no
autorizados vean ciertos archivos.
Otro mecanismo de protección implementado en muchas computadoras es una
marca de sólo lectura. Cuando esta marca está activada en un archivo (lo que puede ser
realizado por un programa de computadora o por un usuario humano), el archivo puede
ser examinado, pero no puede ser modificado. Esta marca es útil para información
crítica que no debe ser modificada o borrada, como archivos especiales que son usados
solamente por partes internas del sistema informático. Algunos sistemas incluyen
también una marca oculta para hacer que ciertos archivos sean invisibles; esta marca la
6
usa el sistema informático para ocultar archivos de sistema esenciales que los usuarios
nunca deben modificar.
Respaldo de archivos
Cuando los archivos informáticos contienen información que es extremadamente
importante, se usa un proceso de respaldo (back-up) para protegerse contra desastres
que podrían destruir los archivos. Hacer copias de respaldo de archivos significa
simplemente hacer copias de los archivos en una ubicación separada de modo que se
puedan restaurar si le pasara algo a la computadora, o si fueran borrados
accidentalmente.
Hay muchas maneras de hacer copias de respaldo de archivos. La mayoría de los
sistemas informáticos proporcionan utilidades para ayudar en el proceso de respaldo,
que puede llegar a consumir mucho tiempo si hay muchos archivos a salvaguardar.
Copiar los archivos a otro disco duro en la misma computadora protege contra el fallo
de un disco, pero si es necesario protegerse contra el fallo o destrucción de la
computadora entera, entonces de deben hacer copias de los archivos en otro medio que
puede sacarse de la computadora y almacenarse en un ubicación distante y segura.
Sistemas de archivos y gestores de archivos
La manera en que una computadora organiza, da nombre, almacena y manipula
los archivos se denomina globalmente como su sistema de archivos. Todas las
computadoras tienen al menos un sistema de archivos; algunas computadoras permiten
usar varios sistemas de archivos diferentes. Por ejemplo, en las computadoras Windows
más recientes, se reconocen los antiguos sistemas de archivos FAT y FAT32 de las
versiones antiguas de Windows, además del sistema de archivos NTFS que es el sistema
de archivos normal en las versiones recientes de Windows. NTFS no es más moderno
que FAT32; ha existido desde que Windows NT se publicó en 1993.
Cada sistema de archivos tiene sus propias ventajas y desventajas. La FAT
estándar solamente permite nombres de archivo de ocho bytes (o ocho caracteres de
solo 1 byte) (más una extensión de tres bytes/caracteres) sin espacios, por ejemplo,
mientras que NTFS permite nombres mucho más largos que pueden contener espacios,
y tener varias letres unicode. Puede llamar a un archivo Registros de nóminas en
NTFS, mientras que en FAT estaría limitado a algo como nominas.dat (salvo que
estuviera usando VFAT, una extensión de FAT que permite nombres de archivo largos).
Los programas gestores de archivos son utilidades que le permiten manipular
archivos directamente. Le permiten mover, crear, borrar y renombrar archivos y
carpetas, aunque no le permiten realmente leer el contenido de un archivo o almacenar
información en él. Cada sistema informático proporciona al menos un programa gestor
de archivos para su sistema de archivos nativo. En Windows, el gestor de archivos
usado más comúnmente es Windows Explorer.
7
Descargar