Estructuras de archivos

Anuncio
Facultad de ciencias empresariales
Sede concepcion
Estructuras de archivos
Curso : Estructuras de Datos
CONCEPCIÃ N, MARTES 01 DE JULIO 2008
• ¿Cómo se puede definir a las estructuras de archivos? Desde una perspectiva general sobre las
estructuras de datos y el manejo de archivos, explique: ¿Por qué es necesario el estudiar mecanismos
de estructuras de archivos?
La estructura de archivos el nivel más básico de organización. Es una organización impuesta a un
archivo para facilitar su procesamiento. Es la combinación de representaciones de datos en archivos y al
poseer una estructura de archivos asegura que los usuarios y programas pueden acceder y escribir a los
archivos. Un buen diseño de estructuras de archivos brindará acceso a grandes capacidades de
información, sin gastar tiempo de espera por el disco
El estudio de las estructuras de archivos es necesario ya que la aplicación de las técnicas de estructuras de
datos ayuda a resolver problemas especiales asociados con el almacenamiento y la recuperación de datos en
dispositivos de almacenamiento secundario. El almacenamiento con dispositivos secundario posee ventajas en
comparación con la memoria RAM entre ellas se encuentran:
• El espacio disponible en el almacenamiento secundario es ilimitado.
• El almacenamiento secundario es menos costosa y
• El almacenamiento secundario no es volátil.
Pero su inconveniente de los almacenamientos secundarios es que necesita mucho más tiempo para tener
acceso a los datos que en la RAM. Otro inconveniente es el costo de recuperación varÃ−a de unas partes de
la información a otras; en RAM todos los accesos tienen el mismo costo.
• Desarrolle un estudio actual sobre los dispositivos de almacenamiento secundario existentes en el mercado;
explique los conceptos básicos de su organización (sectores, bloques, pistas, cilindros, etc.), asÃ− como
otras caracterÃ−sticas técnicas de los mismos y precios de referencia (aproximado). Enfoque su
respuesta sobre al menos 5 tipos diferentes de medios de almacenamiento (discos duros, discos ópticos,
pendrive, etc.)
Disco Duro
El disco duro es el dispositivo en el que se almacenan de forma permanente todos los datos, podemos
acceder a una información sin necesidad de pasar por el resto de la información almacenada.
• Estructuras FÃ−sicas
1
Se compone de varios discos situados unos encimas de otros, posee una serie de pistas concéntricas, que su
vez se dividen en sectores, existe otro conceptos en la organización del disco, es el cilindro; que se define
como conjunto de pistas que se encuentra superpuestas.
Tiene varias cabezas de lectura / escritura que se sitúan por encima del disco, moviéndose de forma
radial a través de la superficie del disco.
Un motor que acciona el eje donde se sitúan los discos, les hace girar a alta velocidad.
• CaracterÃ−sticas del Disco Duro
• Capacidad de almacenamiento
En la actualidad los valores más comunes son desde 80 GB a 750 GB.
• Velocidad de rotación
Los discos IDE están en un entorno de 5400 a 7200 RPM los SCSI en 10.000 RPM. Como ejemplo una
velocidad de 5400 RPM permite una trasferencia aproximada entre 10 y 16MB por segundo
• Tiempo de acceso
Es el tiempo medio que tarda la cabeza de lectura / escritura en acceder al dato buscado. Es uno de los
valores más importantes en las caracterÃ−sticas de los discos. Un valor normal puede ser 10 milisegundos.
• Tasa de transferencia
Indica la cantidad de datos que un disco puede leer o escribir en un segundo, la medida se realiza en
MB/seg. Un disco de 5400 RPM suele ser de 10MB/s.
• Interfaz
La conexión de los discos duros es a través de diferentes tipos de interfaz y más comunes son los IDE
y los SCSI, estos a su vez tienen una serie de especificaciones que han ido adaptándose a las nuevas
necesidades de incremento de la capacidad, reducción del tiempo de acceso y aumento de la velocidad de
transferencia. La interfaz IDE tiene como una de sus limitaciones que solo es utilizable en unidades internas y
solo es posible conectar un máximo de 2 dispositivos a cada canal.
Otros interfaces, permiten la conexión externa al ordenador de uno o más dispositivos, hay que tener en
cuenta que el ancho de banda se reparte entre el conjunto de equipos conectados al interface.
• Precio de Referencia
Los precios de estos dependen del tipo de interfaz, capacidad y marca.
♦ Disco Duro Simple TECH 250 GB PEAR EXTERN U $ 59.920
♦ Disco Duro 120 GB $ 59.990
♦ Disco Duro SATA2 320GB $ 39.900
♦ Disco Duro 80GB IDE $ 25.500
♦ Disco Duro Externo 160 GB $ 69.900
2
Discos à pticos
Soportes o medios de almacenamiento que son o pueden ser grabados gracias a un haz de láser. Son discos
ópticos los CDs, DVDs, los Blu-ray, HD-DVD, etc.
• Estructuras FÃ−sicas
Los Discos ópticos poseen cuatros capas. La Superior, es la etiqueta donde se puede escribir. Esta se
encuentra sobre una capa de acrÃ−lico. Más abajo está capa que refleja la luz, que según los diferentes
discos ópticos son de diferentes materiales. Sobre esta capa se guarda toda la información. Por último se
encuentra la capa inferior de policarbonato.
• CaracterÃ−sticas de discos ópticos
• Alta capacidad de almacenamiento, generalmente entre 700 MB y 4,7 GB
• Soportes de grabación (discos) intercambiables con alta densidad de almacenamiento de la
información
• Alta seguridad en la conversación de datos: la capa que los almacenan está protegida entre dos
capas transparentes de policarbonato, inmunizando a los discos contra campos magnéticos caseros
y la corrosión ambiental.
• Velocidad de escritura y lectura de 5 a 10 veces menor que los disquetes magnéticos.
• Perdida de la información prácticamente nula y no se necesitan altos requerimientos de limpieza de
sus superficies externas.
• Permanencia de la información superior a los diez años.
• Precio de referencia
• Disco óptico Sony EDM 2300b $ 3.000
• CDV MASTER G 52X CAKE 10 $ 1.180
• CDV REG. HP 12X CAKE 10 $ 3.590
• DVD SONY-R 16X 4.7 CAKE 10 $ 1.900
3
Pendrives
Pequeño dispositivo para el almacenamiento de información digital que utiliza generalmente memorias
flash. Algunos modelos utilizan microdrives para el almacenamiento. Son muy útiles para el transporte
personal de datos, desplazando en esa área a los CDs, DVDs o disquetes.
• Estructuras FÃ−sicas
Similar a un marcador fluorescente con un conector USB en la punta. Tiene un capuchón para proteger el
conector, que muchas veces tiene incorporado una pestaña simulando un bolÃ−grafo, para colgarlo del
bolsillo, o una anilla para llevar de llavero.
• CaracterÃ−sticas de Pendrives
• Tamaño diminuto, de bolsillo
• Es ideal para transportar información de manera segura y cómoda.
• Son resistentes a los rasguños (externos) y al polvo que han afectado a las formas previas de
almacenamiento portátil, como los CD y los disquetes.
• Un pendrive es un dispositivo de memoria muy rápido y mucho más fiable que los disquetes
• Las memorias actuales cumplen la especificación USB 2.0, lo que les permite alcanzar velocidades
de escritura/lectura de hasta 480 Mbit/s teóricos
•
Precio de referencia
4
• Pendrive 512 Mb Lexar SECURE $ 5.990
• Pendrive Kingston DTI-1 $ 6.990
• Pendrive Sony USM1 $ 7.990
• Pendrive Sony USM2GB $ 13.990
• Pendrive Sandisk SDCZ6-4096 Cruzer 4GB $ 18.990
Unidades de cintas
Tipo de soporte de almacenamiento de información que permite grabar datos en pistas sobre una banda de
material magnético. Puede grabarse cualquier tipo de información de forma digital o analógica. Los
antiguos sistemas utilizaban cintas tipo riel abierto, en cambio los nuevos suelen usar cartuchos tipo casetes.
• Estructuras FÃ−sicas
Consisten en un soporte flexible sobre el que se deposita una pequeña pelÃ−cula de material magnetizable
(como óxido de hierro o algún cromato). Durante los procesos de lectura y escritura, esta banda de material
magnetizable debe moverse delante de la cabeza de lectura-escritura, que es la responsable de traducir las
señales magnéticas en eléctricas o a la inversa.
• CaracterÃ−sticas de unidades de cintas
♦ Las cintas magnéticas son muy utilizadas para realizar backups de datos, especialmente en
empresas.
♦ La densidad en las cintas magnéticas es medida en BPI (bits por pulgada), que pueden ir
desde los 800 bpi hasta los 6250 bpi. A mayor densidad en la cinta, más datos se guardan
por pulgada.
♦ Son medios removibles, fiables y económicos con capacidades de almacenamiento elevadas.
♦ Bajo costo y facilidad de manejo
• Precio de Referencia
• DAT Unidad de Respaldo DAT160 (80-160Gb) $ 366.400
• Unidad de Cinta Quantum SDLT-600 $ 1.915.900
Memoria Flash o Tarjeta de Memoria
5
Tipo de memoria no volátil que suele ser usadas en celulares, cámaras digitales, PDAs, reproductores
portátiles, discos rÃ−gidos (disco rÃ−gido hÃ−brido), etc. Pueden borrarse y reescribirse. Las tarjetas de
memoria permiten un medio de almacenamiento pequeño, rápido y resistente.
• Estructuras FÃ−sicas
Está constituido por chips en estado sólido sin partes móviles, con una enorme cantidad de “Celdas”, cada
una almacena un bits (un uno o un cero). Cada una de estas celdas soporta un número limitado de lecturas y
escrituras: 2.000, 3.000, etc. Ahora bien, estas memorias están diseñadas para minimizar al mÃ−nimo la
cantidad de veces que se utiliza cada celda y posee propiedad de conservar los datos cuando se les quita la
fuente de alimentación, ósea cuando se apaga el dispositivo que la usa.
• CaracterÃ−sticas de Memoria Flash
• Es pequeños y prácticos, tiene una resistencia a daños muy buena y compatibilidad con equipos
portátiles
• El costo de las memorias flash es muy bajo
• Programables y borrables eléctricamente
• Son memorias más rápidas.
• Son de carácter no volátil, esto es, la información que almacena no se pierde en cuanto se
desconecta de la corriente.
• Precios de Referencia
♦ Memory stick PRO DUO 2GB $ 24.900
♦ Sandisk Memory Stick Micro M2 1GB $ 12.900
♦ SONY MSX-M1GB Memory Stick 1GB $ 12.990
♦ MEMORY STICK MSH-M128A $ 14.990
♦
LEXAR SD 4GB $ 17.990
Â
• ¿Qué es un archivo? ¿Qué es un registro fÃ−sico? ¿En qué se diferencia de un registro
lógico? ¿Cuáles pueden ser las estructuras internas de un registro, campos y llaves?
¿Cuáles son las operaciones básicas posibles sobre registros?
Los archivos es una colección de información (datos relacionados entre sÃ−), localizada o almacenada
como una unidad en alguna parte de la computadora. Los archivos son el conjunto organizado de
informaciones del mismo tipo, que pueden utilizarse en un mismo tratamiento; como soporte material de estas
informaciones.
El registro fÃ−sico es la cantidad de información que el sistema operativo puede enviar o recibir del soporte
de memoria secundaria en una operación de escritura o lectura. Esta cantidad depende del hardware.
6
La diferencia entre un registro lógico y uno fÃ−sico es que un registro lógico es el contiene la
información con la que trabaja la aplicación y un registro fÃ−sico es el que se graba en el dispositivo de
almacenamiento.
Campo : es la unidad de información lógicamente significativa más pequeñas en un archivo. Cuando la
información se encuentra en categorÃ−a, se transcribe como una secuencia de bytes no diferenciables, se
pierde el rastro de los campos que le dan significado a la información. Es necesario organizar el archivo de
manera que la información se mantenga dividida en campos.
Registro : Conjunto de campos agrupados bajo la perspectiva de un archivo de nivel más alto de
organización en un archivo.
Llave : Expresión derivada de uno o más campos dentro de un registro, que puede usarse para ubicar ese
registro. A los campos usados para construir una llave se les denomina campos de llave. El acceso por llave
proporciona una forma de recuperar información que se basa en el contenido de los registros, y no en su
posición.
Operaciones básicas sobre registros
• Eliminación de Registros
Los registros eliminados se incluirán por ejemplo en una lista de tal forma que siempre tendremos almacenar
la dirección del último registro eliminado. Al eliminar un registro se marca como borrado con una marca
especial en el primer campo y luego se escribirá en este campo la posición del que era último registro
borrado hasta ese momento.
• Inserción de registros
Al insertar un nuevo registro habrá que comprobar si tenemos algún espacio. Comprobaremos si hay
registros eliminados. Si los hay, usaremos el espacio e insertaremos el nuevo registro en esa posición.
• Explique en qué consiste la organización secuencial de archivos, señalando sus caracterÃ−sticas
generales y la forma de manipulación de la operación de inserción de nuevos registros. Mencione dos
casos en que sea recomendable esta búsqueda. Mencione y explique las caracterÃ−sticas de la operación
de inserción de registros sobre un archivo ordenado.
La organización secuencial de archivos es un conjunto de registros lógicamente relacionados cuya
secuencia de acceso está determinada por su ordenamiento. El acceso a los registros también debe
hacerse en orden, de modo que para acceder al registro N es necesario pasar primero por el registro 1, luego
por el 2, luego por el 3, y asÃ− hasta llegar al registro N.
CaracterÃ−sticas
• En la mayorÃ−a de los casos, los registros de un archivo secuencial quedan ordenados de acuerdo con
el valor de algún campo de cada registro (clave). Se dice que el archivo está ordenado y puede ser
ascendente o descendente.
• Los registros de un archivo no necesariamente deben tener el mismo formato, ni tampoco el mismo
tamaño, pero siempre es necesario indicar el tipo de registro que se está accediendo.
Los registros se graban consecutivamente cuando el archivo se crea y se debe acceder cuando se leen
registros.
7
El orden fÃ−sico en que fueron grabados (escritos) los registros es el orden de lectura de los mismos.
Los archivos organizados secuencialmente contienen un registro particular, el último, que contiene una
marca fin de archivo (EOF o bien FF). Esta marca fin de archivo suele ser un carácter especial como '*'.
Casos recomendables
• GuÃ−as telefónicas
• Aplicaciones de proceso de lotes
• Computación batch (lote): Carga manual de los programas en la memoria desde interruptores, cinta
de papel, tarjetas perforadas, etc.….
• Cuando se manejan datos que se procesan cÃ−clica y periódicamente.
Los archivos secuenciales poseen un indicador de posición (o cursor) que señala qué registro fue el
último que se accedió. Al abrir el archivo, el indicador se sitúa en el primer campo del primer registro.
Cada acceso sobre el archivo desplazará el indicador de posición hacia el siguiente registro, hasta que ya no
haya más registros que leer.
Cuando un archivo secuencial se abre para escribir datos en él, el indicador de posición se sitúa justo
después del último byte del mismo, de manera que los datos sólo se pueden añadir al final.
• ¿Qué es un mecanismo de Ã−ndices para el acceso de información en archivo? Desde una perspectiva
general sobre las estructuras de datos y el manejo de archivos, explique ¿Por qué cree que sean
necesarios los mecanismos de Ã−ndices? Mencione ventajas y desventajas de utilizar Ã−ndices para
acceder a la información almacenada en archivos.
Un Ã−ndice es una herramienta para encontrar registros en un archivo. Consiste en un campo de llave
mediante el cual se busca el Ã−ndice y un campo de referencia que indica donde encontrar el registro del
archivo de datos asociado con una llave en particular
Los mecanismos de Ã−ndices no solo mejoran el tiempo de acceso a un archivo, también son necesarios
para proporcionan nuevas posibilidades que son inconcebibles con los métodos de acceso basados en
registros de datos clasificados.
Ventajas
• Permite procesar el archivo secuencialmente por orden lógico y también procesarlo al azar
• Es conveniente para archivos con mediana volatilidad, actividad variable y tamaño relativamente
estable.
• Rápido acceso
• El sistema de gestión de archivos se encarga de relacionar la posición de cada registro con su
contenido mediante la tabla de Ã−ndices.
Desventajas
• Los à ndices requieren espacio extra, se necesita una doble búsqueda; una en el Ã−ndice y otra en
el archivo.
• Los registros deben ser de longitud fija.
8
• El archivo debe estar separado por un dispositivo de acceso aleatorio; no se puede utilizar en cintas
magnéticas.
• El archivo demuestra menos localidad, o sea es menor la probabilidad de que las listas de registros
asociados estén fÃ−sicamente adyacentes
BibliografÃ−a
Fecha de acceso: jueves 26 de junio 2008
• Página web
http://www.hostear.com/google/enciclopedia-virtual-informatica/formato-de-archivos.php
http://www.tu-chemnitz.de/docs/lindocs/RH9/RH-DOCS/rhl-rg-es-9/ch-filesystem.html
http://ict.udlap.mx/people/carlos/is215/ir01.html
http://www.monografias.com/trabajos7/arch/arch.shtml
http://www2.canalaudiovisual.com/ezine/books/acjirINFORMATICA/2info09.htm
Fecha de acceso: viernes 27 de junio 2008
• Página web
http://www.scribd.com/doc/164789/Discos-Opticos-V-3
http://www.monografias.com/trabajos7/diop/diop.shtml?monosearch
http://html.rincondelvago.com/montaje-de-un-ordenador_1.html
http://es.wikipedia.org/wiki/Pendrives
http://www.alegsa.com.ar/Dic/memoria%20usb.php
http://www.alegsa.com.ar/Dic/cinta%20magnetica.php
http://es.wikipedia.org/wiki/Cinta_magn%C3%A9tica_de_almacenamiento_de_datos
Fecha de acceso: sábado 28 de junio 2008
• Página web
http://www.domestika.org/foros/viewtopic.php?t=68679&sid=738986cd22abf65a96507387f8c3a330
http://www.mitecnologico.com/Main/EstructuraDeArchivosDirectos
Fecha de acceso: domingo 29 de junio 2008
• Página web
9
http://www.udgvirtual.udg.mx/biblioteca/bitstream/123456789/1726/1/Conceptos_fundamentales_de_estructuras_de_a
http://html.rincondelvago.com/almacenamiento-de-datos.html
http://www.alegsa.com.ar/Dic/memoria%20flash.php
http://sistemas.itlp.edu.mx/tutoriales/admonarch/tema1_5.htm
http://www.cafeonline.com.mx/computadores/portatil/memoria-flash.html
http://torio.unileon.es/~dierar/ti/pdf/memorias.PDF
http://es.wikipedia.org/wiki/Memoria_flash
http://profeblog.es/blog/alfredo/2008/05/15/ficheros-registros-fisicos-y-registros-logicos/
http://www.monografias.com/trabajos47/preguntas-archivos/preguntas-archivos.shtml
http://64.233.169.104/search?q=cache:Bai2s4i3ZssJ:www.xuletas.es/ficha/23954+definicion+registro+f%C3%ADsico
http://boards4.melodysoft.com/app?ID=200402ADA0205&msg=12&DOC=21
http://www.ual.es/~bailon/oga/p1/OGAguionPR1.pdf
Fecha de acceso: lunes 30 de junio 2008
• Página web
http://www.geocities.com/SiliconValley/Hills/5821/ITH/sem5/arch_sec.html
http://alfa.facyt.uc.edu.ve/computacion/pensum/cs0347/clases/ArchivosSecuencial-clases.pdf
http://profeblog.es/blog/alfredo/2008/05/16/161/
Fecha de acceso: martes 01 de julio 2008
• Página web
http://www.slideshare.net/luismy_martinez/archivo-secuencialindexado/
• Libro
Folk, Michael J. “Estructuras de archivos: un conjunto de herramientas conceptuales”
10
Descargar