Tecnologías de la Información Almacenamiento de Información Almacenamiento de Información. CPU Memoria Central BUS Controlador de Discos Dispositivos E/S Tarjeta de Red Red Tecnologías de la Información Almacenamiento de Información Almacenamiento de Información. Entendemos como Almacenamiento o memorias secundarias o memoria externa a todos los componentes usados por el ordenador que almacenan grandes cantidades de información de forma permanente. Su tecnología y funcionamiento es completamente distinto al de la Memoria Principal. Principales Características : • Gran capacidad de almacenamiento. • No son volátiles, la información perdura sin suministro eléctrico. • Tienen menor velocidad de transferencia que las memorias internas. • Su relación precio / Mbyte es menor que en las memorias internas. Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Componentes. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Componentes. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. A fin de identificar la situación exacta de cada dato, el disco está subdividido en una serie de áreas, que facilitan la localización del dato concreto. Plato: cada uno de los discos que hay dentro del disco duro. Cara: cada uno de los dos lados de un plato. Cabeza: número de cabezales. Usualmente, uno por cara. Pistas: una circunferencia dentro de una cara. La pista 0 está en el borde exterior. Cilindro: conjunto de varias pistas. Son todas las circunferencias que están alineadas verticalmente (una de cada cara). Sector: cada una de las divisiones de una pista. El tamaño del sector no es fijo, siendo el estándar actual 512 bytes, aunque próximamente serán 4 KB. El primer sistema de direccionamiento que se usó fue el CHS (cilindro‐cabeza‐sector), ya que con estos tres valores se puede situar un dato cualquiera del disco. Más adelante se creó otro sistema más sencillo: LBA (direccionamiento lógico de bloques), que consiste en dividir el disco entero en sectores y asignar a cada uno un único número. Éste es el que se usa actualmente. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Características. Capacidad: Cantidad de información que es capaz de almacenar (GB o TB). Velocidad de rotación: Revoluciones por minuto de los platos. A mayor velocidad de rotación, menor latencia media (máxima actual 15.000rpm). Tiempo medio de acceso: Tiempo medio que tarda la aguja en situarse en la pista y el sector deseado; es la suma de : Tiempo medio de búsqueda (situarse en la pista) Latencia media (situarse en el sector) Tiempo de lectura/escritura Velocidad de transferencia : Velocidad a la que puede transferir la información a la memoria una vez la aguja está situada en la pista y sector correctos. Puede ser velocidad sostenida o de pico. Caché de pista: Es una memoria tipo Flash dentro del disco duro, donde se almacenan los datos de forma temporal. Interfaz: Medio de comunicación entre el disco duro y el ordenador. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Interfaces. • IDE (Integrated Drive Electronics) : También conocido como ATA (Advanced Technology Attachment), hasta el año 2004 fue el principal estándar utilizado. • SCSI: Son interfaces preparadas para discos duros de gran capacidad de almacenamiento y elevada velocidad de rotación. Un controlador SCSI puede manejar hasta 7 discos duros o periféricos . Su tiempo medio de acceso puede llegar a 7 milisegundos . Se presentan bajo tres especificaciones: • SCSI Estándar (Standard SCSI). Hasta 5Mb/s de velocidad de transmisión. • SCSI Rápido (Fast SCSI). Hasta 5Mb/s de velocidad de transmisión. • SCSI Ancho‐Rápido (Fast‐Wide SCSI). Hasta 20Mb/s de velocidad de transmisión. • SATA (Serial ATA): El más novedoso de los estándares de conexión, utiliza un bus serie para la transmisión de datos. Notablemente más rápido y eficiente que IDE. Existen tres versiones, SATA 1 con velocidad de transferencia de hasta 150 MB/s, SATA 2 de hasta 300 MB/s, el más extendido en la actualidad, y por último SATA 3 de hasta 600 MB/s Físicamente es mucho más pequeño y cómodo que los IDE. • SAS (Serial Attached SCSI): Interfaz de transferencia de datos en serie, sucesor del SCSI paralelo, aunque sigue utilizando comandos SCSI para interaccionar con los dispositivos SAS. • USB (Universal Serial Bus): Su éxito ha llegado también a los discos duros. En este caso, sólo una selecta minoría implementan directamente la interfaz USB como conexión nativa, siendo los discos externos mayoritariamente IDE o Serial ATA con un adaptador en su interior. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Interfaces. IDE SATA SCSI SAS Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. Direccionamiento. Para poder direccionar ya acceder a la información contenida en un disco, este se divide en pequeños bloques llamados Sectores de normalmente 512 (ó 1.024 bytes). Cylinder‐head‐sector o CHS (en español "cilindro‐cabezal‐sector") es un modo antiguo de acceso para discos duros menores de 8 gigabytes. CHS asigna una dirección a cada bloque mediante una tupla que define el cilindro, el cabezal y el sector en que se encuentra. Este sistema no funciona bien en dispositivos que no son discos duros, como las cintas de datos. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. Direccionamiento. Logical block addressing (LBA: direccionamiento de bloque lógico) es un método muy común usado para especificar la localización de los bloques de datos en los sistemas de almacenamiento, principalmente secundario, de un ordenador. LBA es un método de direccionamiento particularmente simple. Los bloques son numerados según un índice, siendo el primer bloque LBA 0, el segundo LBA 1, y así sucesivamente. Su limite es 8 ZB. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. A fin de que el ordenador pueda utilizar el disco duro, este debe estar debidamente particionado y formateado, lo que le permitirá albergar un sistema de archivos que será determinado por el propio sistema operativo. • El sector de arranque (master boot record). Un registro de arranque principal, conocido también como registro de arranque maestro o por su nombre en inglés master boot record (abreviado MBR) es el primer sector (“sector cero”) de un disco duro. A veces, se emplea para el arranque del sistema operativo, otras veces es usado para almacenar una tabla de particiones y, en ocasiones, se usa sólo para identificar un dispositivo de disco individual. • Particiones. Una partición de un disco duro es una división lógica en una unidad de almacenamiento, en la cual se alojan y organizan los archivos mediante un sistema de archivos. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. MBR. Un registro de arranque principal, (master boot record o MBR) es el primer sector ("sector cero") de un dispositivo de almacenamiento de datos, como un disco duro. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. GUID. Tabla de partición GUID (GPT) es un estándar para la colocación de la tabla de particiones en un disco duro físico. Es parte del estándar Extensible Firmware Interface (EFI) propuesto por Intel para reemplazar el viejo BIOS del PC, heredada del IBM PC original. La GPT sustituye al Master Boot Record (MBR) usado con el BIOS. GPT usa el modo de direccionamiento lógico (LBA) en lugar del modelo cilindro‐cabeza‐sector (CHS) usado con el MBR. La información de MBR heredado está almacenada en el LBA 0, la cabecera GPT está en el LBA 1, y la tabla de particiones en sí en los bloques sucesivos. En los sistemas operativos Windows de 64‐bits, 16.384 bytes, o lo que es lo mismo, 32 sectores, están reservados para la GPT, dejando el bloque LBA 34 como el primer sector usable del disco. GPT proporciona asimismo redundancia. La cabecera GPT y la tabla de particiones están escritas tanto al principio como al final del disco. Tecnologías de la Información Almacenamiento de Información Discos Rígidos. Estructura Lógica. Particiones. • Partición primaria: Son las divisiones crudas o primarias del disco, solo puede haber 4 ó 3 primarias y 1 ó 0 extendida. A este tipo de particiones, prácticamente cualquier sistema operativo puede detectarlas y asignarles una unidad, siempre y cuando el sistema operativo reconozca su formato (sistema de archivos). • Partición extendida: También conocida como partición secundaria es otro tipo de partición que actúa como una partición primaria. Permite contener múltiples unidades lógicas en su interior. Fue ideada para romper la limitación de 4 particiones primarias en un solo disco físico. • Partición lógica: Ocupa una porción de la partición extendida o la totalidad de la misma, la cual se ha formateado con un tipo específico de sistema de archivos (FAT32, NTFS, ext2,...) y se le ha asignado una unidad, así el sistema operativo reconoce las particiones lógicas o su sistema de archivos. Puede haber un máximo de 23 particiones lógicas en una partición extendida. Linux impone un máximo de 15, incluyendo las 4 primarias. Tecnologías de la Información Almacenamiento de Información Discos Básicos y Dinámicos. Los discos básicos y los discos dinámicos son dos tipos de configuraciones de disco duro en Windows. La mayoría de los equipos personales están configurados como discos básicos, que son los más sencillos de administrar. Los usuarios avanzados y profesionales informáticos pueden emplear discos dinámicos, que usan varios discos duros de un equipo para administrar datos, normalmente para obtener un mayor rendimiento o confiabilidad. Un disco básico usa particiones primarias, particiones extendidas y unidades lógicas para organizar datos. Los discos dinámicos pueden contener un gran número de volúmenes dinámicos (aproximadamente 2000), que funcionan como las particiones primarias usadas en discos básicos. En algunas versiones de Windows, es posible combinar discos duros dinámicos independientes en un único volumen dinámico (lo que recibe el nombre de expansión), dividir datos entre varios discos duros (lo que recibe el nombre de sección) para obtener un mayor rendimiento o duplicar datos entre varios discos duros (lo que recibe el nombre de reflejo) para obtener una mayor confiabilidad. Tecnologías de la Información Almacenamiento de Información Practica. The Myth Of The Supersonic Disk Drive Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Cintas Magnéticas. Las cintas magnéticas de almacenamiento de datos han sido usadas para el almacenamiento de datos durante los últimos 50 años. En este tiempo se han hecho varios avances en la composición de la cinta, la envoltura, y la densidad de los datos. La principal diferencia entre el almacenamiento en cintas y en discos es que la cinta es un medio de acceso secuencial, mientras que el disco en un medio de acceso aleatorio. Tecnologías de la Información Almacenamiento de Información Cintas Magnéticas. Dispositivos • Utilizan las mismas interfaces que los discos magnéticos • Elevada velocidad de lectura/escritura (secuencial) • Se complementan con librerías para automatizar el proceso Soportes • Gestión de soportes (Inventario, Ambiente, Acceso) • Fiabilidad y durabilidad Tecnologías de la Información Almacenamiento de Información Cintas Magnéticas. Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Memorias USB. Una memoria USB (de Universal Serial Bus) es un dispositivo de almacenamiento que utiliza una memoria tipo flash (derivada de la memoria EEPROM) para guardar información. Se le conoce también, entre otros nombres, como lápiz de memoria, memoria externa o lápiz USB. Estas memorias se han convertido en el sistema de almacenamiento y transporte personal de datos más utilizado, desplazando en este uso a los tradicionales disquetes y a los CD. Se pueden encontrar en el mercado fácilmente memorias de 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 GB, y hasta 1 TB.[2] Los sistemas operativos actuales pueden leer y escribir en las memorias sin más que enchufarlas a un conector USB del equipo encendido, recibiendo la tensión de alimentación a través del propio conector, de 5 voltios y un consumo de 2,5 vatios como máximo. Tecnologías de la Información Almacenamiento de Información SSD. SSD (Solid state drive) : Los discos sólidos son memorias externas para almacenamiento de datos que usan bien una memoria no volátil, como la memoria flash, o bien una memoria volátil como la SDRAM, para almacenar datos, en lugar de los platos giratorios magnéticos encontrados en los discos duros convencionales. Los SSD hacen uso de la misma interfaz que los discos duros y, por lo tanto, son fácilmente intercambiables Tecnologías de la Información Almacenamiento de Información SSD. Aunque en la actualidad la relación entre prestaciones y precio sigue siendo favorable a los discos duros magnéticos, es razonable pensar que en el futuro serán reemplazados por los dispositivos SSD, al menos por tres razones, que son las siguientes: • El primero es la fiabilidad. Al no tener partes móviles, se pueden usar en entornos con movimiento, y además tienen mucha más tolerancia a los golpes y vibraciones. • También por su falta de piezas móviles, el consumo energético de estos discos es bastante inferior. Ideales para dispositivos móviles. • El tercer motivo es la velocidad. Estos discos son mucho más rápidos que los convencionales y además estos últimos no podrán acercarse nunca a las velocidades de los SSD. Tecnologías de la Información Almacenamiento de Información SSD vs HDD. Consumo Energía Precio Capacidad Arranque del Sistema Ruido Vibración SSD (Solid State Drive) HDD (Hard Disk Drive) 2‐5 w 6‐15 w $1/GB (disco de 240GB) $0,075/GB (disco 4TB) < 512GB 512GB‐4TB ± 22 segundos ± 40 segundos Sin ruido No Practica. Audible Si Ratio de Fallo (MTBF) 2MM horas 0,3MM horas Temperatura de Operación ‐25ºC a 85ºC 5ºC a 55ºC 0,1 ms 5,5 – 8,0 ms 200MB/s – 500MB/s 50MB/s – 120MB/s Tiempo de Acceso Velocidad de Escritura Tecnologías de la Información Almacenamiento de Información Practica. Supongamos que trabajamos para el Canal de Isabel II. El Canal quiere digitalizar los últimos 10 años de facturas a sus clientes para reducir su archivo en papel y facilitar el acceso a las facturas. ¿Cuánto espacio en disco necesita?, ¿Cómo puede organizar ese almacenamiento? El Canal tiene aproximadamente 1.200.000 contratos y factura a cada abonado una vez cada 2 meses. Cada factura escaneada ocupa 300KB. Tecnologías de la Información Almacenamiento de Información RAID En 1987, David Patterson, Garth Gibson y Randy Kartz publicaron un artículo de investigación titulado “Un caso sobre matrices redundantes de discos económicos” (RAID o A Case for Redundant Arrays of Inexpensive Disks), que sentó las bases de los sistemas RAID tal y como los conocemos hoy en día. RAID o Redundant Array of Independent Disks, traducido como «conjunto redundante de discos independientes», hace referencia a un sistema de almacenamiento de datos que usa múltiples unidades de almacenamiento (discos duros o SSD) entre los que se distribuyen o replican los datos. La mayor aportación de RAID es la habilidad de combinar varios dispositivos de bajo coste y/o tecnología más antigua en un conjunto que ofrece mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto. Tecnologías de la Información Almacenamiento de Información RAID Disco “virtual” de 600GB Ejemplo : RAID Discos físicos “reales” de 120GB Tecnologías de la Información Almacenamiento de Información RAID En la actualidad, la tecnología RAID se ha desarrollado enormemente y, dependiendo de su configuración o nivel, los beneficios de un RAID respecto de una sola memoria secundaria son uno o varios de los siguientes: • Mayor tolerancia a fallos. • Mayor rendimiento (throughput) • Mayor capacidad de almacenamiento • Mayor integridad Existen diversas configuraciones RAID estandarizadas y cada una proporciona un equilibrio diferente entre rendimiento, la capacidad y la tolerancia. Tecnologías de la Información Almacenamiento de Información RAID 0 RAID Nivel 0 (Striping): Striped Disk Array. Matriz de discos seccionados. La información se reparte entre todos los discos del sistema. La capacidad de los discos físicos se suma. Ofrece división de datos (distribuye bloques de cada archivo entre varias unidades de disco) pero sin redundancia. Esto mejora el rendimiento (las lecturas/escrituras pueden ser simultaneas en todos los discos), pero no proporciona tolerancia de fallos. Si una unidad falla, entonces todos los datos de la matriz se pierde. Tecnologías de la Información Almacenamiento de Información RAID 1 RAID Nivel 1 (Mirroring): En esta configuración, los discos se agrupan de dos en dos, de forma que se trabaja con uno de ellos y el otro es su copia exacta o espejo. El sistema resiste al fallo de una de los discos. Su principal inconveniente es que puede suponer un gasto de espacio significativo. Tecnologías de la Información Almacenamiento de Información RAID 2 Nivel 2: Error correcting coding. Codificación de corrección de errores. No es una implementación típica y se utiliza raramente, RAID 2 distribuye los datos a nivel de bits y no a nivel de bloque. RAID 3 Nivel 3: Bit‐Interleaved Parity. Paridad delegada en bit. En desuso, trabaja con grupos de bytes repartidos por todos los volúmenes, usando un disco para control de errores, conocido como disco de paridad dedicado. Tecnologías de la Información Almacenamiento de Información RAID 4 Nivel 4: Dedicated Parity Drive. Unidad de paridad dedicada. Una aplicación común de RAID, nivel 4 ofrece a nivel de bloque striping (una única banda de discos, como Nivel 0) con un disco de paridad, para controlar errores, de tal manera que si un disco de datos falla, los datos del disco de paridad se utilizarán para crear un disco de reemplazo. Una desventaja en el nivel 4 es que el disco de paridad puede crear cuellos de botella de escritura. Cálculo de paridad Muchos niveles de RAID, emplean un sistema para detectar errores, llamado “paridad”, un método comúnmente usado en tecnologías de la información para proporcionar tolerancia a errores en un conjunto de datos. Tecnologías de la Información Almacenamiento de Información RAID 5 Nivel 5: Block Interleaved Distributed Parity. Seccionado tolerante a fallos con paridad. En este nivel se usa la división en bloques de datos a nivel de byte pero no se usa un volumen exclusivo para el control de error, lo que da como resultado un rendimiento excelente y buena tolerancia a fallos. Nivel 5 es una de las implementaciones más populares de RAID. Necesita al menos 3 discos para ser implementado. Resiste el fallo de un disco del grupo. Tecnologías de la Información Almacenamiento de Información RAID 6 Nivel 6: Independent Data Disks with Double Parity. Discos de datos independientes con doble paridad. RAID 6 es similar a RAID 5 (paridad de stripe o sección) salvo que en lugar de un bloque de paridad por banda hay dos. Con dos bloques de paridad independientes, RAID 6 puede sobrevivir a la pérdida de dos discos en el grupo. Tecnologías de la Información Almacenamiento de Información RAID 0+1 Nivel 0+1: A Mirror of Stripes. Un Espejo en secciones. Formaría lo que puede denominarse espejo de divisiones. Si en RAID 0 tenemos varios discos y la información se reparte entre ellos sin control de errores, y RAID 1 contiene pares de discos de forma que el secundario es el espejo del primario, si tomo como elemento base RAID 0 y éste está compuesto por dos discos físicos, el RAID 0+1 lo compondrán 4 discos de forma que los dos primeros tienen la información y los dos últimos serán el espejo. Tecnologías de la Información Almacenamiento de Información RAID 10 (1+0) Nivel 10 (1+0): División de espejos. En este caso, el elemento base será RAID 1, de forma que tendremos pares de disco como componente de RAID 0, lo que nos brinda una división de espejos, de ahí su nombre. Tecnologías de la Información Almacenamiento de Información RAID 100 (10+0) RAID 100. Un RAID 100, a veces llamado también RAID 10+0, es una división de conjuntos RAID 10. El RAID 100 es un ejemplo de «RAID cuadriculado», es decir, un RAID en el que conjuntos divididos son a su vez divididos conjuntamente de nuevo. Implementar niveles RAID anidados permite eliminar virtualmente el límite de unidades físicas en un único volumen lógico. Tecnologías de la Información Almacenamiento de Información Comparación niveles RAID Nivel RAID Mínimo número discos Eficiencia Espacio Tolerancia a Fallos Rendimiento Lectura Rendimiento Escritura RAID 0 2 100% No (0) n*Rto n*Rto RAID 1 2 < 50% Si (n‐1) n*Rto 1*Rto RAID 4 3 (100‐100/n)% Si (1) (n‐1)*Rto Practica. RAID 5 3 (100‐100/n)% Si (1) n*Rto (n‐1)*Rto RAID 6 4 (100‐2*(100/n))% Si (2) (n‐1)*Rto (n‐2)*Rto n : numero de discos que forman el grupo RAID Rto : rendimiento individual de cada disco 1*Rto Tecnologías de la Información Almacenamiento de Información Máxima capacidad por disco sencillo en el tiempo (Source: IDC Study# 228266) Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información Practica. ¿Cómo puedo acceder al Administrador de Disco en Windows? Inicio Equipo (botón derecho) Administrar Almacenamiento Administración de Discos Tecnologías de la Información Almacenamiento de Información Tecnologías de la Información Almacenamiento de Información