01 08 Almacenamiento de Información

Anuncio
Tecnologías de la Información
Almacenamiento de Información
Almacenamiento de Información.
CPU
Memoria
Central
BUS
Controlador de Discos
Dispositivos E/S
Tarjeta de Red
Red
Tecnologías de la Información
Almacenamiento de Información
Almacenamiento de Información.
Entendemos como Almacenamiento o memorias secundarias o memoria
externa a todos los componentes usados por el ordenador que almacenan
grandes cantidades de información de forma permanente.
Su tecnología y funcionamiento es completamente distinto al
de la Memoria Principal.
Principales Características :
• Gran capacidad de almacenamiento.
• No son volátiles, la información perdura sin suministro eléctrico.
• Tienen menor velocidad de transferencia que las memorias internas.
• Su relación precio / Mbyte es menor que en las memorias internas.
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Componentes.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Componentes.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos.
A fin de identificar la situación exacta de cada dato, el
disco está subdividido en una serie de áreas, que facilitan
la localización del dato concreto.
Plato: cada uno de los discos que hay dentro del disco
duro.
Cara: cada uno de los dos lados de un plato.
Cabeza: número de cabezales. Usualmente, uno por
cara.
Pistas: una circunferencia dentro de una cara. La pista 0
está en el borde exterior.
Cilindro: conjunto de varias pistas. Son todas las
circunferencias que están alineadas verticalmente (una
de cada cara).
Sector: cada una de las divisiones de una pista. El
tamaño del sector no es fijo, siendo el estándar actual
512 bytes, aunque próximamente serán 4 KB.
El primer sistema de direccionamiento que se usó fue el CHS (cilindro‐cabeza‐sector), ya que con estos tres
valores se puede situar un dato cualquiera del disco. Más adelante se creó otro sistema más sencillo: LBA
(direccionamiento lógico de bloques), que consiste en dividir el disco entero en sectores y asignar a cada uno un
único número. Éste es el que se usa actualmente.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Características.
Capacidad: Cantidad de información que es capaz de almacenar (GB o TB).
Velocidad de rotación: Revoluciones por minuto de los platos. A mayor velocidad
de rotación, menor latencia media (máxima actual 15.000rpm).
Tiempo medio de acceso: Tiempo medio que tarda la aguja en situarse en la
pista y el sector deseado; es la suma de :
Tiempo medio de búsqueda (situarse en la pista)
Latencia media (situarse en el sector)
Tiempo de lectura/escritura
Velocidad de transferencia : Velocidad a la que puede transferir la información a
la memoria una vez la aguja está situada en la pista y sector correctos. Puede ser
velocidad sostenida o de pico.
Caché de pista: Es una memoria tipo Flash dentro del disco duro, donde se
almacenan los datos de forma temporal.
Interfaz: Medio de comunicación entre el disco duro y el ordenador.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Interfaces.
• IDE (Integrated Drive Electronics) : También conocido como ATA (Advanced Technology Attachment), hasta
el año 2004 fue el principal estándar utilizado.
• SCSI: Son interfaces preparadas para discos duros de gran capacidad de almacenamiento y elevada
velocidad de rotación. Un controlador SCSI puede manejar hasta 7 discos duros o periféricos . Su tiempo
medio de acceso puede llegar a 7 milisegundos . Se presentan bajo tres especificaciones:
• SCSI Estándar (Standard SCSI). Hasta 5Mb/s de velocidad de transmisión.
• SCSI Rápido (Fast SCSI). Hasta 5Mb/s de velocidad de transmisión.
• SCSI Ancho‐Rápido (Fast‐Wide SCSI). Hasta 20Mb/s de velocidad de transmisión.
• SATA (Serial ATA): El más novedoso de los estándares de conexión, utiliza un bus serie para la transmisión
de datos. Notablemente más rápido y eficiente que IDE. Existen tres versiones, SATA 1 con velocidad de
transferencia de hasta 150 MB/s, SATA 2 de hasta 300 MB/s, el más extendido en la actualidad, y por
último SATA 3 de hasta 600 MB/s Físicamente es mucho más pequeño y cómodo que los IDE.
• SAS (Serial Attached SCSI): Interfaz de transferencia de datos en serie, sucesor del SCSI paralelo, aunque
sigue utilizando comandos SCSI para interaccionar con los dispositivos SAS.
• USB (Universal Serial Bus): Su éxito ha llegado también a los discos duros. En este caso, sólo una selecta
minoría implementan directamente la interfaz USB como conexión nativa, siendo los discos externos
mayoritariamente IDE o Serial ATA con un adaptador en su interior.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Interfaces.
IDE
SATA
SCSI
SAS
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica. Direccionamiento.
Para poder direccionar ya acceder a la información contenida en un disco, este se
divide en pequeños bloques llamados Sectores de normalmente 512 (ó 1.024
bytes).
Cylinder‐head‐sector o CHS (en español "cilindro‐cabezal‐sector") es un modo
antiguo de acceso para discos duros menores de 8 gigabytes.
CHS asigna una dirección a cada bloque mediante
una tupla que define el cilindro, el cabezal y
el sector en que se encuentra. Este sistema no
funciona bien en dispositivos que no son discos
duros, como las cintas de datos.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica. Direccionamiento.
Logical block addressing (LBA: direccionamiento de bloque lógico) es un método
muy común usado para especificar la localización de los bloques de datos en los
sistemas de almacenamiento, principalmente secundario, de un ordenador.
LBA es un método de
direccionamiento
particularmente simple.
Los
bloques
son
numerados según un
índice, siendo el primer
bloque LBA 0, el
segundo LBA 1, y así
sucesivamente.
Su limite es 8 ZB.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica.
A fin de que el ordenador pueda utilizar el disco duro, este debe estar debidamente
particionado y formateado, lo que le permitirá albergar un sistema de archivos que
será determinado por el propio sistema operativo.
• El sector de arranque (master boot record). Un registro de
arranque principal, conocido también como registro de
arranque maestro o por su nombre en inglés master boot
record (abreviado MBR) es el primer sector (“sector cero”)
de un disco duro. A veces, se emplea para el arranque del
sistema operativo, otras veces es usado para almacenar
una tabla de particiones y, en ocasiones, se usa sólo para
identificar un dispositivo de disco individual.
• Particiones. Una partición de un disco duro es una división
lógica en una unidad de almacenamiento, en la cual se
alojan y organizan los archivos mediante un sistema de
archivos.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica. MBR.
Un registro de arranque principal, (master boot record o MBR) es el
primer sector ("sector cero") de un dispositivo de almacenamiento de datos,
como un disco duro.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica. GUID.
Tabla de partición GUID (GPT) es un estándar para la colocación de la tabla de
particiones en un disco duro físico. Es parte del estándar Extensible Firmware
Interface (EFI) propuesto por Intel para reemplazar el viejo BIOS del PC, heredada
del IBM PC original. La GPT sustituye al Master Boot Record (MBR) usado con el
BIOS.
GPT usa el modo de direccionamiento lógico (LBA) en lugar
del modelo cilindro‐cabeza‐sector (CHS) usado con el MBR.
La información de MBR heredado está almacenada en el LBA
0, la cabecera GPT está en el LBA 1, y la tabla de particiones
en sí en los bloques sucesivos.
En los sistemas operativos Windows de 64‐bits, 16.384
bytes, o lo que es lo mismo, 32 sectores, están reservados
para la GPT, dejando el bloque LBA 34 como el primer sector
usable del disco.
GPT proporciona asimismo redundancia. La cabecera GPT y
la tabla de particiones están escritas tanto al principio como
al final del disco.
Tecnologías de la Información
Almacenamiento de Información
Discos Rígidos. Estructura Lógica. Particiones.
•
Partición primaria: Son las divisiones crudas o primarias del disco, solo puede haber 4 ó 3
primarias y 1 ó 0 extendida. A este tipo de particiones, prácticamente cualquier sistema
operativo puede detectarlas y asignarles una unidad, siempre y cuando el sistema
operativo reconozca su formato (sistema de archivos).
•
Partición extendida: También conocida como partición secundaria es otro tipo de
partición que actúa como una partición primaria. Permite contener múltiples unidades
lógicas en su interior. Fue ideada para romper la limitación de 4 particiones primarias en
un solo disco físico.
•
Partición lógica: Ocupa una porción de la partición extendida o la totalidad de la misma, la
cual se ha formateado con un tipo específico de sistema de archivos (FAT32, NTFS, ext2,...)
y se le ha asignado una unidad, así el sistema operativo reconoce las particiones lógicas o
su sistema de archivos. Puede haber un máximo de 23 particiones lógicas en una partición
extendida. Linux impone un máximo de 15, incluyendo las 4 primarias.
Tecnologías de la Información
Almacenamiento de Información
Discos Básicos y Dinámicos.
Los discos básicos y los discos dinámicos son dos tipos de configuraciones de disco duro en
Windows. La mayoría de los equipos personales están configurados como discos básicos,
que son los más sencillos de administrar. Los usuarios avanzados y profesionales
informáticos pueden emplear discos dinámicos, que usan varios discos duros de un equipo
para administrar datos, normalmente para obtener un mayor rendimiento o confiabilidad.
Un disco básico usa particiones primarias, particiones extendidas y unidades lógicas para
organizar datos.
Los discos dinámicos pueden contener un gran número de volúmenes
dinámicos (aproximadamente 2000), que funcionan como las particiones primarias usadas
en discos básicos. En algunas versiones de Windows, es posible combinar discos duros
dinámicos independientes en un único volumen dinámico (lo que recibe el nombre
de expansión), dividir datos entre varios discos duros (lo que recibe el nombre de sección)
para obtener un mayor rendimiento o duplicar datos entre varios discos duros (lo que
recibe el nombre de reflejo) para obtener una mayor confiabilidad.
Tecnologías de la Información
Almacenamiento de Información
Practica.
The Myth Of The Supersonic Disk Drive
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Cintas Magnéticas.
Las cintas magnéticas de almacenamiento de datos han sido
usadas para el almacenamiento de datos durante los últimos
50 años. En este tiempo se han hecho varios avances en la
composición de la cinta, la envoltura, y la densidad de los
datos.
La principal diferencia entre el almacenamiento en cintas y en
discos es que la cinta es un medio de acceso secuencial,
mientras que el disco en un medio de acceso aleatorio.
Tecnologías de la Información
Almacenamiento de Información
Cintas Magnéticas.
Dispositivos
• Utilizan las mismas interfaces que los discos magnéticos
• Elevada velocidad de lectura/escritura (secuencial)
• Se complementan con librerías para automatizar el proceso
Soportes
• Gestión de soportes (Inventario, Ambiente, Acceso)
• Fiabilidad y durabilidad
Tecnologías de la Información
Almacenamiento de Información
Cintas Magnéticas.
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Memorias USB.
Una memoria USB (de Universal Serial Bus) es un dispositivo de almacenamiento que
utiliza una memoria tipo flash (derivada de la memoria EEPROM) para guardar
información. Se le conoce también, entre otros nombres, como lápiz de memoria,
memoria externa o lápiz USB.
Estas memorias se han convertido en el sistema de almacenamiento y transporte
personal de datos más utilizado, desplazando en este uso a los tradicionales disquetes
y a los CD. Se pueden encontrar en el mercado fácilmente memorias de 1, 2, 4, 8, 16,
32, 64, 128, 256, 512 GB, y hasta 1 TB.[2]
Los sistemas operativos actuales pueden leer y
escribir en las memorias sin más que enchufarlas a
un conector USB del equipo encendido, recibiendo
la tensión de alimentación a través del propio
conector, de 5 voltios y un consumo de 2,5 vatios
como máximo.
Tecnologías de la Información
Almacenamiento de Información
SSD.
SSD (Solid state drive) : Los discos sólidos son memorias externas para
almacenamiento de datos que usan bien una memoria no volátil, como la memoria
flash, o bien una memoria volátil como la SDRAM, para almacenar datos, en lugar de
los platos giratorios magnéticos encontrados en los discos duros convencionales.
Los SSD hacen uso de la misma interfaz que los discos duros y, por lo tanto, son fácilmente intercambiables
Tecnologías de la Información
Almacenamiento de Información
SSD.
Aunque en la actualidad la relación entre
prestaciones y precio sigue siendo favorable a
los discos duros magnéticos, es razonable
pensar que en el futuro serán reemplazados
por los dispositivos SSD, al menos por tres
razones, que son las siguientes:
• El primero es la fiabilidad. Al no tener partes móviles, se pueden usar en entornos
con movimiento, y además tienen mucha más tolerancia a los golpes y vibraciones.
• También por su falta de piezas móviles, el consumo energético de estos discos es
bastante inferior. Ideales para dispositivos móviles.
• El tercer motivo es la velocidad. Estos discos son mucho más rápidos que los
convencionales y además estos últimos no podrán acercarse nunca a las
velocidades de los SSD.
Tecnologías de la Información
Almacenamiento de Información
SSD vs HDD.
Consumo Energía
Precio
Capacidad
Arranque del Sistema
Ruido
Vibración
SSD
(Solid State Drive)
HDD
(Hard Disk Drive)
2‐5 w
6‐15 w
$1/GB (disco de 240GB)
$0,075/GB (disco 4TB)
< 512GB
512GB‐4TB
± 22 segundos
± 40 segundos
Sin ruido
No
Practica.
Audible
Si
Ratio de Fallo (MTBF)
2MM horas
0,3MM horas
Temperatura de Operación
‐25ºC a 85ºC
5ºC a 55ºC
0,1 ms
5,5 – 8,0 ms
200MB/s – 500MB/s
50MB/s – 120MB/s
Tiempo de Acceso
Velocidad de Escritura
Tecnologías de la Información
Almacenamiento de Información
Practica.
Supongamos que trabajamos para el Canal de Isabel II.
El Canal quiere digitalizar los últimos 10 años de facturas a sus clientes para reducir su archivo en papel y facilitar el acceso a las facturas. ¿Cuánto espacio en disco necesita?, ¿Cómo puede organizar ese almacenamiento?
El Canal tiene aproximadamente 1.200.000 contratos y factura a cada abonado una vez cada 2 meses.
Cada factura escaneada ocupa 300KB.
Tecnologías de la Información
Almacenamiento de Información
RAID
En 1987, David Patterson, Garth Gibson y Randy Kartz publicaron un artículo de
investigación titulado “Un caso sobre matrices redundantes de discos económicos”
(RAID o A Case for Redundant Arrays of Inexpensive Disks), que sentó las bases de
los sistemas RAID tal y como los conocemos hoy en día.
RAID o Redundant Array of Independent Disks, traducido como «conjunto
redundante de discos independientes», hace referencia a un sistema de
almacenamiento de datos que usa múltiples unidades de almacenamiento (discos
duros o SSD) entre los que se distribuyen o replican los datos.
La mayor aportación de RAID es la habilidad de combinar varios dispositivos de
bajo coste y/o tecnología más antigua en un conjunto que ofrece mayor
capacidad, fiabilidad, velocidad o una combinación de éstas que un solo
dispositivo de última generación y coste más alto.
Tecnologías de la Información
Almacenamiento de Información
RAID
Disco “virtual”
de 600GB
Ejemplo :
RAID
Discos físicos “reales” de 120GB
Tecnologías de la Información
Almacenamiento de Información
RAID
En la actualidad, la tecnología RAID se ha desarrollado enormemente y,
dependiendo de su configuración o nivel, los beneficios de un RAID respecto de
una sola memoria secundaria son uno o varios de los siguientes:
• Mayor tolerancia a fallos.
• Mayor rendimiento (throughput)
• Mayor capacidad de almacenamiento
• Mayor integridad
Existen diversas configuraciones RAID estandarizadas y cada una proporciona un equilibrio diferente entre rendimiento, la capacidad y la tolerancia.
Tecnologías de la Información
Almacenamiento de Información
RAID 0
RAID Nivel 0 (Striping): Striped Disk
Array. Matriz de discos seccionados.
La información se reparte entre todos
los discos del sistema. La capacidad de
los discos físicos se suma. Ofrece
división de datos (distribuye bloques
de cada archivo entre varias unidades
de disco) pero sin redundancia. Esto
mejora
el
rendimiento
(las
lecturas/escrituras
pueden
ser
simultaneas en todos los discos), pero
no proporciona tolerancia de fallos. Si
una unidad falla, entonces todos los
datos de la matriz se pierde.
Tecnologías de la Información
Almacenamiento de Información
RAID 1
RAID Nivel 1 (Mirroring): En esta
configuración, los discos se agrupan de
dos en dos, de forma que se trabaja
con uno de ellos y el otro es su copia
exacta o espejo. El sistema resiste al
fallo de una de los discos. Su principal
inconveniente es que puede suponer
un gasto de espacio significativo.
Tecnologías de la Información
Almacenamiento de Información
RAID 2
Nivel 2: Error correcting coding. Codificación de corrección de errores. No es
una implementación típica y se utiliza raramente, RAID 2 distribuye los datos a
nivel de bits y no a nivel de bloque.
RAID 3
Nivel 3: Bit‐Interleaved Parity. Paridad delegada en bit. En desuso, trabaja con
grupos de bytes repartidos por todos los volúmenes, usando un disco para
control de errores, conocido como disco de paridad dedicado.
Tecnologías de la Información
Almacenamiento de Información
RAID 4
Nivel 4: Dedicated Parity Drive. Unidad de paridad dedicada. Una aplicación
común de RAID, nivel 4 ofrece a nivel de bloque striping (una única banda de
discos, como Nivel 0) con un disco de paridad, para controlar errores, de tal
manera que si un disco de datos falla, los datos del disco de paridad se utilizarán
para crear un disco de reemplazo. Una desventaja en el nivel 4 es que el disco de
paridad puede crear cuellos de botella de escritura.
Cálculo de paridad
Muchos niveles de RAID, emplean un sistema para detectar errores, llamado
“paridad”, un método comúnmente usado en tecnologías de la información para
proporcionar tolerancia a errores en un conjunto de datos.
Tecnologías de la Información
Almacenamiento de Información
RAID 5
Nivel 5: Block Interleaved Distributed Parity. Seccionado tolerante a fallos con
paridad. En este nivel se usa la división en bloques de datos a nivel de byte pero
no se usa un volumen exclusivo para el control de error, lo que da como resultado
un rendimiento excelente y buena tolerancia a fallos. Nivel 5 es una de las
implementaciones más populares de RAID. Necesita al menos 3 discos para ser
implementado. Resiste el fallo de un disco del grupo.
Tecnologías de la Información
Almacenamiento de Información
RAID 6
Nivel 6: Independent Data Disks with Double Parity. Discos de datos
independientes con doble paridad. RAID 6 es similar a RAID 5 (paridad de stripe o
sección) salvo que en lugar de un bloque de paridad por banda hay dos. Con dos
bloques de paridad independientes, RAID 6 puede sobrevivir a la pérdida de dos
discos en el grupo.
Tecnologías de la Información
Almacenamiento de Información
RAID 0+1
Nivel 0+1: A Mirror of Stripes. Un Espejo
en secciones. Formaría lo que puede
denominarse espejo de divisiones. Si en
RAID 0 tenemos varios discos y la
información se reparte entre ellos sin
control de errores, y RAID 1 contiene
pares de discos de forma que el
secundario es el espejo del primario, si
tomo como elemento base RAID 0 y éste
está compuesto por dos discos físicos, el
RAID 0+1 lo compondrán 4 discos de
forma que los dos primeros tienen la
información y los dos últimos serán el
espejo.
Tecnologías de la Información
Almacenamiento de Información
RAID 10 (1+0)
Nivel 10 (1+0): División de espejos. En
este caso, el elemento base será RAID 1,
de forma que tendremos pares de disco
como componente de RAID 0, lo que nos
brinda una división de espejos, de ahí su
nombre.
Tecnologías de la Información
Almacenamiento de Información
RAID 100 (10+0)
RAID 100. Un RAID 100, a veces llamado también RAID 10+0, es una división de
conjuntos RAID 10. El RAID 100 es un ejemplo de «RAID cuadriculado», es decir, un
RAID en el que conjuntos divididos son a su vez divididos conjuntamente de
nuevo. Implementar niveles RAID anidados permite eliminar virtualmente el límite
de unidades físicas en un único volumen lógico.
Tecnologías de la Información
Almacenamiento de Información
Comparación niveles RAID
Nivel RAID
Mínimo número discos
Eficiencia Espacio
Tolerancia a Fallos
Rendimiento Lectura
Rendimiento Escritura
RAID 0
2
100%
No (0)
n*Rto
n*Rto
RAID 1
2
< 50%
Si (n‐1)
n*Rto
1*Rto
RAID 4
3
(100‐100/n)%
Si (1)
(n‐1)*Rto
Practica.
RAID 5
3
(100‐100/n)%
Si (1)
n*Rto
(n‐1)*Rto
RAID 6
4
(100‐2*(100/n))%
Si (2)
(n‐1)*Rto
(n‐2)*Rto
n : numero de discos que forman el grupo RAID
Rto : rendimiento individual de cada disco
1*Rto
Tecnologías de la Información
Almacenamiento de Información
Máxima capacidad por disco sencillo en el tiempo
(Source: IDC Study# 228266)
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Practica.
¿Cómo puedo acceder al Administrador de Disco en Windows?
 Inicio  Equipo (botón derecho)  Administrar 
 Almacenamiento  Administración de Discos
Tecnologías de la Información
Almacenamiento de Información
Tecnologías de la Información
Almacenamiento de Información
Descargar