Respaldo y recuperación de datos - FCEA

Anuncio
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
RESPALDO Y
RECUPERACION
DE DATOS
Simón Mario Tener
Nelson Pequeño 1
Julio 2000
1
Los autores agradecen los útiles aportes de Carlos Moirano y Leonardo Sena.
1
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Indice
PROPÓSITO..........................................................................................................................3
INTRODUCCIÓN .................................................................................................................3
El por qué de los respaldos ................................................................................................3
Los datos como activo........................................................................................................4
CONCEPTO DE RESPALDO Y DE RECUPERACIÓN.....................................................6
Qué es respaldo ..................................................................................................................6
Qué es recuperación ...........................................................................................................6
Respaldos en sistemas que operan en tiempo real .............................................................7
PROCEDIMIENTOS DE RESPALDO Y RECUPERACIÓN .............................................7
Aspectos a considerar.........................................................................................................7
Plan de respaldo .................................................................................................................8
Cuáles datos se deben incluir .............................................................................................8
Medios de soporte a utilizar ...............................................................................................8
Tipos de respaldos..............................................................................................................9
Modalidad de copia ..........................................................................................................10
Cuándo realizarlo .............................................................................................................12
Periodicidad .....................................................................................................................12
Herramientas a utilizar .....................................................................................................12
Dónde guardarlos - distancia y accesibilidad...................................................................13
Quienes realizan y manejan los respaldos........................................................................13
Verificación del respaldo .................................................................................................13
Registro ............................................................................................................................14
Consejos para hacer los respaldos y las recuperaciones ..................................................14
Instalaciones grandes .......................................................................................................14
SISTEMAS TOLERANTES A FALLAS EN RED DE COMPUTADORAS....................15
Discos espejados ..............................................................................................................15
Servidor duplicado ...........................................................................................................15
Sistemas de discos tolerante a fallos ................................................................................15
Otros sistemas de autorespaldo ........................................................................................16
PLANES DE CONTINGENCIA .........................................................................................16
2
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
PROPÓSITO
El propósito de este texto es destacar la importancia que tiene el salvaguardar los datos
almacenados en una computadora (de cualquier porte), para evitar se interrumpa el
procesamiento, tanto en forma temporal como permanente. Además, en caso de ser necesario,
que el esfuerzo de recuperación sea el mínimo necesario. Por lo tanto, es imprescindible adquirir
el hábito de respaldar los datos, de forma apropiada según cada sistema, usuario e instalación.
INTRODUCCIÓN
El texto está dirigido a todo usuario de computación (doméstico o empresarial) y de todo
tipo de equipamiento informático (micros, minis, etc.), para cualquier tipo de procesamiento de
datos, tanto para quien hace procesamiento de textos, generación de gráficas, utilización de
planilla electrónica, ya sea en forma ocasional o habitual, como el que opera un sistema de
contabilidad, de facturación, etc.
Se presenta el tema de respaldo y recuperación de datos en computadora de manera
conceptual y sencilla. El objetivo es que el lector tome conciencia de la necesidad e importancia
de cumplir con los respaldos, en la forma y frecuencia que correspondan a la aplicación en
computadora que utiliza. Se destaca la importancia de estos procesos, lo cual debe inducir al
lector a asegurarse que sus datos estén correctamente respaldados.
Existen muy pocos textos de computación que tratan el tema de respaldo y recuperación
de datos, a pesar de su importancia. Inclusive, los textos dedicados al tratamiento de datos y de
archivos tampoco lo presentan. Por lo tanto, el presente texto pretende complementarlos con las
nociones fundamentales.
El por qué de los respaldos
Día a día, en todos los órdenes de actividad, es mayor la dependencia del hombre a la
computadora. Cada vez se almacenan más datos en ellas, de las más variadas aplicaciones y
toda vez que se requiere obtener información, se accede a la computadora para lograr la
respuesta exacta, completa y oportuna.
Gracias a los avances de la tecnología se dispone actualmente de máquinas muy
confiables, con muy bajo índice de fallas. Sin embargo, la computadora puede romperse, el disco
puede averiarse. Puede haber errores de operación, propios o de terceros. Los accidentes pueden
ser intencionales. Asimismo, los virus informáticos pueden causar pérdidas importantes de datos.
El tema de protección de los datos en una computadora es preocupación de muchas
personas, y ocupación de otras (empresas de seguros, especialistas en detección de virus,
asesorías y auditorías informáticas, etc.). Este tema tiene tantos años como la existencia de la
computadora. Sin embargo, los dramas por pérdida y alteración de datos son cada vez más
frecuentes. Se pierden cantidades importantísimas de horas de trabajo y de dinero para recuperar
los datos perdidos. Hay situaciones en las que la recuperación es imposible!
La mayoría de las pérdidas de datos son evitables. Los difundidos reingreso de datos,
recomposiciones de archivos, etc., no son necesarios si se hubieran seguido regularmente simples
y breves procedimientos.
Todo lo que se insista sobre respaldo de datos será insuficiente, hasta que, en general por
experiencia propia, se sufra el esfuerzo de recuperar los datos perdidos. Ahí se comprende lo
3
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
barato que es hacer correctamente los respaldos periódicos de datos. Con una recuperación del
último respaldo se restituye el estado de los datos y se prosigue normalmente, como si nada
hubiera ocurrido.
No se trata de disponer de equipamiento infalible, lo cual es prácticamente imposible (Ley
de Murphy: si algo puede fallar, seguro que fallará). Lo importante es tomar todas las
precauciones necesarias para reducir al mínimo los riesgos.
Hoy en día, lo importante es el valor de los datos. El costo de una computadora es cada
vez menor. Por el contrario, el costo de los datos es cada vez mayor. Inclusive, en la mayoría de
las aplicaciones, resulta difícil calcular el costo de cada dato. Existen costos computables (por
ejemplo, el tiempo de ingreso) y otros que no lo son, tales como los costos indirectos (por ejemplo,
los efectos del dato en todo el sistema).
Los datos como activo
Para comprender la importancia que tienen los datos para una empresa o una institución,
deberían ser considerados como parte del activo. Es decir, son un bien, con un cierto valor una
determinada vida útil, con una cuota de amortización. Inclusive podría haber revalorización (el
valor del bien aumenta). Los datos deberían intervenir en la determinación de las pérdidas y las
ganancias de la empresa.
Los datos tienen un costo de obtención y un costo de elaboración: tiempo (digitación) y la
circunstancia en que se introducen en el computadora. Por ejemplo, puede ser por lote, como en
los cheques por clearing o bien puede ser en tiempo real, como en un sistema automatizado de
facturación de venta de artículos contra público. El tiempo se puede valorizar en función del costo
de la mano de obra de las personas que intervienen para su obtención:
digitadores,
administrativos, operarios en tiempo real, etc.
La circunstancia en que se generan los datos tiene un costo también. En ciertas
situaciones es factible calcular su costo y en otras puede resultar difícil de ponderar, y más aún
imposible de reponer Por ejemplo, si los datos se generan como resultado de un balance de las
existencias en un depósito, se puede calcular el tiempo que insume el conteo y los recursos
humanos y materiales que requiere. Otro ejemplo son los datos seriados, es decir, a lo largo del
tiempo, sobre cierto evento (cantidad de elementos elaborados de un producto mes a mes) para
hacer pronósticos y previsiones. La pérdida de estos datos puede ser repuesta si existe alguna
copia de los mismos, ya sea en forma directa o a través de reingreso. Otra posibilidad es que
estos datos seriados son de pacientes bajo tratamiento médico (diálisis, centro intensivo, etc.) en
cuyo caso, la pérdida de los datos puede afectar seriamente la atención de salud. Lo mismo se
aplica a otros sistemas de control, principalmente en tiempo real, como ser control de tráfico
aéreo, control de semáforos en ciudades, control de red de subterráneas, etc.
Al igual que los bienes, los datos tienen una vida útil determinada. Aquí corresponde
distinguir entre el dato en sí y su significado en el sistema en que se lo utiliza. Son dos aspectos
muy diferentes.
Cada dato tiene sus características propias, en relación con el caso a que corresponda.
Es decir, en función de las entidades establecidas, cada una de ellas tiene sus atributos. Las
entidades pueden ser personas y uno de sus atributos es el nombre. Las entidades pueden ser
facturas de venta a crédito, y uno de sus atributos el nombre del cliente. El dato ‘nombre” tiene
diferente significación en los dos ejemplos. En el primer caso, resulta ser un elemento fundamental
de identificación, y en el segundo es un elemento complementario. Un dato puede ser permanente
o variable, único o múltiple, cuantitativo, cualitativo, de referencia o de identificación, etc.
Por otra parte, en cada sistema de información, cada dato tiene una finalidad
determinada. Es posible, que un mismo dato tenga diferente trascendencia en varios sistemas, lo
4
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
cual determina valoración discriminada, con diferente vida útil.
Algunos datos tienen valor permanente, tal como los nombres y las fecha de nacimiento
de las personas. Otros datos tienen validez acotada, como por ejemplo, el valor de la tase de
cambio. También es de valor temporal el monto de un cheque presentado para su cobro en
ventanilla.
Por ejemplo, el nombre de un persona, en un sistema de registro civil, es fundamental,
con vida útil permanente. El mismo dato en una encuesta de consumo de productos es temporal,
e inclusive no relevante. A su vez, el nombre de la persona en un sistema de ventas a crédito,
transcurrido un plazo razonable desde la última cancelación de deuda, caduca.
Existen empresas de servicio, para los cuales es más importante las bases de datos que
poseen que sus bienes muebles. Sin la información no pueden operar. Por ejemplo, sin mobiliario
igual pueden operar: arriendan una oficina pronta para usar. Las empresas proveedoras de
tarjetas de crédito y las de clearing de informes, son ejemplos de organizaciones donde el banco
de datos es el núcleo de su actividad.
La información forma parte del conjunto de bienes inmateriales. A efectos de asignarle
valor, tal como se requiere en la elaboración del inventario, a efectos de determinar el patrimonio,
surge el problema de cuánto vale cada dato. Ello es, en general, sumamente difícil y por un lado
se debe aplicar sentido común y por otro contar con el apoyo de especialistas al respecto.
La valorización establecida puede ser superior o inferior a la real, y puede ser corregida.
Hay que tener presente la relatividad de la valorización. Inclusive, la determinación de plazo de
vida útil (que conduce a la cuota de amortización) de cada tipo de dato, se establece sobre la base
de criterios muy variables.
El aspecto más positivo de considerar a los datos, como parte del activo de una
organización, es la evaluación de la importancia de cada dato, al establecer su valorización. Es
decir, se pasa a tener conocimiento de cuánto vale (o cuánto cuesta) cada ítem. Se puede obtener
una lista ordenada de datos según su valor. Este análisis de los datos que se procesan, puede
llegar a servir también para suprimir el manejo de ciertos datos que no resultan de utilidad, con lo
cual se puede economizar, a la vez de contar con un sistema de procesamiento más eficiente.
Por lo tanto, el análisis de los datos como parte del activo, tiene importancia para el nivel
gerencial, de poder evaluar cada dato en cuanto a su costo y su trascendencia en la organización.
A partir de este análisis económico se podrán establecer los procedimientos de
salvaguarda adecuados para cada grupo de datos, sobre la base de un estudio de costo beneficio.
Al tratar el tema de respaldo y recuperación de datos, se debe considerar: ¿cuál es el
tiempo y el costo de regenerar los datos, en relación al esfuerzo de volver al estado original de los
datos?
Siguen dos ejemplos para clarificar los conceptos vertidos.
Ejemplo 1
El ingreso de datos insume 6 horas y el respaldo de dichos datos insume 15 minutos.
Queda plenamente justificado hacer el respaldo, inclusive con mayor frecuencia (2 veces
por día), ya que con sólo dedicar 15 minutos se protege la eventual pérdida de 360
minutos. Relación: 4 % del tiempo es requerido para respaldo. Si se lo hace dos veces por
día, 15 cada 3 horas, la relación es 8 %, lo cual es igualmente bueno.
5
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Ejemplo 2
Cada 5 transacciones, que insume del orden de 10’, se requiere hacer el respaldo, que
insume 3’. La relación es 30 %. Es decir, de cada hora de trabajo, 20’ están dedicados a
respaldo. Esta situación no parece ser razonable. Efectivamente, parecería que hacer el
respaldo es muy costoso. Sin embargo, se debe tener presente que hay aplicaciones,
especialmente en tiempo real, en que se actualizan archivos de manera aleatoria, en
cuyos casos la salvaguarda de los datos es crítica y no se puede interrumpir la operativa.
En estos casos, igualmente deben hacerse los respaldos. Se deberán establecer la forma,
la frecuencia y el momento más adecuados.
CONCEPTO DE RESPALDO Y DE RECUPERACIÓN
El tema de respaldo y recuperación de información, trata del esfuerzo necesario para
asegurar la continuidad del procesamiento de los datos, con la mínima dificultad posible ante una
eventual alteración no deseada de los mismos.
Para determinar cuándo hacer un respaldo, pensar de la siguiente manera: hacer una
copia de respaldo justo antes del momento en que regenerar los datos ocasione mayor esfuerzo
que hacer el respaldo.
Qué es respaldo
Respaldo es la obtención de una copia de los datos en otro medio magnético, de tal modo
que a partir de dicha copia es posible restaurar el sistema al momento de haber realizado el
respaldo. Por lo tanto, los respaldos deben hacerse con regularidad, con la frecuencia
preestablecida y de la manera indicada, a efectos de hacerlos correctamente.
Es fundamental hacer bien los respaldos. De nada sirven respaldos mal hechos (por
ejemplo, incompletos). En realidad, es peor disponer de respaldos no confiables que carecer
totalmente de ellos!
Suele ocurrir que la realización de respaldos es una tarea relegada a un plano secundario,
cuando en realidad la continuidad de una aplicación depende de los mismos. Los respaldos son
tan importantes como lo es el correcto ingreso de datos.
Qué es recuperación
La recuperación es la tarea que se lleva a cabo cuando es necesario volver al estado de
la aplicación al momento del último respaldo. A partir de los datos de la última copia realizada, se
hace una copia en sentido inverso, recuperando la aplicación.
Todas las transacciones ocurridas después del último respaldo se han perdido. Los
movimientos ocurridos entre el momento al último respaldo y el momento en que se detecta la
necesidad de la recuperación deben ser reconstruidos “a mano”.
La recuperación es una tarea eventual. Sólo se hace si se han perdido datos, en magnitud
tal que justifique utilizar el respaldo. Puede hacerse en forma parcial, por ejemplo, un solo archivo
o completo.
Si se hace una recuperación parcial, debe asegurarse que no se altere la integridad de los
datos, como ser que los archivos queden en diferente estado de actualización respecto al tiempo.
6
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
En la situación óptima, la recuperación nunca tiene que hacerse. Por otra parte, la
necesidad de la recuperación suele surgir cuando menos se lo desea (en sobrecarga de trabajo,
con tensión, con plazos de entrega excedidos, etc.), a lo cual se agrega el no saber cómo se hace
la recuperación, por no haberlo hecho nunca antes. Por lo tanto, es recomendable que, al menos
una vez por año, se lleve a cabo una recuperación, real o simulada.
Respaldos en sistemas que operan en tiempo real
Hoy en día, cada vez más los sistemas informáticos operan en tiempo real, contra público,
sin posibilidad de interrupción o de demoras. Entonces el procedimiento de respaldo para estos
sistemas debe ser tal que opere “en caliente”, con el sistema en marcha. Además, el ejecución del
respaldo no debe afectar la performance global, por ejemplo, debido a enlentecimiento. Esto
quiere decir que las copias de archivos deben hacerse mientas están abiertos (en uso) y sin que el
proceso de copia frene la operativa en los demás puestos de trabajo.
Si se emplea una base de datos, el propio sistema administrador de la base de datos, el
DBMS, incluye rutinas de respaldo de la misma,
PROCEDIMIENTOS DE RESPALDO Y RECUPERACIÓN
A continuación se tratan los aspectos a considerar al definir el tipo de respaldo a llevar a
cabo: el plan de respaldo, cuáles datos se deben incluir, medios de soporte a utilizar, cuáles son
los posibles tipos de respaldos, cuándo realizarlos, periodicidad, herramientas a utilizar, dónde
guardarlos, quienes realizan y manejan los respaldos, su verificación y registro. Todos estos
puntos tienen que estar presentes al establecer el procedimiento de respaldo (y su
correspondiente recuperación en caso necesario), de los datos que se procesan, cualesquiera que
ellos sean.
Aspectos a considerar
Dado que las aplicaciones (sistemas) tienen características inherentes, para cada
aplicación corresponde un método apropiado de respaldo / recuperación de datos.
Preferentemente, debe ser establecido por quienes desarrollan la aplicación, que son los que
saben cuáles datos es necesario respaldar, la mejor manera de hacerlo, etc. y cómo hacer la
correspondiente recuperación. Hay que tener en cuenta las características propias del usuario y
cuál es la instalación en que funciona el sistema. Es decir, qué computadora, dónde está
instalada, etc. Incluye el área física (por ejemplo: ambiente aislado o transitado, acondicionamiento
térmico, nivel de ruido, etc.).
Algunos de los aspectos a considerar se presentan a continuación. La lista no es taxativa
y el orden de cada aspecto no es relevante, siendo cada aspecto de propósito limitado en forma
individual. Un adecuado método de respaldo/recuperación debe tener en cuenta todos los
aspectos en conjunto, como ser:
- Plan de respaldo
- Cuáles datos se deben incluir
- Tipos de respaldos
- Cantidad de copias a realizar
- Modalidad de copia
- Dónde guardarlas
- Quienes los manejan
- Verificación del respaldo
- Registro
- Cuándo hacerlo
- El respaldo completo del disco
- Soporte físico a utilizar para el respaldo
7
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Plan de respaldo
Los procedimientos de respaldo y recuperación desarrollado deben formar parte de un plan
de respaldo y recuperación, el cual debe ser documentado y comunicado a todas las personas
involucradas. Dado que, a lo largo del tiempo, varias características que se consideran para
desarrollar este plan sufren cambios (software utilizado, soporte, etc.), el plan debe ser revisado, y
de ser necesario modificado de manera periódica.
El plan debe contener todos los ítems detallados a continuación y cualquier otro que mejore la
realización del trabajo o clarifique la tarea.
Cuáles datos se deben incluir
Cada aplicación maneja un conjunto muy variado de datos, algunos estáticos, otros
dinámicos. Hay datos base, a partir de los cuales se generan datos resultantes (información). Al
definir el respaldo, se establece si se copian todos los archivos o parte de ellos. Entra en
consideración si la copia incluye los propios programas de la aplicación. La decisión final se
tomará sobre la base de la criticidad de los datos y el valor de los mismos.
Medios de soporte a utilizar
Los medios a utilizar dependerán del tipo de computadora (micro. Main frame, etc),
cantidad de información a almacenar, tiempo disponible para realizar el respaldo, costos y
obviamente de la tecnología disponible al momento.
Actualmente se cuenta con una variedad muy amplia de soportes disponibles y a costos
muy bajos, sobre todo al nivel de micro computadoras. A nivel mainframe las posibilidades se
acotan. Las características principales a considerar de cada opción será la capacidad de
almacenamiento, medida en Mg o Gb, y la velocidad de transferencia de datos (cantidad de datos
por segundo que es posible grabar), medida en Kb/s. Los soportes magnéticos son los más
difundidos; también los hay ópticos.
Las opciones más comunes
almacenamiento promedio):
− Discos duros
− Cintas (4mm, 8mm, QIC)
− Cartuchos (alta densidad, micro)
− CD ROM
− Zip drive
− Tarjetas PCM-CIA
− Diskette
son
(en
orden
descendente
por
capacidad
de
Existe la posibilidad de realizar respaldo en medios pertenecientes a terceras partes. Hoy
día, varias empresas ofrecen a través de Internet un servicio de respaldo. El mismo se realiza en
los equipos de estas empresas transfiriendo los datos a través de la Internet. Notar que este
servicio es útil si tenemos una conexión con un buen ancho de banda y una cantidad de datos
pequeña o mediana. Hay que tener presente el problema de la privacidad de nuestros datos
2
(tanto durante la transmisión como en el almacenamiento)
2
Las siguientes son algunos de los sitios que ofrecen este servicio:
http://www.ultrabac.com/
http://www.datarecovery.demon.co.uk/
http://www.evault.com/
http://www.ora.com/catalog/unixbr
http://www.unitrends.com/
8
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Tipos de respaldos
Existen diferentes tipos de respaldos posibles, que se pueden complementar entre sí,
como ser:
♦ Respaldos globales (full back-up):
Se realiza un respaldo total del disco, se respalda la totalidad de las bases de datos y la
totalidad de las operaciones que se mantienen en línea (on–line). Si se realiza
diariamente, ante cualquier problema solamente se debe recuperar el respaldo del día
anterior.
♦ Respaldos parciales:
Se respalda sólo una parte de la información (solamente una aplicación, una plataforma,
los datos críticos o las bases nuevas, etc.) Como se ve, existen varios criterios para optar
qué parte respaldar. Las consideraciones realizadas para el respaldo global valen aquí
solamente para las partes respaldadas.
♦
Respaldos incrementales:
Se combina con respaldos globales o parciales. Se respalda solamente las
modificaciones que han ocurrido desde el último respaldo. Para realizar una
recuperación se debe adicionar al último respaldo global todos los respaldos
incrementales sucesivos. Es un procedimiento de respaldo ágil y que ocupa poco
espacio. El procedimiento de recuperación es complejo.
♦
Respaldos diferenciales:
Similar al anterior. Se respalda las modificaciones que han ocurrido desde el último
respaldo global o parcial. Para realizar una recuperación se debe adicionar al último
respaldo global solamente el último respaldo diferencial. Es un procedimiento de
respaldo relativamente ágil y que ocupa poco espacio, con un procedimiento de
recuperación de sólo dos etapas.
♦ Respaldos simultáneos:
se realiza una copia exactamente igual al mismo tiempo de todos los datos procesados,
por ejemplo cuando el sistema de discos espejados es utilizado. Recuperar los datos es
simplemente direccionarse a otra unidad de disco.
Todos los tipos de respaldo tienen sus ventajas y sus desventajas.
El respaldo global es el más seguro ya que se tiene la totalidad de los datos, pero también
es el que insume mayor cantidad de tiempo y capacidad del soporte magnético.
El respaldo incremental es el más rápido, pero tiene una cantidad de información limitada
a un período de tiempo. Para recuperar un sistema determinado o el disco completo, se debe
partir del último respaldo parcial o completo y cargar en secuencia cada uno de los respaldos
incrementales. En general, se suele hacer un respaldo completo una vez por semana y para cada
día de la semana se hace el incremental.
Respecto al parcial, insume menos tiempo que el global (y puede llevar menos tiempo que
el incremental), pero se está limitado a cierto tipo de información. Se suele hacer respaldos
globales con menor frecuencia que los parciales. Por ejemplo, una vez por semana se puede
hacer respaldo parcial por aplicación (combinado con los incrementales o diferenciales, en forma
http://www.dpec.com/catalog/orcc07.htm
http://softseek.zdnet.com/Utilities/Backing_Up/Review2_30138_index.html
http://www.cbtsys.com/catalog/curicula/courses/or7mt/or7mt.htm
http://www.4datarecovery.com/
9
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
diaria) y una vez por mes se hace un respaldo completo del, o los, discos.
Por ultimo, el respaldo simultaneo es el más rápido y tiene la totalidad de la información
actualizada, sin embargo interfiere con el procesamiento de los datos y los datos se encuentran en
el mismo lugar físico que los datos origen.
Generalmente los diferentes tipos de respaldo son utilizados en forma complementaria.
Para definir el tipo o tipos de respaldo a utilizar se deben tener en cuenta la criticidad de los datos,
capacidad de almacenamiento, tiempo disponible para realizarlos y tiempo necesario para
recuperarlos.
Siguen a continuación unos ejemplos. a) S el procesamiento de datos es una tarea crítica
se optará por un respaldo simultaneo (para no perder tiempo en realizar recuperaciones en forma
manual) y se lo complementará con respaldos en otro soporte (removible) empleando cualquiera
de los otros tipos de respaldo. b) Suponer que se quiere realizar un respaldo global los fines de
semana y para ahorrar tiempo y recursos se hacen respaldos incrementales durante los día de la
semana. Entonces, en caso de tener un problema el día miércoles, se deberá recuperar el
respaldo global del fin de semana y adicionarle los incrementales de los días siguientes para
reflejar los cambios ocurridos. Suponer que el tiempo de recuperar el respaldo global es de 4
horas y el de cada respaldo incremental es, en promedio, de 2 horas. Entonces, el recuperar 3
respaldos (global + incremental lunes + incremental martes) requiere de 8 horas (un día de
trabajo). ¿El negocio puede soportar perder un día? Si la respuesta es afirmativa, se continuará
trabajando de esta manera; si la respuesta es negativa, se deberá modificar la operativa. Una
solución sería realizar respaldos globales diarios, que insumen más tiempo de generación
diariamente pero disminuyen el tiempo de recuperación, en caso de ser necesario.
Modalidad de copia
Los tipos posibles de respaldo pueden combinarse en forma conveniente en la modalidad
de copia, como ser, por ejemplo:
- copia simple
- copia doble
- copia generacional
La copia simple consiste en hacer la tarea de respaldo una sola vez, existiendo un único
ejemplar del respaldo. La copia doble consiste en repetir la tarea, de tal manera de existir dos
ejemplares del respaldo. El soporte del respaldo puede, eventualmente deteriorarse. En caso de
haber una copia simple, si se ve afectado, se perdió el respaldo. En caso de haber dos copias, es
altamente improbable que los dos ejemplares se deterioren. Por lo tanto, es mejor la copia doble,
pero requiere doble de tiempo. La copia generacional es la más segura y se explica más adelante.
Suele ser un error frecuente, el respaldar los archivos en el mismo disco, con otros
nombres, o bien bajo otro subdirectorio. Este respaldo es de muy escaso valor. Sólo sirve en caso
de destrucción lógica de alguno de los archivos. En caso de rotura física del disco o roture lógica
de su índice, la recuperación no es posible. Además, se ocupa espacio en el disco.
La técnica de copia doble de respaldo, consiste en disponer de dos juegos de copia de los
datos de la aplicación. Cada vez que se termina de utilizar el sistema se hace una copia, dos
veces. Ante una eventual pérdida de datos, se tiene un juego de copia para recuperarlos. Si
ocurriese una falla en alguno de los soportes, existe aún un segundo juego.
En la recuperación, nunca debe utilizarse el segundo juego directamente. Se debe hacer
una copia del juego de respaldo en otro computadora. Recién entonces, se debe volver a hacer la
recuperación.
Ejemplo: supóngase que se deterioró físicamente parte del disco, afectando la aplicación,
por lo cual es necesario recuperarla. Se toma el primer juego de respaldo, se intenta hacer la
copia del respaldo al disco y aparece error de lectura en el respaldo. Se usa entonces el segundo
10
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
juego y ocurre lo mismo. Al analizar lo ocurrido, se detecta que además de haberse deteriorado el
disco, está dañada la unidad encargada de grabar los respaldos y al tratar de leer los mismos los
daña . Resultado: la aplicación en disco no funciona y los dos juegos de respaldo quedaron
inutilizados. De aquí se concluye la necesidad de hacer otra copia del respaldo, antes de intentar
la recuperación.
El respaldo puede ser hecho por una sola persona. En cambio, la recuperación debería
ser hecha por dos personas, siguiendo paso a paso las instrucciones, a efectos de evitar cometer
errores. Nunca debe recuperarse en forma apresurada.
El método de copia doble, si bien es muy práctico, presenta un importante inconveniente:
si por alguna falla se alteran los datos sin que el usuario lo perciba, al hacer los respaldos, se
copian los datos erróneos. Una vez terminadas las dos copias se poseen tres ejemplares
idénticos de datos inválidos, tal vez, sin posibilidad de recuperar la aplicación a un estado válido!
Si ocurre un error físico en el disco, la copia no se completa y por lo tanto no se afectan
los respaldos. El problema se puede dar si ocurre un error lógico, tal como el borrado de datos,
copiándose entonces un archivo incompleto.
El borrado de datos y de archivos del disco puede ocurrir en forma accidental o
intencional, por el propio usuario o por terceros, por motivos tales como: desconocimiento,
cansancio, tensión o equivocación.
Como solución a este inconveniente surge la técnica de respaldo generacional, también
es conocida como abuelo-padre-hijo. Se disponen de varios juegos de cintas, cd rom, diskettes,
etc, para contener los respaldos a lo largo del tiempo, de tal manera que se guarda una historia de
respaldos de la aplicación. En lugar de respaldar cada vez sobre los mismos cd, cinta, diskette,
etc., éstos se rotan a lo largo del tiempo. La cantidad de juegos a utilizar pueden ser 4 o más.
Ejemplo: Supóngase que se tiene un juego de respaldo por cada día de la semana y al finalizar
cada jornada se respalda en el juego correspondiente. De esta forma, no se tienen varias copias
idénticas, sino que son “fotografías en secuencia” a la finalización de cada jornada. Si se tienen
que recuperar los datos, se procede de la siguiente manera: Si el de la jornada previa sirve, se lo
utiliza. Si está dañado, se utiliza el anterior. Y así sucesivamente, hasta 4 días atrás. Las
transacciones ocurridas en cada día perdido deben rehacerse
Si durante el día miércoles se pierden los datos, se retorna el sistema al estado en que
estaba al fin de la jornada del martes, con el juego correspondiente, lo que es equivalente a decir
al inicio del miércoles). Si se trata de un error en los datos que se arrastra desde el martes, se
utiliza el respaldo del lunes. Todos los movimientos del martes deben rehacerse. Y así
sucesivamente hacia atrás, si fuera necesario.
Con esta técnica se evita el inconveniente de la técnica de copia doble, siempre y cuando
se detecte el problema antes de volver a usar los mismos juegos. De aquí que se establezca la
cantidad de diferentes lotes a utilizar.
Una buena aplicación, debe proveer información sobre el estado de los datos, para que el
usuario pueda determinar si todo esté bien. Hay aplicaciones que detectan la integridad de los
datos en forma automática. Por lo tanto, no es razonable tener demasiados juegos de respaldo.
Es mejor tener los lotes de juegos de respaldo identificados por letras, haciéndolos
independientes de los días de la semana. Esto permite hacer más de un respaldo por día, si la
cantidad de transacciones hechas lo amerita, como así también no hacer respaldos en los días
que no hubo actividad. Ejemplo: se tienen 4 juegos de respaldo, identificados por A, B, C y D.
Entonces, cada cinta, diskette, o soporte utilizado se identifica por: letra de lote y Nro. ordinal
11
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
dentro del lote (Al, A2, A3, 61, 82, B3, Cl, C2, C3, Dl, D2 y D3, si se requieren como máximo 3
para cada respaldo).
Para utilizar la técnica de respaldo generacional es imprescindible utilizar un cuaderno de
registro de cada respaldo, tal como se explicará en la sección Registro.
Cuándo realizarlo
Para determinar cuando se realiza el respaldo debemos conocer los tiempos incurridos en
desarrollar la tarea y las ventanas de tiempo disponibles en producción (tiempo disponible para
realizar tareas que no afecte a los procesos habituales de procesamiento de datos). Los tiempos
incurridos en desarrollar la tarea varían dependiendo del soporte utilizado (a mayor velocidad de
transferencia menor tiempo incurrido), el tipo de respaldo utilizado (el full back-up es el que lleva
mayor cantidad de tiempo) y la cantidad de datos a respaldar (a mayor cantidad mayor tiempo de
respaldo).
Generalmente, en las empresas, las ventanas de tiempo disponibles durante las semana
son chicas, por lo que se combinan los tipos de respaldo dependiendo del día de la semana. Así,
el fin de semana se realiza un respaldo global y durante la semana se realizan respaldos
incrementales.
Existen momentos en los cuales es necesario realizar respaldos extraordinarios, como ser
nueva instalación de una aplicación, o migración de bases de datos o traslado del equipamiento.
En esta circunstancias deben realizarse un respaldo global, para estar totalmente cubierto.
Periodicidad
Cada cuánto realizar los respaldo dependerá de la cantidad de operaciones realizadas y
las ventanas de tiempo disponibles. Usualmente, y como recomendable, los mismos deben
realizarse diariamente.
Por ejemplo, día a día se hacen respaldos incrementales o diferenciales y una vez por
semana se hacen respaldos completos parciales y una al mes respaldos completos totales.
Siempre estas decisiones dependen del volumen de los datos, del soporte de almacenamiento
disponible, de la velocidad del respaldo, de la importancia de los datos, etc.
Herramientas a utilizar
Hay varias herramientas posibles para respaldo de datos. Algunas son muy simples y
otras son muy sofisticadas. En algunas aplicaciones o DBMS se disponen de programas propios,
guiados por menú, para llevar a cabo estas tareas. En otras, se deben utilizar los comandos del
sistema operativo o programas utilitarios para respaldos. También hay combinación de ambas
situaciones: desde el programa de aplicación se invocan los comandos del sistema operativo u
otro programa.
Se le dará prioridad a la herramienta “nativa” de cada aplicación o DBMS, pues están
especialmente desarrolladas para respaldar de manera adecuada esos datos, pero la decisión
podrá ser utilizar un software especial para respaldo, la decisión final la tomará personal experto.
12
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Dónde guardarlos - distancia y accesibilidad
Muy importante es establecer en qué lugar se deben guardar las copias. Debe ser bajo
llave, con un juego cerca de la computadora y otro fuera del edificio. El juego que está cerca debe
estar accesible y el otro debe ser de acceso restringido. Los respaldos pueden estar sobre una
estantería, al lado de la computadora o bien en una caja fuerte. Según los datos y la aplicación se
establecen las condiciones de almacenamiento.
Tan importante como llevar a cabo los respaldos con regularidad, es el respetar los
criterios de almacenamiento. Intervienen consideraciones del medio ambiente (temperatura,
humedad, polvo, etc.) como así también las personas que tienen acceso al computadora.
Han ocurrido situaciones tan críticas como haber guardado todos los respaldos en áreas
sumamente seguras, tales como en caja fuerte, pero en un lugar tal, que por factores de humedad
quedaron totalmente inutilizados. Sin embargo, la detección de este problema recién se hizo en el
momento en que se necesitó hacer la recuperación. Naturalmente, toda la operativa del sistema
informático se hizo con la certeza de la existencia de los respaldos. Todos los respaldos se
llevaban a cabo regularmente y con sus copias, pero se guardaban en el mismo lugar y sin
verificación del estado de las cintas magnéticas.
Otra aspecto a tener en cuenta es por cuanto tiempo se guardan los respaldos. Es usual
que toda la información que no está en línea se encuentre respaldada, contando con toda la
historia de las operaciones de la empresa. Sin embargo esto no es obligatorio, si debemos
considerar situaciones legales existentes (reglamentaciones que obligan a guardar cierta
información por X tiempo) o potenciales (procesos judiciales).
Quienes realizan y manejan los respaldos
Es fundamental definir qué personas son las encargadas de llevar a cabo los respaldos y
las recuperaciones. No es necesario que sean las mismas personas que hagan los dos procesos.
Inclusive, en ciertas situaciones, por motivos de seguridad, deben ser distintas. Puede haber
varios usuarios que operan la misma aplicación. En estos casos, un subconjunto reducido de ellos,
deben ser los responsables de las tareas de respaldo y recuperación de datos. La recuperación
siempre debería ser llevada a cabo por dos personas, en lugar de una sola, por seguridad.
Verificación del respaldo
Usualmente, la tarea electrónica-mecánica de grabación, requerida en las copias, se lleva
a cabo correctamente. Sin embargo, la única forma de saber que se grabó bien, es volver a leer la
copia grabada y verificar que coincida con lo leído originalmente. Esta verificación insume tiempo
adicional.
Es mejor realizar las verificación en otro computadora, y de manera periódica.
Dependiendo de la cantidad de respaldo y del historial de errores, es posible aplicar muestreo
estadístico para realizar las verificaciones
13
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Registro
Se recomienda llevar un registro de los respaldos que se realizan, así como también las
eventuales recuperaciones. Este registro es una historia de los respaldos y las recuperaciones
llevados a cabo, al cual se agrega toda observación relevante sobre la aplicación, como por
ejemplo, cambios de versiones.
Se sugiere disponer de un registro, el cual consta de las siguientes columnas:
- Fecha (día/mes/año)
- Identificación de operador (por ejemplo, sus iniciales>
- Identificación del juego de respaldo (por ejemplo, por letra)
- Hora de inicio (hora:minuto)
- Hora de finalización (hora:minuto)
- Resultado
- Rúbrica del operador
“Resultado” es cómo finalizó la ejecución: sin observaciones si terminó correctamente, o bien
cuáles anomalías (por ejemplo, cinta con error, corte de luz, etc.) Para cada respaldo se completa
una línea. Para cambios de versión, etc. se hace la anotación, a renglón seguido, en forma
descriptiva y sintética, con fecha. Para la recuperación se indica “RECUPERACION” y se utilizan
dos líneas, para identificar a los dos operadores que realizan el proceso.
Consejos para hacer los respaldos y las recuperaciones
Siguen a continuación los consejos para hacer bien los respaldos, en la frecuencia y forma
que correspondan, y para llevar a cabo satisfactoriamente las recuperaciones, toda vez que sea
necesario. Se los presenta en forma de lista para enfatizarlos:
- Disponer del tiempo suficiente
- No distraerse por ningún concepto
- No hacerlo cuando se esté cansado
- Trabajar ordenado
- Disponer de suficiente cantidad de cintas, diskettes, u otros soportes correctamente rotulados
- Contar con otra persona para las recuperaciones
- Permanecer junto al computadora durante la tarea
- Verificar una vez por año estado correcto del computadora
- Verificar una vez por año lectura/grabación de los respaldos
- Tener acceso a otro computadora de similares características
Instalaciones grandes
En instalaciones de computación de mediano y gran parte (con computadoras
‘mainframes’, minis y micros), tal como oficinas y empresas estatales, instituciones bancarias,
empresas de l00 o más empleados y operarios, etc., deben existir normas y procedimientos
preestablecidos, tanto genéricos como específicos de cada sistema. En dichos centros de
cómputo, las tareas de respaldo son una operación más de las habituales, que estén incorporadas
en las rutinas <diarias, mensuales, etc.).
Por otra parte, en general, las aplicaciones grandes poseen por sí mismas duplicaciones
de las transacciones, de los archivos maestros, etc. que facilitan la eventual recuperación de
14
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
datos. Por ejemplo, los sistemas de reserva de pasajes aéreos tienen la información duplicada en
varias computadoras en lugares distintos Eventuales fallas son detectadas y corregidas
instantáneamente, siendo transparentes a los operadores.
SISTEMAS TOLERANTES A FALLAS EN RED DE COMPUTADORAS
La utilización de una computadora en red presenta importantes ventajas, tales como el
acceso común a: grandes memorias auxiliares, impresoras y otros periféricos, cuyos costos
justifican el compartirlos entre múltiples usuarios, o bien la aplicación requiere el acceso a bases
de datos únicas.
Con los sistemas de red tolerantes a fallas (SFT - System Fault Tolerant) se reduce la
frecuencia de los respaldos necesarios, gracias a las rutinas automáticas y transparentes al
usuario, que ya estén incorporadas en el producto base.
Discos espejados
Gracias al uso de las redes de microcomputadoras existe la posibilidad de utilizar las
facilidades del ejemplo precedente en los PC. Existen sistemas operativos administradores de
redes, tales como el NETWARE SFT (de NOVELL) y Windows NT, que proveen las rutinas
necesarias para mantener copia de los archivos (por ejemplo “disco espejo”). Puede continuar el
procesamiento en el disco alternativo si se produce una falla en el original. Estas rutinas pueden
ser en varias modalidades, que tienen diferentes requerimientos y costos. Estos sistemas utilizan
dos discos iguales en el mismo Servidor. En forma automática los datos son duplicados en ambos
discos. En caso de falla de uno de ellos, se continua la operativa con el otro disco. Esta técnica
esta basada en que la probabilidad de que dos discos se dañen al mismo tiempo es muy baja
Servidor duplicado
Otra técnica para aplicaciones críticas llamada ‘servidor duplicado”, consiste en tener dos
equipos similares como servidores. Los datos son grabados automáticamente en los dos equipos.
Este método es más seguro que el utilizar un solo equipo con dos discos, ya que en el primer caso
si falla el computadora, haciendo que este deje de funcionar, a pesar de que los datos estén bien,
no es posible acceder a ellos. En el caso de dos computadoras, todo esta duplicado. Esto es más
seguro, pero tiene el inconveniente de su alto costo, y de que los datos son grabados en dos
equipos, por lo que se degrada la performance de la red.
Sin embargo, en aplicaciones críticas es lo más recomendable, además de hacer copias
periódicas en soportes removibles.
Sistemas de discos tolerante a fallos
Existen sistemas de almacenamiento en disco magnético, por ejemplo en tres unidades,
que tienen un hardware especial de tal manera que son capaces de recuperar los datos si una de
las unidades se descompone. Este sistema consiste en grabar los datos en varias unidades, con
mínima redundancia, de tal manera que si llega a fallar uno de los tres discos, con los otros dos
igual se tienen disponibles todos los datos.
15
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
Este sistema es mucho más eficiente que el disco espejado, pues no se graban todos los
datos dos veces. A su vez, su costo es mayor.
Otros sistemas de autorespaldo
Existen otros sistemas de almacenamiento de datos que disponen de recursos tales que
guardan cierta redundancia (repetición) de los datos. Son capaces de seguir funcionando en la
eventualidad que una parte de sus recursos deje de operar. No es el propósito de este texto
profundizar en estos sistemas, que son sofisticados, muy seguros y de costo importante. Lo que
se necesita saber es que existen y se utilizan en instalaciones de porte mediano en adelante.
De todos modos, estos sistemas de almacenamiento con autorespaldo necesitan de los
procedimientos de respaldo explicados antes, para salvaguardar los datos, ya que si bien son
capaces de funcionar con cierto nivel de falla, no están exentos de eventual falla múltiple o total.
PLANES DE CONTINGENCIA
Un aspecto muy importante, que se menciona en último lugar en este texto, precisamente
por su importancia, es que, en toda instalación informática deberían existir planes de contingencia
que especifican claramente qué hacer frente a una situación crítica (desastres naturales,
atentados, etc.)
Gracias a estos planes, las personas saben qué deben hacer, y logran superar las
situaciones. Los procedimientos de respaldo y recuperación que son la base de este documento,
solamente son una parte del plan de contingencia. El plan se complementa con todos los
procedimientos necesarios para volver a la empresa operativa ante cualquier desastre (como
ejemplo reciente está el incendio en UTE, donde gracias a contar con un plan de contingencia la
empresa pudo seguir operando).
Estos planes incluyen alternativas para continuar funcionando el negocio, el organismo o
la institución de que se trate. Puede incluir lugares alternativos de procesamiento, en otra
empresa, dentro o fuera del país, rutinas iguales o diferentes de procesamiento, subsistemas
básicos, etc.
Es frecuente que no existan planes de contingencia y entonces ante una falla no prevista,
los funcionarios no saben qué hacer, desconocen los procedimientos que deben ejecutar y la
situación problemática se vuelve más grave, ya que a la tensión existente se agregan errores de
operación, por falta de especificaciones.
Gracias al problema Y2K – compatibilidad de los sistemas informáticos y de las
computadoras en el manejo de la fecha con 4 dígitos, se ha tomado conciencia respecto a planes
de contingencia.
Es fundamental que exista para todo sistema informático un plan de contingencia que
especifica qué hacer en caso de ocurrir un problema grave.
16
Introducción a la Computación
Computación aplicada a Contabilidad, Administración y Economía
RESPALDO Y RECUPERACIÓN DE DATOS
17
Descargar