Continuidad del Negocio y Recuperación de Desastres 1.- Introducción La planificación de la continuidad del negocio BCP y la planificación de la contingencia para los sistemas de información son elementos de un sistema de control interno que se establece para gestionar la disponibilidad de los procesos críticos en el caso de una interrupción. La parte más importante de ese plan trata con el soporte rentable del sistema de información. La disponibilidad de los datos del negocio es vital para el desarrollo sostenible y/o incluso para la supervivencia de cualquier organización. La BCP es un proceso continuo más que un proyecto. Los planes que el planificador desarrolla como parte de este proceso dirigirán la respuesta a incidentes desde simples emergencias hasta desastres totales. La meta última del proceso es poder responder a incidentes que puedan impactar en la gente, las operaciones y la capacidad de entregar bienes y servicios al mercado. Esta área presenta una visión general de los principios de continuidad del negocio y recuperación de desastres y específicamente las siguientes áreas: - Los procesos de BCP y planeación de recuperación ante desastres DRP. - Análisis de impacto al negocio BIA. - Estrategias y Alternativas de Recuperación. - Pruebas de Plan. - Respaldo y Restauración. - Consideraciones de Auditoría. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 1 2.- Relación de las tareas con los conocimientos relacionados Las tareas son lo que se espera que el candidato CISA sepa cómo hacer. Los conocimientos relacionados delinean lo que se espera que el candidato CISA sepa para realizar las tareas. 3.- Plan de la Continuidad del Negocio/ Recuperación de Desastres (BCP/DRP) BCP es un proceso diseñado para reducir el riesgo del negocio de la organización que surja de una interrupción no esperada de las funciones/operaciones críticas (manuales o automáticas) necesarias para la supervivencia de la misma. Esto incluye recursos humanos/materiales que soportan estas funciones/operaciones críticas y garantía de la continuidad de por lo menos el nivel mínimo de los servicios necesarios para al menos las operaciones críticas. El primer enfoque para afrontar cualquier riesgo debe ser eliminar la amenaza considerando las ubicaciones de negocios materiales para la construcción y la duplicación de funciones clave en ubicaciones remotas. Un objetivo realista es asegurar la supervivencia de una organización estableciendo una cultura que identificará y gestionará esos riesgos que podrían causarle que sufra. Algunos ejemplos de estos riesgos corporativos incluyen: -Incapacidad de mantener los servicios críticos al cliente. - Daño en la participación de mercado, la imagen, reputación o marca. - No poder proteger los activos de la compañía, incluyendo propiedad intelectual y personal. - Falla de control de negocio. - No poder cumplir los requerimientos legales o regulatorios. El objetivo de la Continuidad del Negocio/ Recuperación ante Desastres es permitir que un negocio continúe brindando sus servicios críticos en caso de una interrupción y que pueda sobrevivir a una interrupción desastrosa de sus sistemas de información. Es necesaria una Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 2 planificación rigurosa y una asignación de recursos para planear adecuadamente para un evento semejante. Lo primero que hay que hacer para desarrollar un BCP es identificar los procesos de negocio de importancia estratégica, que son los procesos clave que son responsables tanto del crecimiento permanente del negocio como del cumplimiento de las metas del negocio. Idealmente el BCP/DRP debe ser respaldado por una política ejecutiva formal que establezca el objetivo general de la organización y asigna poder a las personas que están involucradas en el desarrollo, prueba y mantenimiento del plan. Teniendo presente los procesos clave, el proceso de gestión de riesgos debe comenzar con una valoración de riesgos. El riesgo es directamente proporcional al impacto a la organización y la probabilidad de que ocurra la amenaza percibida. El resultado de la valoración de riesgos debe ser la identificación de lo siguiente: - Aquellos recursos humanos, datos, elementos de infraestructura y otros recursos, incluyendo aquellos suministrados por terceros que soportan los procesos clave. - Una lista de las vulnerabilidades potenciales, los peligros o amenazas a la organización. - La probabilidad estimada de que ocurran estas amenazas. La parte de operaciones del BCP debe tratar todas las funciones y activos requeridos para continuar como una organización viable. Aprovisionar al negocio con instalaciones externas, algo que debería ser perseguido, es en última instancia una decisión de negocio basada en la gestión de riesgos. El centro de atención está en la disponibilidad de los procesos clave del negocio para continuar operaciones si surgiera algún tipo de interrupción. BCP es principalmente una responsabilidad de alta dirección, ya que ella es la encargada de salvaguardar tanto los activos como la viabilidad de la organización, como se define en la política de BCP/DRP. El BCP es generalmente ejecutad0Ppor las unidades de negocio y de soporte por igual, para proveer un nivel reducido pero suficiente de funcionalidad de las operaciones del negocio, inmediatamente después de que se Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 3 produzca una interrupción, mientras se está llevando a cabo la recuperación. Este plan debe tratar todas las funciones y los activos que se requieren para continuar como una organización viable. Esto incluye los procedimientos de continuidad calificados como necesarios para sobrevivir y para minimizar las consecuencias de la interrupción del negocio. El BCP toma en consideración: Las operaciones críticas que son más necesarias para la supervivencia de la organización. Los recursos humanos/material que las soportan. Además del plan de continuidad de las operaciones, el BCP incluye: - El DRP que se usa para recuperar una instalación que se tornó inoperable, incluyendo la reubicación de las operaciones en un nuevo lugar. - El plan de restauración que se usa para regresar las operaciones a la normalidad, ya sea en una instalación recuperada o en una nueva. Dependiendo de la complejidad de la organización, podría haber uno o más planes para tratar los diversos aspectos de la continuidad del negocio y recuperación ante desastres. Estos planes no tienen necesariamente que ser integrados en un solo plan. Sin embargo, cada uno tiene que ser consiente con otros planes para tener una estrategia viable de BCP. Es aconsejable tener un plan integrado para asegurar que: - Todos los aspectos se cubran. - Todos los recursos comprometidos se utilicen de la manera más efectiva y existía la confianza de que, a través de su aplicación, la organización sobreviva a una interrupción. 4.- Planeación de la continuidad del negocio/ recuperación ante desastres de SI Para el caso de la planeación de continuidad del negocio de SI, el método es el mismo que en BCP, con la diferencia de que este caso los sistemas de procesamiento de SI están Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 4 amenazados. El procesamiento de SI es de importancia estratégica. Es un componente crítico ya que la mayoría de los procesos clave del negocio depende de la disponibilidad de sistemas clave y componente de infraestructura. La planeación de la continuidad del negocio/recuperación ante desastres de SI es un componente importante de la estrategia general de continuidad del negocio y recuperación ante desastres de una organización. Por lo tanto, debería haber una instalación reservada y lista para soportar estas operaciones clave en caso de una interrupción en que el negocio no pudiera funcionar sin el procesamiento continuo de información. En caso de que fuera un plan respaldo, el plan de SI deberá ser consistente con y soportar el BCP corporativo. El plan de continuidad del negocio del SI debe también estar alineado con la estrategia de la organización. De ese modo, la clasificación con respecto a la criticidad de los diversos sistemas de aplicación desplegados en la organización depende de la naturaleza del negocio así como también del valor de cada aplicación del negocio. Una vez que la valoración de riesgos identifica el valor de los componentes de SI para la organización, se puede desarrollar un plan para establecer la criticidad de los sistemas y los métodos más apropiados para la restauración. Un plan de continuidad del negocio de SI es mucho más que sólo un plan para los sistemas de información. Un BCP identifica lo que el negocio hará en el caso de un desastre. Un subcomponente del plan de continuidad del negocio es el plan de recuperación ante desastres de TI. Éste, típicamente detalla el proceso que el personal de TI utilizará para restablecer los sistemas de cómputo. Los DRPs pueden estar incluidos en el BCP como un documento completamente separado, dependiendo de las necesidades del negocio. No todos los sistemas requerirán de una estrategia de recuperación. Basada en los resultados del análisis de riesgo, la gerencia puede no ver una relación costo-beneficio favorable para restablecer ciertas aplicaciones en el caso de un desastre. Un factor que se debe tener siempre presente para determinar las opciones de recuperación es que el costo nunca debe exceder el beneficio. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 5 La calidad de los elementos de SI es esencial para la recuperación ante desastres de SI. Por lo tanto, se recomienda que la organización implemente un sistema de gestión de seguridad de la información para mantener la integridad, confidencialidad y disponibilidad de SI. 5. Desastres y otras interrupciones Los desastres son interrupciones que ocasionan que los recursos críticos de información queden inoperantes por un período de tiempo, impactando adversamente las operaciones organizacionales. La interrupción podría durar desde varios minutos hasta algunos meses, dependiendo de la extensión de daño a los recursos de información. Más importante aún, los desastres requieren esfuerzos de recuperación para restaurar el estado operativo. Un desastre puede ser causado por calamidades naturales, como por ejemplo, terremotos, inundaciones, tornados, tormentas eléctricas severas, incendios, etc. los cuales causan daños importantes a las instalaciones de procesamiento y a la localidad en general. Otros eventos desastrosos que causan interrupciones pueden ocurrir cuando los servicios esperados ya no son proporcionados a la compañía, por ejemplo, el suministro de energía eléctrica, las telecomunicaciones, el suministro de gas natural u otros servicios provistos por externos (que pueden o no estar relacionados con un desastre natural). Un desastre podría también ser causado por eventos precipitados por seres humanos tales como ataques terroristas, de hackers, virus o error humano. No todas las interrupciones críticas del servicio son causadas por un desastre. Por ejemplo, la interrupción del servicio es causada a veces por mal funcionamiento del sistema, eliminación accidental de archivos, ataques de negación de servicio (DoS), intrusiones y virus. Un buen plan de continuidad del negocio tomará en cuenta todos los tipos de acontecimientos que impacten tanto en las instalaciones de procesamiento de los sistemas de información críticos como las funciones organizacionales normales de operación del usuario final. Para escenarios de peor caso, se requieren estrategias de marcha atrás de corto y largo plazo. Para el corto plazo, se puede necesitar una Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 6 instalación del procesamiento alterno para satisfacer las necesidades operativas inmediatas, como en el caso de un desastre natural mayor. En el largo plazo, para recuperación ante desastres, se debe considerar una nueva instalación permanente, equipada para proveer la continuidad del servicio de procesamiento de los sistemas de información de manera regular. Tratando con Daños a la Imagen, la Reputación o la Marca Los rumores dañinos pueden surgir de muchas fuentes (incluso internas). Pueden o no estar asociados con un incidente serio o con una crisis. Una de las peores consecuencias de las crisis es la pérdida de la confianza. Toda organización que experimente un incidente mayor deberá considerar y aplicar algunas mejoras prácticas básicas. Independiente de las consecuencias de un incidente (demora o interrupción del servicio, pérdidas económicas, etc.), de darse alguno, cualquier opinión pública o rumores negativos pueden ser muy costosos. Reaccionar de manera apropiada en público (o para con los medios) durante una crisis no es sencillo. Se debe nombrar y preparar de antemano un portavoz debidamente entrenado. Normalmente, el asesor legal o un director de relaciones públicas es la mejor elección. Nadie, independientemente de su rango en la jerarquía de la organización, con excepción del portavoz, debe hacer declaraciones públicas. 6. Proceso de planificación de continuidad del negocio El proceso de BCP puede dividirse en las etapas del ciclo de vida siguientes: Creación de una política de continuidad del negocio. BIA. Análisis de Impacto del negocio. Clasificación de las operaciones y análisis de criticidad. Identificación de los procesos de SI que soportan funciones organizacionales críticas. Desarrollo de un BCP y procedimientos de recuperación ante desastres de SI. Desarrollo de procedimientos de reanudación. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 7 Programa de capacitación y concientización. Prueba e implementación del plan. Monitoreo. 7. Política de continuidad del negocio Una política de continuidad del negocio debe ser proactiva y abarcar controles preventivos, de detección y correctivos. El BCP es el control correctivo más crítico. Depende de que otros controles sean efectivos, en particular la gestión de incidentes y respaldo de medios. 8. Gestión de incidentes dentro de la planeación de continuidad del negocio Los incidentes y crisis son dinámicos por naturaleza. Evolucionan, cambian con el tiempo y las circunstancias, y a menudo son rápidos e imprevisibles. Dependiendo de una estimación del nivel de daños resultantes a la organización, todos los tipos de incidentes deben ser clasificados. Un sistema de clasificación podría incluir las siguientes categorías: sin importancia, menor, mayor y crisis. La clasificación puede cambiar dinámicamente mientras se resuelve el incidente. Estos niveles pueden describirse como sigue: Incidentes sin importancia son los que no causan daños perceptibles o significativos, como por ejemplo, caídas del sistema operativo (OS) muy breves con recuperación total de la información o cortes de energía momentáneos con respaldo de suministro ininterrumpido de energía (UPS). Eventos menores, son los que, aunque no insignificantes, no producen un impacto material (de relativa importancia) o financiero negativo. Incidentes mayores que causan un impacto material negativo sobre los procesos de negocio y pueden afectar otros sistemas, departamentos o incluso clientes externos. La crisis es un incidente mayor que puede tener un impacto material (de relativa importancia) serio sobre el funcionamiento continuo del negocio y que puede también Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 8 tener un impacto adverso sobre otros sistemas o terceros. La seriedad de ellos depende de la industria y de las circunstancias, pero la severidad es generalmente directamente proporcional al tiempo transcurrido desde el inicio del incidente hasta su resolución. En general el criterio principal para la severidad (nivel) de los incidentes es el tiempo sin servicio. Otros criterios pueden incluir el impacto sobre los datos o sobre las plataformas. El servicio puede definirse como la inclusión de compromisos con clientes que pueden ser tanto clientes externos como departamentos internos. En la mayoría de los ambientes, la severidad es proporcional al tiempo improductivo. Otros criterios pueden incluir el impacto sobre los datos o sobre las plataformas 9.- Análisis del impacto al negocio El BIA es un paso crítico para desarrollar el BCP. Esta etapa implica identificar los diversos eventos que podrían tener un impacto sobre la continuidad de las operaciones y su impacto financiero, humano, legal y de reputación sobre la organización. Se debe establecer la criticidad de los recursos de información de: Sistemas. Datos. Redes. Software de sistemas. Instalaciones. Hay diferentes métodos para efectuar un análisis del impacto sobre el negocio (BIA). Uno de los más populares es el método del cuestionario. Este enfoque implica desarrollar un cuestionario detallado y circularlo a los usuarios clave tanto en las áreas de TI como de los usuarios finales. La información recopilada es tabulada y analizada. Otro método popular es entrevistar a grupos de usuarios clave. La información recopilada durante estas sesiones de entrevistas es tabulada y analizada para desarrollar un plan y una estrategia detallada de BIA. Un tercer método es reunir al personal de TI y usuarios Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 9 relevantes para llegar a una conclusión respecto al impacto potencial sobre el negocio de diversos niveles de interrupción. Los auditores de SI deben analizar el volumen de transacciones pasadas para determinar el impacto sobre el negocio si el sistema no estuviera disponible por un período prolongado de tiempo. Las tres principales preguntas que deben ser consideradas durante la etapa de BIA incluyen las siguientes: 1.- ¿Cuáles son los diferentes procesos de negocio? 2.- ¿Cuáles son los recursos de información críticos relacionados con los procesos críticos del negocio de la organización? Recepción de pagos. Producción. Pago de empleados. Publicidad. Despacho de productos terminados. Cumplimiento de leyes y regulaciones. 3.- ¿cuál es el período crítico de tiempo de recuperación para los recursos de información en el cual se debe restablecer el procesamiento del negocio antes de que se experimenten las pérdidas significativas o inaceptables? Para tomar esta decisión, hay dos factores independientes de costo a considerar: uno es el costo de tiempo producto del desastre, cuyo componente principal se deriva del tiempo improductivo y de la falta de servicio. El otro factor es el costo de las estrategias de corrección alternativas (la activación del BCP), que disminuye con el objetivo escogido para el tiempo de recuperación. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 10 Al identificar estos costos, se suman los costos totales (interrupciones y recuperación) donde una organización querrían encontrar el punto en el cual el costo total minimizado. Cada estrategia posible tiene un costo fijo (es decir, no cambia con el tiempo). Tenga en cuenta que el costo fijo de cada estrategia posible puede ser diferente, normalmente, cuanto más es el tiempo de recuperación que se pretende, más elevado será el costo fijo. La organización paga por la estrategia, aún si no ocurriera ningún accidente. Si hubiera un accidente, los costos variables aumentarán de manera significativa (por ejemplo, su contrato de “warm site” puede proveer un costo anual fijo más un costo diario de ocupación efectiva) debido a la necesidad del personal adicional, horas adicionales, transporte adicional y otra logística (por ejemplo, viáticos diarios, nuevas líneas de comunicación). Clasificación de las operaciones y análisis de la criticidad Clasificació Dn Crítico Descripción Estas funciones no pueden realizarse a menos que sean reemplazadas por capacidades idénticas. Las aplicaciones críticas no pueden ser reemplazadas por métodos manuales. La tolerancia a la interrupción es muy baja. Por lo tanto, el costo de interrupción es muy alto. Vital Estas funciones pueden realizarse manualmente por sólo por un período breve de tiempo. Hay mayor tolerancia a la interrupción que con los sistemas críticos, por lo tanto, los costos de interrupción son un poco más bajos considerando que las funciones son restauradas dentro de un marco de tiempo determinado (por lo general 5 días o menos). Sensible Estas funciones se pueden realizar manualmente, a un costo tolerable y por un período prolongado de tiempo. Aun cuando se pueden realizar manualmente, por lo general es un proceso difícil y requiere de personal adicional para Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 11 llevarlas a cabo. No Sensible Estas funciones pueden ser interrumpidas por un período prolongado de tiempo, a un costo muy pequeño o nulo para la compañía que requiere de poco o ningún esfuerzo para ponerse al día cuando son restauradas. La etapa siguiente en la gestión de la continuidad es identificar las diversas estrategias de recuperación y las alternativas disponibles para recuperarse de una interrupción y/o un desastre. 10.- Punto de recuperación objetivo y tiempo de recuperación objetivo El RPO se determina sobre la base de la pérdida de datos aceptable en caso de una interrupción de operaciones. Ello indica el punto más anticipado en el tiempo al cual es aceptable recuperar los datos. Por ejemplo, si el proceso puede permitirse perder los datos hasta cuatro horas antes del desastre, entonces la última copia de respaldo debería ser hasta cuatro horas antes del desastre o de la interrupción y por tanto, las transacciones durante RPO y la interrupción deberán ser ingresadas después de la recuperación (conocido como “catch-up data” o puesta al día de los datos). RPO cuantifica efectivamente la cantidad permitida de pérdida de datos en el caso de interrupción. Es casi imposible recuperar la totalidad de los datos. Incluso después de ingresar los datos faltantes, algunos todavía se perderán y a ellos se hace referencia como datos huérfanos. El RTO (tiempo objetivo de recuperación) se determina sobre la base del tiempo de inactividad aceptable en caso de una interrupción de operaciones. Ello indica el punto más anticipado en el tiempo en el que las operaciones de negocio deben retomarse después del desastre. La siguiente figura, muestra la relación entre RTO y RPO. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 12 Cuanto más bajo sea el tiempo de recuperación requerido, más elevado será el costo de las estrategias de recuperación, es decir, si el RPO está en minutos (pérdida de datos aceptable más baja posible), entonces el MIRROGING o la duplicación de datos debe implementarse como la estrategia de recuperación. Si el RTO es menor, entonces el sitio alternativo podría preferirse a un contrato de hot site. Además de RTO y RPO, existen algunos parámetros que son importantes para definir las estrategias de recuperación. Estos incluyen: Ventana de Interrupción: El tiempo que una organización puede esperar, desde el punto de falla, hasta la restauración de servicios/aplicaciones críticas. Después de ese tiempo, las pérdidas progresivas causadas por la interrupción no son aceptables. Objetivo de prestación de servicios (SDO): El nivel de servicios a proveer durante el modo de proceso alterno, hasta que se restaure la situación normal. Esto está directamente relacionado con las necesidades del negocio. Cortes máximos tolerables: El tiempo máximo que la organización puede soportar procesar en modo alterno. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 13 11.- Estrategias de Recuperación Una estrategia de recuperación identifica la mejor forma de recuperar un sistema en caso de interrupción, incluyendo desastre y provee orientación basada en qué procedimientos detallados de recuperación se pueden desarrollar. La estrategia apropiada es la que tiene un costo para un tiempo aceptable de recuperación que también es razonable con el impacto y la probabilidad de ocurrencia. Las acciones más efectivas serían: - Eliminar la amenaza completamente. - Minimizar la probabilidad y el efecto de la ocurrencia. Una estrategia de recuperación es una combinación de medidas preventivas, detectivas y correctivas. La selección de una estrategia de recuperación dependería de: - La criticidad del proceso del negocio y las aplicaciones que soportan los procesos. - Costo. - El tiempo requerido para recuperarse. - Seguridad. En general, cada plataforma TI en la que corra una aplicación que soporte una función crítica del negocio necesitará una estrategia de recuperación. Lo que se trata es de firmar un acuerdo con otra organización que tenga equipos y sistemas similares. Lo que se transa son horas de procesamiento. Ventajas: - Bajo Costo. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 14 - Recuperación rápida. Desventajas: - Por lo general no son obligatorias. - Política divergente debido a que las organizaciones difieren en procedimientos, personal y habilidades. - Puede que las instalaciones no estén disponibles cuando se desean. 12.- Alternativas de Recuperación Las interrupciones más prolongadas y más costosas, en particular los desastres que afectan la instalación física primaria, requieren alternativas de recuperación en un sitio distinto a la ubicación primaria (offsite). Los tipos de instalaciones de respaldo de hardware en sitio alternativo que existen son: Hot Sites: Se configuran totalmente y están listos para operar dentro de varias horas. El equipo, red y software del sistema deben ser compatibles con la instalación primaria que está siendo respaldada. Las únicas necesidades adicionales son personal, programas, archivos de datos y documentación. Los costos asociados con el uso de un hot site de terceros por lo general son elevados, pero más bajos que crear un sitio redundante y con frecuencia son costos justificables para aplicaciones críticas. El hot site está destinado para operaciones de emergencia durante un período limitado de tiempo y no para uso prolongado. Warm Sites: Están parcialmente configurados, por lo general con conexiones de red y equipo periférico seleccionado, como por ejemplo, unidades de discos y otros controladores, pero sin la computadora principal. Algunas veces un warm site está equipado con una CPU menos potente que la que se usa generalmente. El supuesto detrás del concepto warm site es que la computadora puede por lo general obtenerse rápidamente para una instalación de emergencia y como la Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 15 computadora es la unidad más cara, dicho acuerdo es menos costoso que un hot site. Cold Sites. Instalaciones de Procesamiento de Información Duplicadas. Sitios móviles: Especie de “remolque” especialmente diseñado para ser transportado rápidamente a un lugar de negocio o a un sitio alterno para proveer una instalación acondicionada y lista para el procesamiento de información. Acuerdos recíprocos con otras organizaciones: Este es un método usado con menos frecuencia entre dos o más organizaciones con equipos o aplicaciones similares. Bajo el acuerdo típico, los participantes prometen proveerse mutuamente tiempos de computadoras cuando surja una emergencia. 13.- Disposiciones contractuales Configuraciones: ¿Son las configuraciones de hardware y software adecuadas para satisfacer las necesidades de la compañía, a medida que éstas varían con el tiempo? Desastre: ¿Es la definición de desastre lo suficientemente amplia para satisfacer las necesidades anticipadamente? Velocidad de disponibilidad: ¿Con qué rapidez después de un desastre estarán disponibles las instalaciones? Suscripciones por sitio: ¿El contrato limita el número de suscriptores por sitio? Suscriptores por área: ¿El contrato limita el número de suscriptores en un edificio o área? Preferencia: ¿Quién obtiene preferencia si hay desastres comunes o regionales? ¿Existe copia de respaldo para instalaciones de respaldo? ¿Es el uso de la instalación exclusivo o el cliente tiene que compartir el espacio disponible si múltiples Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 16 clientes declaran desastres de manera simultánea? ¿Tiene el proveedor más de una instalación disponible para el uso del suscriptor? Períodos de uso: ¿Cuánto tiempo está disponible la instalación para su uso? ¿Es este período adecuado? ¿Qué soporte técnico proveerá el operador del sitio? ¿Es adecuado? Comunicaciones: ¿Son las comunicaciones adecuadas? ¿Son suficientes las conexiones de comunicación con el sitio de respaldo, permitirá la comunicación ilimitada si fuera necesario? Garantías: ¿Qué garantías dará el proveedor respecto a la disponibilidad del sitio y lo adecuado de las instalaciones? ¿Hay limitaciones de responsabilidad y está la compañía dispuesta a vivir con éstas? Auditoría: ¿Hay una cláusula de derecho a auditar, que permite la auditoría del sitio para evaluar la seguridad física y ambiental? Pruebas: ¿Qué derechos de prueba están incluidos en el contrato? Verificar con la compañía de seguros para determinar cualquier reducción de primas que puedan obtenerse debido a la disponibilidad del lugar de respaldo. Confiabilidad: El proveedor debe poder dar fe de la confiabilidad del o de los sitios que se están ofreciendo. Idealmente, el proveedor debe tener una UPS, suscriptores limitados, una gestión técnica adecuada garantías de compatibilidad de hardware y software. 14.- Obtención de Hardware Alternativo Hay varias alternativas disponibles para asegurar el hardware y las instalaciones físicas de respaldo, incluyendo: Un proveedor o tercero: Los proveedores de hardware son por lo general, la mejor fuente para el reemplazo de equipo. Sin embargo, esto implica a menudo un período de espera que no es aceptable para las operaciones críticas. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 17 Fuera de inventario: Dichos componentes están rápidamente a disposición provenientes del inventario de los proveedores, previo aviso, no muy anticipado, y con una necesidad mínima de acuerdos especiales. Contrato de crédito o tarjetas de crédito de emergencia: Asegurar los planes de recuperación incluye instrucciones sobre cómo se va a pagar dicho equipo. Dado que se requieren datos y software para estas estrategias, es necesario considerar acuerdos especiales para su respaldo en medios removibles y para su almacenamiento seguro y a salvo fuera del sitio. Adicionalmente, parte de la recuperación de las instalaciones de TI involucrarán las telecomunicaciones, para las cuales las estrategias que se consideran usualmente incluyen: Prevención de desastres en red: -Direccionamiento alternativo. - Direccionamiento diversificado. - Diversidad de red de largo alcance. - Protección del loop local. - Recuperación de voz. - Disponibilidad de circuitos apropiados y ancho de banda adecuado. Planes de recuperación ante desastres de servidor. Habiendo desarrollado una estrategia para la recuperación de las instalaciones de TI, suficiente para soportar los procesos críticos del negocio, es esencial que las estrategias para estas actividades puedan funcionar hasta que todas las instalaciones sean restauradas. Por lo tanto pueden incluir: No hacer nada hasta que las instalaciones de recuperación estén listas. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 18 Usar los procedimientos manuales. Cumplir solamente con los requerimientos regulatorios y legales. Concentrarse en los clientes, proveedores, productos, sistemas, etc. más importantes. Usar sistemas basados en PC para capturar datos para realizar procesamiento local simple. 15.- Desarrollo de planes de continuidad del negocio y recuperación de desastres Basado en la información recibida del BIA, el análisis de criticidad y la estrategia de recuperación seleccionada por la gerencia, se debe desarrollar o revisar un plan detallado de continuidad del negocio y recuperación ante desastres. Los diversos factores que se deben considerar mientras se desarrolla/ revisa el plan son: - Estar preparado antes de un desastre cubriendo el manejo de respuestas a incidentes para tratar todos los incidentes que afecten los procesos del negocio. - Procedimientos de evacuación. - Procedimientos para declarar un desastre. - Las circunstancias bajo las cuales se debe declarar un desastre. Todas las interrupciones no son desastres, pero un pequeño incidente, si no es tratado a su debido tiempo o de manera apropiada, puede conducir a un desastre. Por ejemplo, un ataque de virus no reconocido y contenido a tiempo puede hacer colapsar toda la instalación de TI. - La clara identificación de las responsabilidades en el plan. - La clara identificación de información de los contratos. - La explicación paso por paso de la opción de recuperación. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 19 - La clara identificación de los diversos recursos requeridos para la recuperación y operación continua de la organización. El plan debe estar documentado y escrito en un lenguaje sencillo y comprensible para todos. 16.- Organización y Asignación de Responsabilidades El plan debe identificar los equipos con sus responsabilidades asignadas en el caso de un incidente / desastre. Para implementar las estrategias que se han desarrollado para la recuperación del negocio, se debe identificar el personal de tomas de decisiones de SI y del usuario final. Es una buena idea desarrollar una matriz sobre la correlación entre los equipos que se necesitan para participar y el esfuerzo de recuperación/ nivel de interrupción estimado. Los equipos de recuperación/ continuidad/ respuesta pueden incluir cualquiera de los siguientes: - Equipo de respuesta a incidentes. - Equipo de acción de emergencia. - Equipo de evaluación de daños. - Equipo de administración de la emergencia. - Equipo de almacenamiento de offsite. - Equipo del software. - Equipo de las aplicaciones. - Equipo de seguridad. - Equipo de operaciones de emergencia. - Equipo de recuperación de la red. - Equipo de comunicaciones. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 20 - Equipo de transportes. - Equipo de hardware de usuario. - Equipo de preparación de datos y registros. - Equipo de soporte administrativo. - Equipo de suministros. - Equipo de salvamento. - Equipo de reubicación. - Equipo de coordinación. - Equipo de asuntos legales. - Equipo de prueba de recuperación. - Equipo de entrenamiento. Equipo de Administración de Emergencia: coordina las actividades de todos los otros equipos de recuperación. Este equipo se encarga de: - Recuperar los datos críticos y vitales desde el sitio de almacenamiento alterno. - Instalar y comprobar el software del sistema y las aplicaciones en el lugar de recuperación. - Identificar, comprar e instalar el hardware en el lugar de recuperación del sistema. - Operar desde el lugar de recuperación del sistema. - Redireccionar el tráfico de comunicaciones de red. - Restablecer la red de usuario/ sistema. - Transportar a los usuarios a la instalación de recuperación. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 21 - Reconstruir bases de datos. - Suministrar los artículos de oficina necesarios, tales como, formularios especiales, inventario de cheques, papel. - Hacer los arreglos y pagar por los gastos de reubicación de los empleados en el sitio de recuperación. 17.- Otros aspectos a tener en cuenta en el desarrollo del plan La participación de la gerencia es vital para el éxito del BCP. Es esencial para la identificación de los sistemas, sus tiempos críticos de recuperación asociados y recursos que necesita para la recuperación. Las tres divisiones principales que requieren participación en la formulación del BCP son los servicios de soporte, las operaciones del negocio y el soporte de procesamiento de información. La organización completa necesita ser considerada para el BCP y no solamente el personal TI. Cuando el plan se formule, se deben incluir los siguientes puntos: Una lista del personal, con información de contacto, requerido para mantener las funciones críticas del negocio en el corto, mediano y largo plazo. La configuración de las instalaciones físicas, escritorios, sillas, teléfonos etc. que se requieren para mantener las funciones críticas del negocio, en el corto, mediano y largo plazo. Es decir, componentes de un BCP: - Personal clave para la toma de decisiones (árbol de llamadas y directorios). Es un directorio telefónico de las personas que deben ser notificadas en caso de un desastre o de una catástrofe. - Respaldo de los suministros requeridos (base de datos, sistemas operativos, etc.). se deben considerar todos los suministros necesarios para la continuidad Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 22 de las actividades normales del negocio durante el proceso de recuperación. Procedimientos, formularios y todos los documentos que se requieran. - Métodos de recuperación de desastre de las redes de telecomunicaciones. - Arreglo redundante de discos independientes. - Seguros. Propósito y Alcance de los Componentes del BCP Plan Propósito Alcance Plan de continuidad Procedimientos para sostener las Se ocupa de los procesos del del negocio BCP. operaciones esenciales del negocio negocio; dirigido a TI basado mientras éste se recupera de una únicamente como soporte para interrupción significativa. Plan de recuperación Proveer o recuperar reanudación del negocio. BRP procedimientos las operaciones los procesos de negocio. para Se ocupa de los procesos de del negocio; no se enfoca en TI; negocio inmediatamente después dirigido a TI basado únicamente de un desastre. como soporte para los procesos de negocio. Plan de continuidad de las Proveer operaciones capacidades COOP procedimientos para sostener y Se ocupa del subconjunto de las las misiones de una funciones estratégicas esenciales de organización que se consideran una organización en un sitio alterno más críticas; por lo general se hasta por 30 días. escribe a nivel de las oficinas centrales; no está enfocado en TI. Para las fases de planeación, implementación y evaluación del BCP se debe acordar lo siguiente: Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 23 Las políticas que regirán todos los esfuerzos de continuidad y recuperación. Las metas/ requerimientos/ productos de cada fase. Instalaciones alternativas para realizar tareas y operaciones. Recursos de información crítica a instalar. Personas responsables de su ejecución. Recursos disponibles para ayudar en la ejecución del plan. El cronograma de actividades con las prioridades establecidas. 18.- Personal clave para la toma de decisiones El plan debe contener un directorio de notificaciones del personal clave o “árbol de llamadas” en la toma de decisiones del SI y del personal del usuario final que se requiera para iniciar y llevar a cabo los esfuerzos de recuperación. Es por lo general un directorio telefónico de las personas que deben ser notificadas en caso de un desastre o de una catástrofe. Este directorio debe contener la siguiente información: - Una lista con prioridades, de los contactos, es decir, quien debe ser llamado primero en una lista de teléfonos. - Números de teléfono y direcciones primarias y de emergencia para cada persona crítica a contactar. Estos serán por lo general, jefes clave de equipo, responsables de contactar a los miembros de su equipo. - Números de teléfono y direcciones de los representantes del equipo y de los proveedores de software. - Números de teléfono de los contactos, dentro de la compañía que hayan sido designados para proveer suministros y equipo o servicios. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 24 - Números de teléfono de las personas a contactar en las instalaciones de recuperación, incluyendo representantes en el mismo lugar o servicios definidos previamente de re direccionamiento de las comunicaciones de red. - Números de teléfono de las personas a contactar en las instalaciones de almacenamiento alterno y de las personas a contactar dentro de la compañía que estén autorizadas para retirar las copias de respaldos de la instalación alterna. - Números de teléfono de los agentes de la compañía de seguros. - Números de teléfono de los contactos del personal de las empresas contratadas. - Números de teléfono y contactos de agencias legales/ regulatorias/ de gobierno, si se quisiera. 19.- Respaldo de los Suministros Requeridos El plan de respaldo debe considerar todos los suministros necesarios para la continuidad de las actividades normales de negocio durante el proceso de recuperación. Si la función de ingreso de datos dependiera de ciertos dispositivos de hardware y/o de programas de software, estos programas y equipos deben ser suministrados al hot site incluyendo equipo especializado y programas de intercambio electrónico de datos (EDI). Lo mismo se aplicaría al equipo criptográfico. 20.- Métodos de Recuperación ante Desastres de las Redes de Telecomunicaciones El plan debe abarcar las redes de telecomunicaciones de la organización. Éstas son susceptibles a los mismos desastres naturales que los centros de datos y también son Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 25 vulnerables a diversos inconvenientes que son propios de las características de los medios de telecomunicaciones. Los métodos de protección de la red son: Redundancia: Proveer capacidad adicional –LAN: 2do cable a través de una ruta alterna, vías múltiples entre routers, protección de archivos de configuración de routers, switches, firewalls, etc. Direccionamiento Alternativo: Método de direccionar información a través de un medio alterno, como por ejemplo, cable de cobre o fibra óptica. Esto involucra el uso de distintas redes, circuitos o puntos si la red normal no estuviera disponible. Direccionamiento Diverso: El método de encaminar el tráfico a través de instalaciones divididas de cable o instalaciones duplicadas de cable. Esto se puede lograr con fundas de cables diferentes y/o duplicados. Si se usan fundas diferentes de cables, el cable puede estar en el mismo conducto y por lo tanto sujeto a las mismas interrupciones que el cable al que está respaldando. Diversidad de Red de Largo Alcance: Software de redireccionamiento automático y líneas redundantes que proveen recuperación instantánea si ocurriera un corte en sus líneas. Protección de Circuito de “Última Milla”: Se tiene redundancia sólo para el segmento que une el domicilio del usuario con el carrier. Recuperación de Voz. 21.- Arreglo Redundante de Discos Independientes (RAID) Provee mejoras de desempeño y capacidades de tolerancia a fallas por medio de soluciones de hardware o de software, desglosando datos y grabándolos en una serie de múltiples discos para mejorar el desempeño y/o salvar simultáneamente grandes archivos. Estos sistemas proveen el potencial para el mirroring (operación de espejo) rentable fuera del sitio de respaldo de datos. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 26 Nivel 0: Arreglo de disco con datos distribuidos sin tolerancia a fallas: Mejora el desempeño creando lo que parece ser un disco entre varios manejadores de disco separados físicamente. Nivel 1: Mirroring: Permite que una copia exacta de información en un área de disco, sea copiada a otra. Una vez establecidos, los datos grabados en el disco también se graban en el espacio libre de la otra mitad del disco espejo. Nivel 2: Cifrado de curva elíptica con código de hamming (ECC): Es el proceso de intercalar datos en múltiples drives incluyendo información de paridad creada usando la técnica del código de Hamming. Nivel 3: Transferencia paralela con paridad: Usa paridad a nivel de byte en dispositivos (drives) dedicados y datos de usuario distribuidos a través de los múltiples dispositivos. Nivel 4: Discos de datos independientes con bloques de paridad compartida: Similar al nivel 3 pero usa paridad a nivel de bloque y disk striping, en vez de byte dentro de un bloque. Nivel 5: Discos de datos independientes con bloques de paridad distribuida: Hace una distribución tanto de los datos, como de la información de paridad entre los múltiples discos a nivel de bloque. 22.- Seguros El plan de recuperación debe contener información clave sobre los seguros de la organización. La política de tener seguros para equipos de procesamiento de los sistemas de información es por lo general una política de riesgos múltiples diseñada para proveer diversos tipos de cobertura de SI. Debe ser construida de manera modular de modo que pueda ser adaptada al ambiente de SI particular del asegurado. Los tipos específicos de cobertura que deben tener los seguros son: Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 27 - Equipos e instalaciones de SI: Provee cobertura por daños físicos al sitio de procesamiento de información y al equipo de su propiedad. - Reconstrucción de los medios (software): Cubre daños a los medios de SI que sean de prioridad del asegurado y del cual el asegurado sea responsable. - Gastos adicionales: Están diseñados para cubrir los costos adicionales que ocasiona la continuidad de las operaciones luego de los daños o de la destrucción en el sitio de procesamiento de la información. - Interrupción del negocio: Pérdida de ganancias debido a la interrupción de actividades. - Documentos y registros valiosos: Valor real efectivo de documentos y registros valiosos que se encuentran en las instalaciones del asegurado. - Error y omisiones: Protección legal de responsabilidad. - Cobertura de fidelidad: Pérdida originada por actos deshonestos o fraudulentos de empleados. - Transporte de medios: Pérdida o daño potencial a medios en tránsito hacia instalaciones de respaldo. 23.- Pruebas del Plan Se deben realizar las pruebas al PCN para saber si el plan funciona bien o qué partes de éste necesitan ser resguardadas. Las pruebas deben ser programadas durante un tiempo que minimice las interrupciones de las operaciones normales. Por ejemplo, los fines de semana, en la noche, etc. Especificaciones: - Verificar si el BCP es completo y preciso. - Evaluar el desempeño del personal involucrado en el ejercicio. - Evaluar la capacitación y concientización de los miembros del equipo de continuidad que no pertenecen al negocio. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 28 - Evaluar la coordinación entre el equipo de continuidad del negocio y los proveedores. - Medir la habilidad y capacidad del lugar de respaldo para llevar a cabo el procesamiento prescrito. - Valorar la capacidad de recuperación de los registros vitales. - Evaluar el estado y la cantidad de equipo y de suministros que han sido reubicados en el lugar de recuperación. - Medir el desempeño general de actividades operativas y de procesamiento de los sistemas de información relacionadas con el mantenimiento de la entidad de negocio. Ejecución de Pruebas: - Pre-prueba, prueba, post –prueba. - Prueba de escritorio – prueba de papel. - Prueba de preparación (simulación de caída del SIC). - Prueba operativa (paso más cercano a una interrupción real del servicio). Programar la prueba durante un tiempo que minimice las interrupciones a las operaciones normales (fin de semana, noche). La prueba debe simular las condiciones reales de procesamiento. Ejecución de Prueba: Documentación de resultados, análisis de resultados (tiempo, cantidad y exactitud), mantenimiento del plan de continuidad/ recuperación (revisión y actualización). Participación del personal clave del equipo de recuperación. La responsabilidad de mantener el BCP es el CIO. Las responsabilidades específicas del mantenimiento del plan son: Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 29 -Desarrollar un programa para revisión y mantenimiento periódico del plan avisando a todo el personal. -Exigir revisiones no programadas cuando hayan ocurrido cambios significativos. -Examinar las revisiones y comentarios y actualizar el plan dentro de X días siguientes a partir de la fecha de revisión. -Hacer arreglos y coordinar las pruebas programadas y no programadas del BCP para evaluar si son adecuadas. -Participar en las pruebas programadas del plan. -Desarrollar un programa para capacitar al personal de recuperación en los procedimientos de emergencia y de recuperación como se establece en el BCP. -Mantener registros de las actividades de mantenimientos del BCP – pruebas, capacitación y revisiones. -Actualizar periódicamente, por lo menos trimestralmente el directorio de notificaciones con todos los cambios de personal, incluyendo números de teléfono, responsabilidades o estatus dentro de la compañía. 24.- Respaldo y Recuperación Para asegurar que las actividades de un negocio no sean interrumpidas en el caso de un desastre, se usan medios secundarios de almacenamiento para almacenar programas y datos asociados para fines de copias de respaldo. Controles de la Biblioteca en el Sitio Alterno Incluyen: - Garantizar el acceso físico al contenido de la biblioteca. - Asegurar que la construcción física pueda resistir al fuego / calor / agua (por dos horas). - Ubicar la biblioteca lejos de la sala de computadoras, preferentemente a kilómetros de distancia para evitar que el riesgo de un desastre afecte ambas instalaciones. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 30 - Asegurar que sólo el personal autorizado tenga acceso a la biblioteca y a los medios fuera de línea. - Asegurar que se mantenga un inventario perpetuo de todos los medios de almacenamiento y de los archivos almacenados en la biblioteca. - Asegurar que se mantenga un registro de información respecto al contenido, a las versiones y a la ubicación de los archivos de datos. Seguridad y control de las instalaciones alternas: El sitio alterno de procesamiento de información debe ser tan seguro y controlado como el sitio primario. Esto incluye controles adecuados de acceso físico como por ejemplo, puertas cerradas con cerrojo, ninguna ventana y personal para vigilancia. La instalación alterna debe poseer el mismo monitoreo y control ambiental constante que el sitio primario. Esto incluye el monitoreo de humedad, de temperatura y de aire que lo rodea para logar condiciones óptimas para almacenar medios ópticos, magnéticos y en papel y, si fuera aplicable, equipo operativo de cómputo y dispositivos periféricos. Incluido en los controles ambientales apropiados, está el suministro ininterrumpido de energía operando sobre un piso falso y con la instalación de detectores de humo y agua apropiados y un sistema de extinción de incendio probado y en operación. Respaldos de los medios y de la documentación: Un elemento crucial para el plan de recuperación para la continuidad de un negocio, en el sitio o en el sitio alterno, es la disponibilidad de datos adecuados. La duplicación de datos y de documentación importantes, incluyendo el almacenamiento de dichos datos y de la documentación de respaldo en el sitio alterno, es un requisito previo para cualquier tipo de recuperación. Procedimientos periódicos de copias de respaldo: Tanto los archivos de datos como los software deben ser respaldados periódicamente, de acuerdo con el RPO definido. El período de tiempo en el que se debe programar la copia de respaldo Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 31 puede diferir por programa de aplicación o por sistema de software. Por ejemplo, ciertos sistemas de aplicación que se ejecutan mensualmente en los cuales los archivos principales o de transacciones se actualizan mensualmente requerirán que se programen las copias de respaldo después que se ejecute la producción mensual. Sin embargo, los sistemas operativos o el software de aplicación que sea actualizado con frecuencia podrán requerir copias de respaldo semanales. A menudo los sistemas en línea que efectúan el procesamiento de grandes volúmenes de transacciones requieren de copias de respaldo cada noche o inmediatamente o utilizan actualizaciones de archivos maestros espejados en una instalación de procesamiento separada. Frecuencia de rotación. Tipos de medios y documentación rotada: Sin software, el hardware de computadora tiene poco valor. Por lo tanto, el software incluyendo sistemas operativos, lenguajes de programación, compiladores, programas utilitarios y de aplicación debe ser mantenido en un sitio alterno y en un estado actualizado. También la documentación en papel y sus copias deben ser almacenadas en un sitio alterno. Esta información en forma de guías operativas, manuales de usuario, registros, archivos de datos, bases de datos y documentos de entrada/ salida, proporciona la materia prima y los productos terminados para el ciclo de procesamiento de los sistemas de información. La siguiente figura describe la documentación que debe tener respaldo y que debe ser almacenada en un sitio alterno: Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 32 Almacenamiento en el Sitio Alterno Clasificación Descripción Procedimientos de operación Librerías o bibliotecas de ejecución de las aplicaciones, instrucciones para la ejecución consecutiva de trabajos, manuales del sistema operativo y procedimientos especiales. Documentación de sistemas Diagramas de flujo, listados del código fuente de los y de programas programas, descripción lógica de los programas, sentencias o instrucciones del lenguaje especial de control de trabajos en condiciones de error y manuales de los usuarios. Procedimientos especiales Cualquier procedimiento o instrucción que esté fuera de lo ordinario como excepción, por ejemplo, variaciones en el procesamiento de el procesamiento y procesamiento de emergencia. Documentos fuente de Copias duplicadas, fotocopias, microfichas, reportes de entrada microflim o resúmenes que se requieren para hacer auditoría, Documentos de salida análisis histórico, la realización de trabajo vital, la satisfacción de los requisitos legales o agilizar los reclamos de seguros. Plan de Continuidad del Una copia apropiada del plan para referencia. Negocio Método de rotación: A pesar de que hay diversos métodos para la rotación de medios, una de las técnicas más aceptadas es referida como el método Abuelo – Padre –Hijo. En este método, las copias de respaldo diarias (hijo) se realizan durante una semana. La copia de respaldo final de la semana se convierte en la copia de respaldo de esa semana (padre). Los medios de respaldo diarios anteriores se rotan para ser utilizados de nuevo como medios de respaldo de la segunda semana. Al final del mes, la copia de respaldo semanal final se guarda como la copia de respaldo de ese mes (abuelo). Posteriormente, los medios de respaldo semanales anteriores se rotan para ser utilizados de nuevo en los meses subsiguientes. Al final del año, la copia de respaldo mensual final se convierte en la copia de respaldo anual. Normalmente, Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 33 las cintas u otros medios mensuales y anuales son retenidos y no están sujetos al ciclo de rotación. Un elemento clave de este método es que las copias de respaldo rotadas en el sitio alterno no deben ser devueltas para su reutilización hasta que su reemplazo haya sido enviado al sitio alterno. Como un ejemplo, los medios de respaldo para la semana 1 no deben ser devueltos del almacenamiento alterno hasta que la copia de respaldo de fin de mes esté almacenada con seguridad en el sitio alterno. Se pueden emplear variaciones de este método dependiendo de si se requieren copias de respaldo trimestrales y de la cantidad de redundancia que una organización pueda desear tener. Mantenimiento de los archivos almacenados en el sitio alterno. Mejores prácticas de gestión de la continuidad del negocio: La necesidad de revisar continua y periódicamente el proceso de continuidad del negocio con el propósito de mejorarlo, es crítica para el desarrollo de estrategias exitosas y robustas de recuperación para una organización, independientemente de si la organización está en la etapa inicial de desarrollo de un BCP o desarrollando la implementación inicial de un proceso de BCM. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 34 Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 35