Infraestructura física de red: optimización del valor empresarial Por Wendy Torell Documento técnico nº 117 Sumario Para ser competitivos en el mundo actual, las empresas deben actualizar la forma en la que consideran el valor de su inversión en la infraestructura física de red (NCPI - NetworkCritical Physical Infrastructure). Para poder tomar decisiones empresariales adecuadas, ya no basta con la disponibilidad y los costes iniciales. La agilidad, o flexibilidad empresarial, y un bajo coste total de propiedad han pasado a ser igual de importantes para las empresas que persiguen el éxito en un mercado global que cambia con excesiva rapidez. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 2 Introducción La infraestructura física de red (NCPI) es la base sobre la que residen las redes de Tecnología de la información (TI) y telecomunicaciones. Es la “columna vertebral” de la empresa, ya que sus elementos suministran la potencia, refrigeración, alojamiento físico, seguridad, protección contra incendios y cableado que permiten el funcionamiento de las tecnologías de la información. La Figura 1 contiene una ilustración de estos elementos críticos de la NCPI y de su integración en un sistema global sin fisuras respaldado por sistemas y servicios de gestión. Considerar la NCPI en su conjunto, en lugar de como componentes individuales, es fundamental para diseñar e implantar un sistema integrado y comprensible que funcione de acuerdo con las previsiones. Cuando los elementos individuales se adquieren de forma aislada a otros elementos de la NCPI, el resultado final suele ser un sistema de NCPI complejo e imprevisible formado por productos de diversos fabricantes que no han sido diseñados para funcionar juntos. La gestión se complica debido a la cantidad de sistemas de gestión que deben utilizarse para controlar todo el sistema, y la contratación de diversos programas se convierte en una necesidad. En el Apéndice A de este documento se incluyen descripciones más detalladas de cada uno de estos elementos de la NCPI. Figura 1 – Un sistema de NCPI integrado Pot ia enc NCPI Ref r raci igeón Inc en d se gu y ios rid ad o ad e l b Ca Racks Y estructura física Los elementos de la NCPI se combinan en un sistema integrado Sistemas de gestión Servicios Incendios Cableado Y Potencia Racks y Estructura física Refriger ación seguridad 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 3 La mayoría de las empresas que actualmente gozan de éxito dependen de una plataforma de TI estable. Para mantener estas operaciones empresariales de TI, debe haber cuatro capas o componentes básicos. En la Figura 2 se ilustra este modelo por capas y la importancia de contar con un sistema NCPI integrado como base para poder mantener las funciones empresariales. Además de la NCPI, se incluye la tecnología de la información y los procesos y el personal necesarios para respaldar el funcionamiento de estos sistemas. La tecnología de la información incluye sistemas, tanto hardware como software, para el procesamiento, almacenamiento y comunicación de datos. Sin una planificación y un diseño adecuados de esta tecnología, la red y, a la larga, la empresa, no pueden funcionar. Todos los procesos para trabajar en este centro de datos o entorno de TI deben estar claramente definidos, bien documentados y estandarizados de un modo sencillo que todos los usuarios puedan comprender. Cuando los procesos no están bien implementados, los problemas de funcionamiento y mantenimiento de los sistemas son inevitables y generan tiempos de inactividad imprevistos. También es necesario disponer del personal que se encargue de las operaciones. Esto significa contar con una plantilla con la suficiente experiencia y formación. Cuando no se planifica correctamente la experiencia y formación que debe tener el personal, el error humano es prácticamente inevitable. Figura 2 – La NCPI es un componente crítico para realizar operaciones empresariales de TI fiables Operaciones empresariales de TI fiables Personal ← Cuando el personal no tiene la experiencia y formación adecuada, lograr el éxito empresarial es muy difícil Procesos ← El éxito del personal depende en gran medida de si disponen de procesos bien definidos y documentados Tecnología de la información ← Los procesos y las personas dependen de sistemas de TI estables para lograr sus objetivos empresariales ← La capa base sobre la que reside todo lo demás: sin NCPI una NCPI estable, los sistemas de TI, los procesos y las personas fallan 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 4 Este documento trata sobre el cambio importante que debe producirse en la forma en la que los encargados de la planificación de TI deben considerar el valor empresarial a la hora de tomar decisiones respecto a la inversión en NCPI. Asimismo, presenta los factores que impulsan este nuevo conjunto de criterios de valoración. Optimizar la NCPI para aumentar su valor empresarial El valor empresarial de una organización, en términos generales, se basa en tres objetivos fundamentales: • Aumento de ingresos • Reducción de costes • Mejor utilización de los activos Independientemente del tipo de empresa, estos tres objetivos generan a la larga un aumento de los beneficios y del flujo de tesorería. Las inversiones en NCPI se realizan porque repercuten directa e indirectamente en estos tres objetivos empresariales. Los directivos compran productos como generadores, unidades de aire acondicionado, sistemas de seguridad y unidades SAI a modo de “pólizas de seguro”. En cualquier red o centro de datos existe el riesgo de que las actividades empresariales se vean interrumpidas debido a problemas térmicos y eléctricos, e invertir en la NCPI mitiga éstos y otros riesgos. Por lo tanto, ¿cómo afecta esto a los tres objetivos empresariales mencionados (ingresos, costes y activos)? Los ingresos se ralentizan o paralizan, se incurre en costes y gastos empresariales y los activos se infrautilizan o resultan improductivos cuando los sistemas sufren interrupciones. Por lo tanto, cuanto más eficaz sea la NCPI en la reducción de los tiempos de inactividad debidos a cualquier causa, mayor valor tendrá para la empresa, ya que le permitirá alcanzar los tres objetivos fundamentales. Tradicionalmente, el cálculo del valor comercial de la NCPI se basaba en dos criterios principales: disponibilidad y costes iniciales. Aumentar la disponibilidad del sistema NCPI y, a la larga, de los procesos empresariales, permite que la empresa continúe generando ingresos y optimice el uso (o productividad) de sus activos. Imagínese una empresa de procesamiento de operaciones con tarjeta de crédito con problemas de disponibilidad en sus sistemas: no podrían procesar las compras con tarjeta de crédito y perderían ingresos durante los períodos de inactividad. Además, los empleados no serían productivos sin poder utilizar sus sistemas. Por otro lado, reducir el coste inicial de la NCPI genera un mayor rendimiento de la inversión. Si el coste de la NCPI es bajo y el riesgo/coste de los períodos de inactividad es alto, la inversión resulta más fácil de justificar. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 5 Aunque estos argumentos continúan siendo válidos, los entornos de TI actuales, que están sometidos a cambios constantes, están imponiendo dos criterios adicionales que se deben tener en cuenta a la hora de calcular el valor empresarial de la NCPI. En primer lugar, los planes empresariales deben ser flexibles para poder adaptarlos a los cambios que se producen en las condiciones del mercado, las oportunidades y los factores ambientales. Las inversiones que bloquean los recursos limitan la capacidad para responder de un modo flexible. Y cuando se carece de esta flexibilidad o agilidad, el resultado más probable será la pérdida de oportunidades de negocio. Otro criterio adicional que debe considerarse para calcular el valor comercial es el coste total de propiedad (TCO, Total Cost of Ownership). Aunque los costes iniciales continúan siendo un factor importante, no lo son todo. Dejan al responsable de la inversión con la incertidumbre de los costes a largo plazo que va a suponer una solución, incluidos los costes de explotación y mantenimiento. El coste inicial se utilizaba a menudo como el criterio principal debido al planteamiento tradicional de los proyectos de adquirir bienes de equipo. Los costes de capital, por motivos fiscales y de depreciación, se separaban generalmente de los gastos acumulables en la justificación financiera de un proyecto. Aunque el coste inicial constituye únicamente un porcentaje del TCO, bastaba para obtener la autorización de un proyecto, es decir, permitía iniciar el proyecto. Y cosas como la factura de electricidad no formaban parte del proceso de decisión. Estos tipos de gastos generalmente se consideraban como costes “de la vida” que eran sencillamente un mal necesario: venían de la mano del proyecto y no se pagaban con dinero del proyecto, sino con fondos operativos. Es ahora cuando los responsables de la toma de decisiones están tomando conciencia de la importancia de incluir estos otros costes en el cálculo del valor empresarial cuando toman decisiones empresariales críticas. Una buena decisión de inversión empresarial incluye la consideración de los costes iniciales y los costes de explotación acumulativos. La Figura 3 muestra el cambio que se está produciendo respecto a los criterios para calcular el valor empresarial de la NCPI, de los negocios de ritmo más lento del pasado a las empresas que deben adaptarse a los rápidos cambios del presente. El objeto de esta ecuación no es ofrecer un “valor cuantitativo”, sino que está diseñada con la intención de destacar los factores que deben considerarse para lograr un alto valor empresarial. La disponibilidad y agilidad, que se encuentran en el numerador o parte superior de la ecuación, deben maximizarse para aumentar el valor empresarial. El TCO, que se encuentra en el denominador o parte inferior de la ecuación, debe minimizarse para aumentar el valor empresarial. A lo largo de este documento técnico, se insta al director del centro de datos a que piense en la disponibilidad de una forma distinta, a que piense en los costes de otro modo y a que piense en un nuevo factor de rendimiento, la agilidad, cuya importancia no se debe ignorar en el mundo empresarial actual. Todos estos factores de rendimiento finalmente se traducen en dinero y es necesario considerar cuál es la mejor forma de optimizar la “agilidad y disponibilidad por euro del TCO”. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 6 Figura 3 – Cambio de paradigma en los criterios para calcular el valor empresarial de la NCPI Disponibilidad Valor Costes iniciales Disponibilidad Agilidad Valor Coste total de propiedad Al considerar esta nueva “ecuación” de valor empresarial para la NCPI, hay muchos factores que contribuyen en cada uno de los tres criterios. En las siguientes secciones hablaremos de los factores que tienen las mayores repercusiones sobre el valor empresarial total. DISPONIBILIDAD – Factor de rendimiento nº 1 Como hemos mencionado, la disponibilidad es uno de los factores clave del valor empresarial de la NCPI. Es el motivo principal por el que Disponibilidad Valor se adquieren componentes de la NCPI. Si los sistemas no están Agilidad TCO disponibles, los objetivos empresariales fundamentales serán sacrificados. La disponibilidad es un término que se ha interpretado de muchas formas diferentes por muchas personas diferentes. Algunos creen que se trata simplemente de la fiabilidad de los equipos. Pero hay mucho más. La definición técnica de la disponibilidad es la siguiente: Disponibilidad es el grado hasta el cual un sistema o un componente está operativo y accesible cuando es necesario utilizarlo [IEEE 90]. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 7 La fiabilidad de los equipos es sin duda una variable que contribuye a que los “sistemas y componentes estén operativos”, pero existen otros factores, como el tiempo medio de recuperación (MTTR) y factores humanos, que también desempeñan un papel importante. Los sistemas se bloquean por distintos motivos, tanto planificados como sin planificar. Un ejemplo de un período de inactividad planificado sería el reservado para la realización de tareas de mantenimiento preventivo. Ejemplos de tiempos de inactividad no planificados serían los debidos a errores humanos o catástrofes naturales. Sorprendentemente, las catástrofes naturales causan menos tiempos de inactividad que los errores humanos que se cometen en las operaciones cotidianas. Los expertos estiman que los factores humanos son la causa de entre un 40% y un 60% de los períodos de inactividad. La necesidad de disponibilidad se expresa de distintas formas, algunas de ellas más cuantitativas que otras. Según la definición técnica, la disponibilidad se mide como el porcentaje de tiempo que los sistemas están operativos, o el 99,99%, por ejemplo. Esta cifra se conoce como “los nueves” y son muchos los directores de centros de datos que luchan por conseguir el objetivo de los “cinco nueves”. Otros consideran la disponibilidad en términos de tiempo de inactividad. Por ejemplo, un 99,999% equivale a cinco minutos de inactividad al año. Y una tercera forma de considerar la disponibilidad sería en términos de “niveles”, donde cada nivel tiene una serie de requisitos diferentes en cuanto a redundancia y soluciones. El Uptime Institute es un ejemplo de una organización que ha definido una serie de niveles de disponibilidad. Siendo la disponibilidad el motivo principal para invertir en la NCPI, ¿cómo decidimos cuáles deben ser los requisitos de disponibilidad? Todos los responsables de centros de datos desean lograr la máxima disponibilidad posible. La clave para establecer los requisitos es generalmente el coste de la solución. Las empresas siempre tienen proyectos importantes y presupuestos limitados y, si eligen una solución NCPI que esté diseñada para ofrecer una alta fiabilidad, con un énfasis en eliminar el error humano e incorporar rápidos tiempos de recuperación, los responsables pueden obtener la mayor disponibilidad posible. A continuación se describen con mayor detalle estos tres factores clave que contribuyen a lograr una NCPI de alta disponibilidad (fiabilidad de los equipos, tiempos de recuperación y error humano). Fiabilidad de los equipos Fiabilidad es la probabilidad de que un dispositivo, sistema o proceso realice la función para la que está diseñado sin fallos durante un determinado período de tiempo. El “tiempo” es un componente importante de esta definición. El término fiabilidad se utiliza incorrectamente con frecuencia, ya que generalmente se habla de que el “producto X tiene una fiabilidad del 98,5%”. Esta afirmación carece de sentido si no se indica el período de tiempo durante el que se obtiene dicha fiabilidad. Por lo tanto, la frase correcta sería “hay una probabilidad del 98,5% de que el producto X funcione sin fallos durante 3 años”. Algunas veces, la fiabilidad también se expresa como “falta de fiabilidad” o probabilidad de fallo, es decir, como la variable opuesta. Por ejemplo, la falta de fiabilidad equivalente a la frase anterior sería “la probabilidad de fallo durante 3 años de funcionamiento es del 1,5%”. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 8 La infraestructura física de un centro de datos se compone de numerosos elementos. Para que el sistema en su conjunto sea fiable, los equipos individuales que lo componen deben ser fiables. Los directores de centros de datos no quieren sufrir los inconvenientes que supone la avería de los componentes, independientemente de lo rápido que se puedan reparar. Cada fallo resulta muy caro en términos de horas hombre y dinero, y cuanto más fiables sean los componentes, menos probabilidad habrá de que planteen problemas. Tiempo medio de recuperación (MTTR) El MTTR desempeña un papel importante en la disponibilidad de un sistema reparable. Los centros de datos deben diseñarse de modo que sean lo más fiables posible en lo que a equipos se refiere. Pero dado que la vida útil típica de un centro de datos es de entre 10 y 15 años, es inevitable que los sistemas o subsistemas fallen durante ese período de tiempo. Estos fallos pueden o no generar tiempos de inactividad, dependiendo del nivel de redundancia con el que esté diseñado el sistema. Independientemente de ello, cuando se producen los fallos, es importante que los sistemas puedan recuperarse lo más rápido posible. Esto significa que el sistema debe diagnosticarse rápidamente, que las piezas deben estar disponibles y que debe ser posible repararlo o sustituirlo con rapidez. Seguramente muchos de ustedes habrán experimentado u oído historias terribles de centros de datos que se bloquearon debido a un fallo y en los que se tardaron días en poder recuperarlos. Las repercusiones que esta desgracia puede tener en la empresa son devastadoras. Errores humanos Los factores humanos no se pueden ignorar al considerar la disponibilidad de la NCPI. Como hemos mencionado anteriormente, muchos estudios del sector indican que el error humano es la causa principal de los tiempos de inactividad no planificados, con cifras de hasta el 60%. Los equipos de TI generalmente se cambian 4 veces o más durante la vida útil del centro de datos. Cuando esto ocurre, los requisitos de potencia, refrigeración e incluso seguridad, pueden cambiar. Por ejemplo, un servidor nuevo podría requerir una toma diferente y por lo tanto habría que cambiar los circuitos eléctricos. Este entorno inestable, sujeto a cambios constantes, genera el caos y fomenta el error humano. Generalmente, los fabricantes ofrecen a sus clientes, o clientes potenciales, datos sobre la disponibilidad o fiabilidad, pero excluyen el error humano. Cuando los fallos de los equipos representan un porcentaje tan pequeño del total y los fallos debidos a factores humanos representan un porcentaje tan alto, estas cifras pueden ser muy engañosas. La mejor forma de medir la disponibilidad de un sistema NCPI sería incluir estos fallos provocados por el error humano. Incluir estos fallos en los cálculos empujaría a los fabricantes areducir la complejidad de sus sistemas, a diseñar interfaces más sencillas e intuitivas y a incorporar en sus sistemas la capacidad para aceptar y adaptarse fácilmente a los cambios constantes. Hacerlo supondría a la larga un aumento del valor empresarial. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 9 Lista de control de las consideraciones sobre disponibilidad En la Tabla 1 se incluye una lista de consideraciones sobre disponibilidad que a menudo se pasan por alto y que podrían repercutir en el valor empresarial. En el pasado, muchas de ellas eran simplemente imposibles, pero hoy en día no hay motivo para aceptar un “no” por respuesta a estas preguntas. Tabla 1 – Lista de consideraciones sobre la disponibilidad Consideraciones sobre disponibilidad ¿Es redundante el diseño de la NCPI para reducir las probabilidades de que fallen los componentes y provoquen el bloqueo del centro de datos o de los sistemas de TI? ¿Están diseñados los elementos de la NCPI para integrarse en la infraestructura y funcionar juntos sin problemas? ¿Se fabrican los componentes de cada elemento de la NCPI en grandes cantidades para mejorar la fiabilidad de los equipos? ¿Se ha diseñado el sistema con interfaces sencillas e intuitivas y gestión proactiva? ¿Se ha diseñado el sistema con la intención de reducir su complejidad? ¿Tiene el sistema la capacidad de aceptar y adaptarse fácilmente a los cambios constantes sin provocar el error humano? Cuando se produce un fallo, ¿es posible solucionarlo en menos de una hora? AGILIDAD – Factor de rendimiento nº 2 Agilidad puede definirse como la capacidad de un sistema para adaptarse a los cambios. Adaptarse a los cambios puede significar muchas cosas: significa lograr que los sistemas estén instalados a Disponibilidad Agilidad Valor TCO tiempo, especialmente en el caso de proyectos con limitaciones de tiempo (velocidad de implantación); significa la capacidad para ampliar o escalar su tamaño a medida que cambian las necesidades de la empresa a la vez que se mantienen al mínimo las pérdidas por sobredimensionamiento; y también significa la capacidad de adaptarse rápidamente al número creciente de cambios que exigen las necesidades de TI de una empresa (capacidad de reconfiguración). Un ejemplo clásico de empresas que fracasan debido a la falta de agilidad podemos encontrarlo en muchas de las grandes empresas de collocation. Estas empresas invirtieron ingentes cantidades de dinero en desarrollar la infraestructura sólida y de alta seguridad que creyeron que sus posibles clientes necesitarían para albergar sus equipos de TI más importantes. Puesto que sus sistemas no podían adaptarse a los cambios de los requisitos empresariales, realizaron la planificación de la capacidad pensando en el “peor de los casos”. La cantidad de conjeturas fue inmensa. El resultado fue un enorme derroche de infraestructura no utilizada, además de pérdidas económicas. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 10 La agilidad es la pieza clave del puzzle del valor empresarial, tan importante –en términos de rendimiento del dinero invertido– como los demás componentes del valor empresarial. Cuando la inversión en la NCPI se puede adaptar a las necesidades del presente pero ser lo suficientemente ágil para adaptarse a los requisitos del futuro (en lugar de tener que prever las necesidades que tendrá la empresa dentro de diez años), el riesgo de errores de predicción se elimina y el rendimiento de la inversión se optimiza. Velocidad de implantación La velocidad de implantación se refiere simplemente a la rapidez con la que el sistema NCPI se puede planificar, diseñar, instalar y poner en funcionamiento. Tradicionalmente, estos pasos solían requerir años. En la Figura 4 se muestra la duración típica de dichos proyectos. Este período tan largo se debe al hecho de que los planteamientos tradicionales generalmente conllevaban un alto grado de personalización. El proceso para obtener más capacidad requería varios pasos fundamentales que eran meras tareas de personalización: ingeniería de un solo uso, diseño de construcción de un solo uso, el propio proceso de construcción altamente personalizado y la puesta en servicio, que se adaptaba a la medida para poder integrar numerosos equipos que no estaban específicamente diseñados para dicha integración. Figura 4 – Duración típica de 400 días para implantar sistemas NCPI tradicionales Piezas, aplicaciones y servicios personalizados Necesito más capacidad Evaluación de necesidades Tengo más capacidad Operation Concepto de diseño 1-2 meses Diseño de la construcción 3-4 meses Puesta en servicio 15 días - 1 mes Construcción 7-8 meses Con el rápido ritmo que imponen los requisitos empresariales actuales, este período tan inflexible sería inadecuado en el mejor de los casos y catastrófico en el peor de ellos. Las empresas necesitan que los centros de datos estén listos en cuestión de meses, no en años. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 11 Otra consideración sobre la duración de este período a la que muchos directores de centros de datos pueden hacer referencia es los retrasos de proyectos causados por los constantes intentos de predecir el futuro. Al eliminar el tiempo y los recursos necesarios para planificar la capacidad y la densidad antes de que sean necesarias, es posible reducir la duración del proyecto. Capacidad de ampliación Cuando los fondos para inversiones de capital no sobran (que suele ser el caso), la capacidad de ampliación es fundamental para lograr agilidad. El centro de datos medio suele estar sobredimensionado. La investigación demuestra que, actualmente, los centros de datos típicos sólo utilizan menos del 50% de la capacidad de su infraestructura. De hecho, según el estudio “Data Center Power Requirements: Measurements from Silcon Valley”, una tesis de J.D Mitchell-Jackson, et al., únicamente se utiliza un tercio del centro de datos típico. Por lo tanto, un 66% de desaprovechamiento no es una cifra que se deba pasar por alto. Imaginemos que el rendimiento de la inversión de ese proyecto podría haber sido tres veces mayor. Dos tercios de la inversión se podrían haber utilizado en otros proyectos de la empresa con mayor potencial de rendimiento. Pero los responsables de los centros de datos no crearon una infraestructura sobredimensionada por el mero hecho de malgastar. Lo hicieron porque tenían que considerar el peor de los casos en términos de capacidad, basándose en sus análisis de las necesidades que la empresa tendría en el futuro, pero sin tener ninguna visibilidad más allá de los próximos 3 o 4 años. Hasta hace poco, la alternativa era incluso peor: infradimensionar y no poder aumentar la capacidad sin causar con ello interrupciones y costosos gastos a la empresa. El Documento técnico de APC nº 37, “Evitar costes de sobredimensionamiento en la estructura para Centros de Proceso de Datos (Datacenters)” analiza en detalle la importancia de crear una infraestructura de las dimensiones adecuadas. Capacidad de reconfiguración Tomemos como ejemplo la empresa de collocation que construyó el 50% de sus instalaciones con alimentación de CC y el otro 50% con alimentación de CA para posteriormente descubrir que el 99% de sus clientes requieren alimentación de CA. La inversión en CC supuso prácticamente una pérdida total debido a esta falta de agilidad. Ahora situémonos en el presente: qué ocurriría si esta misma empresa de collocation hubiera podido construir únicamente lo que sus clientes necesitaban y reconfigurar sus instalaciones sólo cuando fuera necesario para cubrir distintas densidades de potencia, distintos niveles de redundancia (disponibilidad dedicada) y distintas tensiones y tipos de conexiones, sin que con ello se viera perjudicado el centro de datos. Imaginemos también otra empresa que diseñó y construyó un centro de datos para descubrir después que las instalaciones tenían que trasladarse a otro lugar. Con los sistemas tradicionales, la mayoría de los recursos en los que se ha invertido no se pueden reubicar y, a la larga, tienen grandes repercusiones económicas en la empresa, ya que debe realizarse una segunda inversión sustanciosa en la nueva ubicación. Los sistemas que son portátiles y que tienen la capacidad para reubicarse pueden contribuir sustancialmente al resultado neto. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 12 Lista de control de las consideraciones sobre agilidad En la Tabla 2 se incluye una lista de consideraciones sobre agilidad que a menudo se pasan por alto y que podrían repercutir en el valor empresarial. Al igual que las consideraciones sobre disponibilidad, se trata de elementos que deben incluirse en una implantación correcta de NCPI. Puesto que actualmente las condiciones empresariales cambian a un ritmo trepidante, el éxito empresarial equivale a obtener un “sí” por respuesta en todas estas consideraciones sobre agilidad. Tabla 2 – Lista de consideraciones sobre agilidad Consideración sobre agilidad ¿Puede construirse un centro de datos nuevo en cuestión de días en lugar de meses o años? ¿Se puede ampliar rápidamente la capacidad del sistema NCPI existente? ¿Podría ser del doble al mes siguiente? ¿Se puede instalar la NCPI del centro de datos realizando un mínimo de trabajos en el emplazamiento? ¿Podría llevarse un porcentaje significativo de la infraestructura a otro lugar en caso de que fuera necesario un traslado? ¿Puede realizarse el traslado del centro de datos en cuestión de meses en lugar de años? ¿Puede instalarse una NCPI redundante (disponibilidad dedicada) en una parte del centro de datos? ¿Puede cambiarse un enchufe en cuestión de minutos durante una actualización de TI? ¿Puede ampliarse el tiempo de autonomía a medida que cambien las necesidades? TCO – Factor de rendimiento nº 3 El coste total de propiedad o TCO es un factor claro para la mayoría de los directores: se trata del dinero invertido y es un valor tangible. El TCO de un centro de datos depende del Disponibilidad Agilidad Valor tamaño de las instalaciones. Sin embargo, es posible expresar el TCO coste total de forma que sea válido para centros de datos de cualquier tamaño. Una de las formas propuestas para expresar el requisito del TCO es en términos del coste total por rack a lo largo de la vida útil del centro de datos. Un valor típico para el coste del ciclo de vida de la NCPI por rack es 100.000$. Se trata de una inversión considerable (comparable al coste de la inversión en equipos de IT) y, por lo tanto, es fundamental que el responsable conozca el valor que recibe por dicho coste. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 13 El TCO no es sólo la inversión inicial en la NCPI, sino que incluye todos los demás costes asociados con la explotación y el mantenimiento de dicha inversión durante su ciclo de vida (generalmente entre 10 y 15 años). Debe quedar claro que en el mundo empresarial actual tan competitivo, es el TCO, y no sólo los costes iniciales, lo que impulsa el verdadero valor empresarial. En la Figura 5 se muestra un desglose típico de los costes de los centros de datos implantados con sistemas tradicionales. Figura 5 – Desglose del TCO con sistemas tradicionales Equipos de refrigeración 8% Racks 3% Mejoras 8% Equipos de potencia 36% Espacio 9% Servicios 17% Electricidad 19% De estos costes, aproximadamente el 50% pertenecen a gastos de explotación y el otro 50% a gastos de capital. Y de este total, un porcentaje considerable (aproximadamente el 30%) generalmente se malgasta debido a una mala planificación y a decisiones de diseño incorrectas. El sobredimensionamiento es el factor principal que contribuye al exceso del TCO. Genera un derroche considerable, incluidos excesos en los costes de capital, costes de explotación y, concretamente, en los costes de energía. Como media, se desaprovecha más del 50% de la capacidad de la NCPI instalada. Aunque la causa principal de este desaprovechamiento sea la incertidumbre, la respuesta no puede ser reducir simplemente los planes: efectivamente existen casos en los que la carga real termina siendo igual o superior a la carga esperada, e infradimensionar la capacidad del centro de datos puede tener incluso peores consecuencias que sobredimensionarlo. La clave para lograr un TCO optimizado está en implementar una solución TCO que esté diseñada con capacidad de ampliación, de forma que el tamaño de la infraestructura se pueda adaptar a las distintas necesidades del centro de datos a lo largo de toda su vida útil. Nadie quisiera ser el responsable de un centro de datos construido con una capacidad de un megavatio para después descubrir que la carga real nunca superó los 300 kW. En el Documento técnico de APC nº 6, “Cálculo del coste total de propiedad de la infraestructura de centros de datos y salas de red” se describe un método para medir el TCO y se sugieren estrategias para reducir estos costes. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 14 Coste de capital Los gastos de capital son el dinero invertido por una empresa en adquirir o actualizar bienes inmuebles, maquinaria y bienes de equipo, con la esperanza de que beneficien a la compañía a lo largo de un período de tiempo (más de un año). Estos costes se amortizan durante la vida prevista de los equipos y tienen un tratamiento fiscal especial. El coste de capital de un proyecto NCPI es un gasto muy real y mensurable. Incluye el coste de los equipos de la NCPI, así como los costes asociados con el diseño y la implantación de los equipos. La mejor oportunidad –y la única– para optimizar (reducir) estos costes de capital es mediante la capacidad para ampliar la infraestructura. Invertir en una capacidad adecuada para la carga evita realizar sobreinversiones considerables en capital (de hasta 3 veces más). Otra oportunidad para reducir los gastos de capital es mediante la reducción del personal técnico necesario. Implementar una solución que requiera un mínimo de trabajos en el emplazamiento durante la instalación reduce estos costes iniciales en mano de obra. Costes de explotación Los gastos de explotación son todos aquellos costes asociados con el mantenimiento de un negocio. Los gastos de explotación de un proyecto de NCPI incluyen los asociados al personal de servicio, los gastos de formación y los costes de mantenimiento y reparación de la NCPI. Los costes de energía también son un gasto de explotación, pero se desglosan por separado para destacar la repercusión tan importante que tienen sobre el valor empresarial. Considerar el nivel de mantenimiento predictivo disponible en el sistema es importante, ya que puede reducir la necesidad de un mantenimiento programado (que no sólo reduce los gastos, sino que también reduce el riesgo de introducir defectos). El nivel de servicios necesario también depende en gran medida de la complejidad y personalización del sistema. La cantidad y el tipo de reparaciones también está determinada por la naturaleza del sistema. Los sistemas modulares admiten más actividades de automantenimiento, autorreparación y sustitución de componentes averiados, mientras que los sistemas tradicionales personalizados requieren procedimientos de reparación más invasivos. Cuanto más complejo y personalizado es un sistema, mayor es la cantidad de trabajo de diseño y de tiempo de preparación en el emplazamiento y, a la larga, mayor cantidad de personal técnico necesario para mantener el sistema. Esto generalmente se traduce en un incremento de los gastos en formación para lograr que los empleados alcancen el nivel de experiencia necesario para utilizar y mantener los sistemas correctamente. Costes de energía El mayor potencial de ahorro en el TCO se encuentra en los costes de eficacia. Un sistema SAI sobredimensionado es menos eficaz y requiere mucha más energía para funcionar que un sistema diseñado con la capacidad adecuada para las cargas que respalda. Esto se debe a que el rendimiento efectivo mejora considerablemente cuando la carga real es similar a la carga de diseño. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 15 En sistemas SAI redundantes, el tamaño de los módulos redundantes también afecta al rendimiento. Esto se debe a que en una configuración típica N+1, la carga se comparte entre todos los módulos. Consideremos una carga del centro de datos de 80 kW. Si el sistema SAI está diseñado con cuatro sistemas de 20 kW para respaldar la carga y un sistema adicional de 20 kW como unidad redundante, la carga de 80 kW se dividirá entre los 5 sistemas. En otras palabras, cada SAI se encargará de 16 kW o del 80% de la capacidad. Este sistema también podría estar diseñado con dos sistemas de 80 kW, cada uno de ellos funcionando con una capacidad del 50%. En este ejemplo, el primer diseño ofrecería una mayor eficacia y, por lo tanto, reduciría los costes de energía. Las tecnologías elegidas para la NCPI pueden tener una gran repercusión en los costes de energía. Los sistemas SAI tradicionales, por ejemplo, únicamente logran una eficacia de aproximadamente el 85% con niveles de carga del 50%. Las tecnologías online más modernas, como los sistemas SAI de conversión delta, mantienen una eficacia del 93% o más con estos bajos niveles de carga. Con unos costes eléctricos superiores a 0,10$ por kW-hora en la mayor parte de Estados Unidos, estas cifras de eficacia contribuyen considerablemente a lograr un bajo coste total de propiedad. Lista de control de las consideraciones sobre TCO En la Tabla 3 se incluye una lista de consideraciones sobre el TCO que a menudo se pasan por alto y que podrían repercutir en el valor empresarial. Al igual que ocurre con las consideraciones sobre disponibilidad y agilidad, estas cuestiones son fundamentales para poder tomar las mejores decisiones empresariales respecto a la NCPI. Tabla 3 – Lista de consideraciones sobre el TCO Consideración sobre el TCO ¿Se está calculando el proyecto en función del TCO en vez de en función de los costes iniciales únicamente? ¿Está correctamente dimensionada la capacidad de la NCPI para optimizar la inversión de capital? ¿Se ha optimizado la eficacia eléctrica del centro de datos dimensionándolo del modo adecuado? ¿Se incluyen en el diseño de la NCPI componentes de alta eficacia? ¿Se han reducido los costes de mantenimiento a largo plazo del centro de datos? 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 16 Estrategia para optimizar el valor empresarial En el entorno empresarial actual, no cabe duda de que existe la necesidad de modificar una serie de criterios para optimizar el valor empresarial. En la Figura 6 se subraya de nuevo cuáles deben ser estos nuevos criterios. Esto se traduce en un coste real que afecta a las empresas de muy diversas formas, no sólo en términos de dinero, sino también en lo que a estrategia y planificación se refiere. Figura 6 – La nueva ecuación del valor empresarial Valor Disponibilidad Agilidad TCO Con los sistemas NCPI tradicionales –con su ingeniería de un solo uso y su diseño inflexible, generalmente sobredimensionado– no era posible lograr un sistema que pudiera optimizar los tres factores de rendimiento de esta ecuación. No era viable obtener un sistema de alta calidad (disponibilidad), en una cantidad de tiempo razonable (agilidad) y por un coste razonable (TCO). Generalmente había que realizar algún sacrificio, es decir, renunciar a una de las variables para poder obtener las otras dos. Para que fuese rápido y barato, había que sacrificar la calidad. Para que fuese rápido y de alta calidad, había que pagar por ello. Afortunadamente, ese antiguo paradigma ha dejado de existir. Existe una estrategia de eficacia probada para optimizar estas tres variables: a través de la estandarización y, concretamente, de la estandarización modular. Por ejemplo, aplicar a los sistemas de TI los mismos planteamientos que se utilizan en el diseño de automóviles puede aumentar considerablemente el valor empresarial de la NCPI. Pongamos por ejemplo el caso de los servidores antiguos: cada servidor se instalaba en un tipo diferente de rack, lo que generaba incompatibilidad. Sin embargo, cuando la industria de los servidores se estandarizó, los servidores podían instalarse en prácticamente cualquier tipo de rack. Éste es tan sólo uno de los muchos ejemplos de la dirección que está tomando la industria de la NCPI. En el Documento técnico de APC nº 116, “Estandarización y modularidad en la infraestructura física de red”, se describen las diversas ventajas que la estandarización y modularidad pueden aportar a una inversión en NCPI. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 17 Conclusión La NCPI es la base de cualquier centro de datos. Los cambios que se producen en el entorno empresarial actual, particularmente en lo referente a la reducción de los ciclos de renovación de TI, están imponiendo la necesidad de cambiar nuestra forma de pensar en cuanto al modo de calcular el valor comercial de la NCPI. La nueva ecuación para el valor empresarial de la NCPI que se describe en este documento resume este hecho. Ahora es necesario pensar en la disponibilidad de otro modo, considerando factores clave que incluyen factores humanos. El coste también debe considerarse de otra forma: ya no es suficiente con valorar el coste inicial para poder tomar decisiones empresariales; ahora, el coste de toda la vida útil de la infraestructura es el que verdaderamente genera valor. Y la agilidad es un factor de rendimiento que debe tenerse en cuenta, ya que mide directamente la capacidad de la NCPI para adaptarse a las imprevisibles demandas y oportunidades del futuro. La clave para lograr un alto valor empresarial con este nuevo paradigma está en la estandarización, modularidad y escalabilidad. La industria de la NCPI debe abandonar esta antigua actitud de “sector artesanal”, donde dos instalaciones diferentes tienen dos diseños totalmente diferentes, con problemas propios que también son totalmente diferentes. Los sistemas deben ser modulares y escalables para adaptarse a las cambiantes necesidades de los centros de datos, mejorar la fiabilidad y disponibilidad de la infraestructura y optimizar el TCO. Acerca del autor: Wendy Torell es ingeniera de disponibilidad de APC en West Kingston (Rhode Island, EE.UU.). Consulta con los clientes los métodos científicos de la disponibilidad y las prácticas de diseño para optimizar la disponibilidad de los entornos de los centros de datos. Se licenció en Ingeniería mecánica en el Union College, Schenectady, NY. Wendy posee el certificado de Ingeniero de calidad de ASQ. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 18 Apéndice: elementos de la NCPI La NCPI incluye módulos de potencia, refrigeración, racks y estructura física, seguridad y protección contra incendios, cableado y los sistemas de gestión y servicio técnico de estos sistemas. La NCPI constituye la base de la fiabilidad de las operaciones de TI para una empresa. Como base, debe ser fiable y, en una situación ideal, “ojos que no ven, corazón que no siente”. A continuación encontrará una breve descripción de cada uno de los elementos de la NCPI. Potencia Son muchos los elementos que componen una sólida infraestructura de potencia, incluidos todos los sistemas desde la entrada del servicio eléctrico en el edificio hasta las cargas del centro de datos o la red. Dicha infraestructura incluye la distribución principal, los generadores, los sistemas SAI y las baterías, la protección contra subidas de tensión, los transformadores, paneles de distribución y disyuntores. En el Documento técnico de APC nº 4, “Requisitos esenciales en cuanto al sistema eléctrico de los centros de datos en la siguiente generación” se describen los problemas y retos que plantean los sistemas eléctricos tradicionales y se presentan los requisitos del futuro. Refrigeración Los sistemas de refrigeración necesarios para eliminar correctamente el calor de los centros de datos incluyen unidades de aire acondicionado para la sala de servidores, cualquier subsistema asociado que permita el funcionamiento de dichas unidades, incluidos refrigeradores, torres de refrigeración, condensadores, canalizaciones, equipamientos de bomba, tuberías y todos los dispositivos de distribución a nivel de rack. En el Documento técnico de APC nº 5, “Requisitos esenciales de los centros de datos de la siguiente generación en cuanto al sistema de refrigeración” se describen los problemas y retos que plantean los sistemas de refrigeración tradicionales y se presentan los requisitos del futuro. Racks y estructura física Son muchos los sistemas que podrían considerarse parte de la estructura física de un centro de datos. Los elementos más importantes son los racks de TI en los que se alojan los equipos de TI y elementos de la sala como los falsos techos y suelos (tanto falsos suelos como suelos con losas de hormigón). En el Documento técnico de APC nº 7, “Essential Rack System Requirements for Next Generation Data Centers” (“Requisitos esenciales de los sistemas rack para centros de datos de próxima generación”) se describen los problemas y retos que plantean los sistemas rack tradicionales y se presentan los requisitos del futuro. En el Documento técnico de APC nº 19, “ Re-examining the Suitability of the Raised Floor for Data Center Applications” (“ Revaloración de la idoneidad del suelo falso para aplicaciones de centro de datos”), se analizan en detalle los motivos que antiguamente se consideraban para la instalación de falsos suelos y se sugiere que su uso generalizado ya no está justificado en entornos de centros de datos. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 19 Seguridad y protección contra incendios Los sistemas de seguridad y de protección contra incendios son fundamentales para mantener la integridad, seguridad y disponibilidad del centro de datos. Entre los subsistemas de esta categoría se incluyen dispositivos físicos para la seguridad a nivel de sala y de rack, y sistemas para la detección y extinción de incendios. Algunos ejemplos de dispositivos físicos para la seguridad son los dispositivos biométricos, llaves, códigos y tarjetas. Entre los ejemplos de sistemas para la detección y extinción de incendios se incluyen detectores de humo inteligentes, sistemas para la extinción de incendios con productos no contaminantes y detección lineal del calor. En el Documento técnico de APC nº 82, “Physical Security in Mission Critical Facilities” (“Seguridad física en instalaciones de misión crítica”), se describen con detalle los elementos físicos de seguridad y se sugieren procedimientos para optimizar la seguridad de las instalaciones. En el Documento técnico de APC nº 83, “Mitigating Fire Risks in Mission Critical Facilities” (“Mitigar el riesgo de incendio en instalaciones de misión crítica”) se describe con detalle la detección, extinción y prevención de incendios y se exponen las mejores prácticas para mitigar el riesgo de incendio. Cableado La infraestructura de cableado comprende todos los cables de datos que forman parte del centro de datos, así como todos los cables de potencia necesarios para garantizar el suministro de potencia a todas las cargas. Las bandejas pasacables y los dispositivos para la organización de cables también son elementos fundamentales de la infraestructura de TI, ya que ayudan a reducir la probabilidad de que se produzcan tiempos de inactividad debido a errores humanos o recalentamientos. Gestión La gestión es un elemento de la NCPI que abarca todos los elementos mencionados anteriormente. Para tener una NCPI fiable, es importante controlar sin obstáculos todos los componentes de la infraestructura física. La gestión incluye elementos como los Sistemas de gestión de edificios (BMS), los Sistemas de gestión de red (NMS), los gestores de elementos (como el gestor InfraStruXure de APC) y otros componentes de hardware y software de gestión. En el Documento técnico de APC nº 14, “Essential NCPI Management Requirements for Next Generation Data Centers” (“Requisitos esenciales de gestión de la NCPI para centros de datos de próxima generación”) se describen los problemas y retos que plantean los sistemas tradicionales de gestión de la NCPI y se presentan los requisitos del futuro. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 20 Servicios Existe una amplia variedad de servicios que son necesarios para respaldar los sistemas de la NCPI durante su ciclo de vida útil. Estos servicios pueden dividirse en cinco categorías: (1) Servicios de consultoría y diseño; (2) Servicios de instalación; (3) Servicios de mantenimiento y reparación; (4) Servicios de monitorización; y (5) Servicios de retirada del servicio. En el Documento técnico de APC nº 12, “Essential NCPI Service Requirements for Next Generation Data Centers” (“Requisitos básicos de los servicios de infraestructuras físicas de red para centros de datos de próxima generación”) se describen los problemas y retos que plantean los servicios de NCPI y se presentan los requisitos del futuro. 2005 American Power Conversion. Reservados todos los derechos. Ninguna parte de esta publicación podrá utilizarse, reproducirse, fotocopiarse, transmitirse o almacenarse en ningún sistema de recuperación de datos de ningún tipo sin contar con la autorización por escrito del propietario del copyright. www.apc.com Rev. 2005-0 21