8.2. Respaldos

Los respaldos o copias de seguridad tienen dos objetivos principales:

El primer propósito es la base para las peticiones típicas de restauraciones de archivos: un usuario accidentalmente borra un archivo y le pide restaurarlo desde el último respaldo. Las circunstancias exactas pueden variar, pero este es el uso diario más común de los respaldos.

La segunda situación es la peor pesadilla de un administrador de sistemas: por la situación que sea, el administrador se queda observando un hardware que solía ser una parte productiva del centro de datos. Ahora, no es más que un pedazo de acero y silicon inútil. Lo que está faltando en todo el software y los datos que usted y sus usuarios habian reunido por años. Supuestamente todo ha sido respaldado. La pregunta es: ¿Está seguro?

Y si lo ha sido, ¿Lo puede restaurar?

8.2.1. Datos diferentes: Necesidades de respaldos diferentes

Observe el tipo de datos[1] procesados y almacenados por un sistema computacional típico. Observe que algunos de los datos raramente cambian y otros cambian constantemente.

El ritmo al cual los datos cambian es crucial para el diseño de un procedimiento de respaldo. Hay dos razones para esto:

Los administradores de sistemas que tienen un buen entendimiento de sus sistemas, usuarios y aplicaciones deberían ser capaces de agrupar rápidamente en sus sistemas en diferentes categorías. Sin embargo, he aquí algunos ejemplos para comenzar:

Sistema operativo

Estos datos solamente cambia durante las actualizaciones, las instalaciones de reparaciones de errores y cualquier modificación específica al sitio.

SugerenciaSugerencia
 

Debería de molestarse con el respaldo del sistema operativo? Esta es una pregunta que muchos administradores de sistemas operativos han evaluado por muchos años. Por un lado, si el proceso de instalación es relativamente fácil y si las reparaciones de fallos y personalizaciones están bien documentadas y son fáciles de reproducir, la reinstalación del sistema operativo puede ser una opción viable.

Por otro lado, si hay alguna duda de que una instalación fresca pueda recrear completamente el ambiente original del sistema, el respaldo del sistema operativo es la mejor opción, aún si los respaldo se realizaron con mucho menos frecuencia que los respaldos de datos de producción. Los respaldos ocasionales de sistemas operativos son útiles cuando se deben restaurar solamente unos pocos sistemas operativos (por ejemplo, debido a la eliminación accidental de un archivo).

Software de aplicaciones

Estos datos cambian cuando se instalan, actualizan o eliminan aplicaciones.

Datos de aplicaciones

Estos datos cambian tan frecuente como lo hacen las aplicaciones asociadas. Dependiendo de la aplicación específica y su organización, esto puede significar que los cambios toman lugar segundo a segundo o al final del año fiscal.

Datos de usuarios

Estos datos cambian de acuerdo a los patrones de uso de su comunidad de usuarios. En la mayoría de las organizaciones, esto significa que los cambios toman lugar todo el tiempo.

Basado en estas categorías (y cualquier otra adicional que sean específicas a su organización), usted debería tener una buena idea concerniente a la naturaleza de los respaldos que se necesitan para proteger sus datos.

NotaNota
 

Debe tener en mente que la mayoría del software de respaldo trata con datos en un directorio o a nivel del sistema de archivos. En otras palabras, la estructura de su sistema de archivo juega un papel importante en cómo se ejectuten los respaldos. Esta es otra razón por la que es una buena idea considerar cuidadosamente la mejor estructura de directorios para un nuevo sistema y agrupar los archivos y directorios de acuerdo a su uso anticipado.

8.2.2. Software de respaldos: Comprar contra Construir

Para poder llevar a cabo los respaldos, es necesario tener el software de respaldo apropiado. Este software no solamente debe ser capaz de realizar la tarea básica de hacer copias de bits en una media de respaldo, también debe interactuar limpiamente con el personal y las necesidades de su organización. Algunas de las funcionalidades a considerar cuando evalue software de respaldo incluyen:

Como puede observar, una solución de respaldo del mundo real implica mucho más que simplemente escribir bits en su media de respaldo.

La mayoría de los administradores de sistemas en este punto, ven hacia una de dos soluciones:

Cada enfoque tiene sus puntos buenos y sus puntos malos. Dada la complejidad de la tarea, una solución casera probablemente no maneje todos los aspectos (tales como administración de media, o tener el soporte técnico y la documentación completa) muy bien. Sin embargo, para algunas organizaciones, esto quizás no sea una limitación.

Una solución desarrollada comercialmente es más probable que sea altamente funcional, pero también excesivamente compleja para las necesidades presentes de la organización. Dicho esto, la complejidad puede hacer posible mantenerse con una solución aun si la organización crece.

Como puede ver, no hay un método claro para decidirse sobre un sistema de respaldo. La única guía que se puede ofrecer es pedirle que considere los puntos siguientes:

8.2.3. Tipos de respaldo

Si le pregunta a una persona que no esta familiarizada con los respaldos o copias de seguridad de computadoras, la mayoría pensaría que un respaldo es una copia idéntica de todos los datos en un computador. En otras palabras, si se creó un respaldo el martes en la noche, y no se cambió nada durante el miercoles completo, el respaldo del miercoles en la noche sería idéntico que el del martes.

Mientras que es posible configurar los respaldos de esta forma, es probable que no lo haga. Para entender un poco más sobre esto, primero se debe entender los tipos de respaldo que se pueden crear. Estos son:

8.2.3.1. Respaldos completos

El tipo de respaldo discutido al principio de esta sección se conoce como respaldo completo. Un respaldo completo es un respaldo donde cada archivo es escrito a la media de respaldo. Como se mencionó anteriormente, si los datos a respaldar nunca cambian, cada respaldo completo creado será una copia de exactamente lo mismo.

Esta similaridad se debe al hecho de que un respaldo completo no verifica para ver si un archivo ha cambiado desde el último respaldo; ciegamente escribe todo a la media de respaldo, haya sido modificada o no.

Esta es la razón por la que los respaldos completos no se hacen todo el tiempo - cada archivo es escrito a la media de respaldo. Esto significa el uso de gran cantidad de media de respaldo aún cuando nada se haya cambiado. Respaldar 100 GB de datos cada noche cuando solamente cambió 10 MB de datos, no es una buena solución; por eso es que se crean los respaldos incrementales.

8.2.3.2. Respaldos incrementales

A diferencia de los respaldos completos, los respaldos incrementales primero revisan para ver si la fecha de modificación de un archivo es más reciente que la fecha de su último respaldo. Si no lo es, significa que el archivo no ha sido modificado desde su último respaldo y por tanto se puede saltar esta vez. Por otro lado, si la fecha de modificación es más reciente, el archivo ha sido modificado y se debería copiar.

Los respaldos incrementales son utilizados en conjunto con respaldos regulares completos (por ejemplo, un respaldo semanal completo, con respaldos incrementales diarios).

La principal ventaja obtenida de los respaldos incrementales es que se ejecutan muchísimo más rápido que un respaldo completo. La principal desventaja es que restaurar un archivo dado puede implicar pasar a través de varios respaldos incrementales hasta encontrar el archivo. Cuando se restaura un sistema de archivos completo, es necesario restaurar el último respaldo completo y cada respaldo incremental subsecuente.

En un intento de aliviar la necesidad de pasar a través de varios respaldos incrementales, se puede utilizar un enfoque ligeramente diferente. Esto se conoce como respaldo diferencial.

8.2.3.3. Respaldos diferenciales

Los respaldos diferenciales son similares a los respaldos incrementales en que ambos solamente copian archivos que han sido modificados. Sin embargo, los respaldos diferenciales son acumulativos — en otras palabras, con un respaldo diferencial, una vez que un archivo ha sido modificado continua siendo incluído en todos los respaldos diferenciales subsecuentes (hasta el próximo respaldo completo).

Esto significa que cada respaldo diferencial contiene todos los archivos modificados desde el último respaldo completo, haciendo posible realizar una restauración completa solamente con el último respaldo completo y el último respaldo diferencial.

De la misma manera que la estrategia de respaldo de los respaldos incrementales, los respaldos diferenciales siguen el mismo enfoque: un respaldo completo periódico seguido de más frecuentes respaldos diferenciales.

El efecto de utilizar los respaldos diferenciales de esta forma es que los respaldos diferenciales tienden a crecer un poco con el tiempo (asumiendo que diferentes archivos son modificados con el paso del tiempo entre respaldos completos). Esto coloca los respaldos diferenciales en un punto entre los respaldos incrementales y los completos en términos de utilización de la media y velocidad de los respaldos, mientras que ofrecen restauraciones completas y de archivos individuales mucho más rápidas (debido a que hay menos respaldos en los que buscar/restaurar).

Dadas estas características, vale la pena considerar cuidadosamente los respaldos diferenciales.

8.2.4. Media de respaldo

Hemos sido muy cuidadosos en seleccionar la palabra "media de respaldo" a lo largo de las secciones. Hay una razón para esto. Los administradores de sistemas más experimentados usualmente piensan sobre respaldos en términos de leer y escribir en cintas, pero hoy día existen otras opciones.

En algún momento, los dispositivos de cintas eran los únicos dispositivos de media de respaldo que se podían utilizar razonablemente para propósitos de respaldos. Sin embargo, esto ha cambiado. En las secciones siguientes vamos a tratar sobre las medias de respaldo más populares y revisar sus ventajas así como también sus desventajas.

8.2.4.1. Cintas

Las cintas fueron el primer tipo de media removible disponible como medio de almacenamiento. Tiene los beneficios de bajos costos y una capacidad de almacenamiento razonablemente buena. Sin embargo, las cintas tienen algunas desventajas - es susceptible a desgastarse y el acceso a los datos en una cinta es por naturaleza secuencial.

Estos factores implican que es necesario hacer un seguimiento del uso de las cintas (retirando las cintas una vez que hayan alcanzado el final de su vida útil) y que las búsquedas de un archivo en cinta pueden ser una tarea bastante lenta.

Por otro lado, las cintas son uno de los medios de almacenamiento masivo menos costosos disponibles y tienen una larga historia de confiabilidad. Esto significa que construir una biblioteca de cintas de un buen tamaño no necesita consumir una gran parte de su presupuesto, y puede contar con poderla utilizar ahora y en un futuro.

8.2.4.2. Disco

En años pasados, las unidades de disco nunca se utilizaban como medio para respaldos. Sin embargo, los precios se han reducido tanto que, en algunos casos, el uso de discos duros como unidades de respaldo, tiene sentido.

La razón principal para el uso de unidades de disco como medio para respaldos sería su velocidad. No hay un medio de almacenamiento masivo más rápido disponible. La velocidad puede ser un factor crítico cuando la ventana para hacer el respaldo de su centro de datos es corta y la cantidad de datos a copiar es grande.

Pero por varias razones el almacenamiento en disco no es el medio ideal para respaldos.

  • Normalmente los discos duros no son removibles. Un factor clave para una estrategia de respaldo efectiva es que se pueda retirar la media de su centro de datos y en algún tipo de almacenamiento fuera del sitio. Un respaldo de la base de datos de producción sentada en un disco duro medio metro más allá de la base de datos misma no es un respaldo; es una copia. Y las copias no son muy útiles si los datos del centro de datos y sus contenidos (incluyendo las copias) son dañadas o destruídas por algún tipo de evento desafortunado.

  • Las unidades de disco duro son costosas (al menos comparadas con otros tipos de media). Hay situaciones donde el dinero realmente no es un problema, pero en todos los demas casos, los costos asociados con el uso de discos duros para respaldos significa que el número de copias de respaldo se debe mantener bajo para así mantener bajos los costos generales. Menos copias de seguridad significa menos redundancia si por alguna razón uno de los respaldos no se puede leer.

  • Los discos duros son frágiles. Aún si hace el gasto adicional de comprar discos removibles, su fragilidad puede ser un problema. Si se le cae un disco, usted perdió el respaldo. Es posible comprar estuches especiales que pueden reducir (pero no eliminar completamente) este peligro, pero esto hace una propuesta costosa aún más costosa.

  • Las unidades de disco no son media para archivado. Asumiendo que pueda superar todos los otros problemas asociados con la realización de respaldos a unidades de disco, debería considerar lo siguiente. La mayoría de las organizaciones tienen varios requerimientos legales para mantener los registros disponibles por cierto tiempo. Las posibilidades de obtener data utilizable desde una cinta de 20 años son mucho más grandes que las posibilidades de hacerlo desde un disco de 20 años. Por ejemplo, ¿tendrá el hardware necesario para conectarlo a su sistema? Otra cosa a considerar esn que una unidad de disco es mucho más compleja que una unidad de cinta. Cuando un motor de 20 años gira un plato de disco de 20 años, causando que los cabezales de lectura/escritura de 20 años vuelen sobre la superficie del plato, ¿cuáles son las posibilidades de que estos componentes funcionen sin problema después de haber estado 20 años sentados sin hacer nada?

    NotaNota
     

    Algunos centros de datos hacen los respaldos a unidades de disco y luego, para propósitos de archivado, copian estos respaldos a unidades de cinta. Esto permite realizar los respaldos más rápidos durante la ventana de respaldo que se tiene. Se puede hacer luego la escritura de los respaldos a las unidades de cinta, durante el resto del día laboral; siempre y cuando la grabación se termine antes de que se realicen los respaldos del próximo día laboral.

Dicho esto, todavía existen algunas situaciones en las que los respaldos a unidades de discos duros tiene sentido. En la próxima sección podemos ver cómo se pueden combinar con una red para formar una solución de respaldo viable (pero costosa).

8.2.4.3. Red

Por sí misma, una red no puede actuar como una media de respaldo. Pero combinada con tecnologías de almacenamiento masivo, puede hacerlo muy bien. Por ejemplo, combinando un enlace de red de gran velocidad a un centro de datos remoto conteniendo grandes cantidades de almacenamiento en disco, repentinamente las desventajas sobre el respaldo a discos mencionadas anteriormente, dejan de ser desventajas.

Al hacer respaldos sobre la red, las unidades de disco ya se encuentran en otra ubicación, fuera del sitio, por lo que no es necesario transportar unidades de discos frágiles a otro lado. Con suficiente ancho de banda, se mantiene la ventaja de la velocidad que puede obtener por hacer los respaldos a discos.

Sin embargo, este enfoque todavía no soluciona el problema del almacenamiento de los archivo (aunque se puede utilizar el mismo enfoque de copiar a las cintas luego de hacer el respaldo, como se mencionó anteriormente). Además, los costos de un centro de datos remoto con un enlace de alta velocidad al centro de datos principal hace esta solución extremadamente costosa. Pero para los tipos de organización que necesitan el tipo de funcionalidades que esta solución ofrece, es un costo que pagarían con gusto.

8.2.5. Almacenamiento de las copias de seguridad o respaldos

Una vez que se termine de hacer el respaldo, que pasa luego? La respuesta obvia es que los respaldos se deben guardar. Sin embargo, lo que no es tan obvio es exactamente qué se debería almacenar - y dónde.

Para responder a estas preguntas, primero debemos considerar bajo qué circunstancias se utilizaran los respaldos. Hay tres situaciones principales:

  1. Peticiones de restauración pequeñas y discretas de los usuarios

  2. Restauraciones masivas para recuperarse de un desastre

  3. Almacenamiento de archivos que raramente se utilizará otra vez

Lamentablemente, hay diferencias irreconciliables entre el primer y segundo caso. Cuando un usuario elimina accidentalmente un archivo, usualmente quiere recuperar su archivo de inmediato. Esto implica que el medio de respaldo no esté más allá que unos pocos pasos del sistema en el cual se restauraran los datos.

En el caso de un desastre que necesita una restauración completa de una o más computadoras en su centro de datos, si el desastre fue de naturaleza física, lo que sea que haya sido destruído también habrá destruído los respaldos que estaban al lado de los computadores. Esto sería una situación muy mala.

El almacenamiento de los archivos es menos controversial; puesto que las posibilidades de que se vuelvan a utilizar son bastante bajas, si la media de respaldo fue ubicada a muchos kilómetros de distancia del centro de datos no habrá realmente ningún problema.

Los enfoques para resolver estas diferencias varían de acuerdo a las necesidades de la organización en el caso. Un acercamiento posible es almacenar varios días de respaldo en el sitio; estos respaldos se toman luego a un sitio de almacenamiento más seguro cuando se creen respaldos diarios más nuevos.

Otro enfoque sería mantener dos fondos diferentes de media:

Por supuesto, el tener dos fondos de datos implica la necesidad de ejecutar todos los respaldos dos veces o de hacer copias de los respaldos. Esto se puede hacer, pero los respaldos dobles pueden tomar bastante tiempo y requieren de múltiples unidades de respaldo para procesar las copias (y probablemente un sistema dedicado para efectuar la copia).

El reto para un administrador de sistemas es el de encontrar un balance que reuna adecuadamente las necesidades de todo el mundo, mientras que se asegura que los respaldos esten disponibles aún en las peores situaciones.

8.2.6. Problemas de restauración

Mientras que los respaldos son una ocurrencia diaria, las restauraciones generalmente son un evento menos frecuente. Sin embargo, las restauraciones son inevitables; seran necesarias, así que es mejor estar preparados.

Lo importante que se debe hacer aquí es ver a los diferentes escenarios de restauración en esta sección y determinar las formas de evaluar su habilidad para llevarlos a cabo en realidad. Tenga en cuenta que el más difícil a evaluar es también el más crítico.

8.2.6.1. Restauración a metal pelado

La frase "restauración a metal pelado" es la forma de describir de un administrador de sistemas el proceso de restaurar un respaldo completo de sistemas en un computador sin datos de ningún tipo en el - sin sistema operativo, sin aplicaciones, nada.

En general, existen dos enfoques para las restauraciones a metal pelado:

Reinstalar, seguido de una restauración

Aquí se instala el sistema operativo base como que si se estuviese configurando una computadora recién comprada. Una vez que el sistema operativo esté configurado adecuadamente, se pueden particionar y formatear los discos duros restantes y restaurar todos los respaldos desde la media.

Discos de recuperación del sistema

Un disco de recuperación del sistema es una media de arranque de algún tipo (a menudo un CD-ROM) que contiene un ambiente de sistemas mínimo, capaz de realizar las tareas básicas de administración del sistema. El ambiente de recuperación contiene las utilidades necesarias para particionar y formatear los discos, los controladores de dispositivos necesarios para acceder el dispositivo de respaldo y el software necesario para restaurar los datos desde la media de respaldo.

NotaNota
 

Algunos computadores tienen la capacidad de crear cintas de respaldo de arranque y utilizarlas para arrancar desde ellas e iniciar el proceso de restauración. Sin embargo, esta capacidad no está disponible en todos los computadores. Más aún, las computadoras basadas en la arquitectura de PC no se prestan para este enfoque.

8.2.6.2. Evaluar respaldos

Cada tipo de respaldo debería ser evaluado de forma periódica para asegurarse de que los datos se pueden leer. Es un hecho que algunas veces se realizan los respaldos que son, de una forma u otra, ilegibles. La parte desafortunada en todo esto es que muchas veces esto no se nota hasta que los datos se pierden y se deben restaurar desde el respaldo.

Las razones para esto pueden variar desde cambios en la alineación de los cabezales de la unidad de cinta, software de respaldo mal configurado o un error del operador. No importa la causa, sin las revisiones periódicas usted no puede estar seguro de si está generando respaldos a partir de los cuales se puedan restaurar los datos más adelante.

Notas

[1]

Estamos usando el término datos en esta sección para describir cualquier cosa que se procesa por el software de respaldo. Esto incluye software del sistema operativo, software de aplicaciones, así como también los datos reales. No importa lo que sea, para el software de respaldos, todos son datos.