Skip to main content
Qué es la tecnología RAID y qué tipos hay

Qué es la tecnología RAID y qué tipos hay

La tecnología RAID está dividida en configuraciones, a las que llamamos niveles, mediante las cuales se pueden obtener diferentes resultados en cuanto a las posibilidades para almacenar los datos

Bienvenidos a un nuevo post en byte-mind, en el caso de hoy vamos a tratar una tecnología de la que todavía no hemos hablado, la tecnología RAID. Aprenderemos qué es, en que consiste y que tipos existen de la misma.

En los días que corren seguramente hayas oído hablar de la configuración de discos en RAID, pero en la mayoría de casos se relaciona con empresas donde tener los datos replicados y disponibles en todo momento es vital. Pero hoy en día casi todas las placas base cuentan con la posibilidad de crear nuestros propios RAID.

Otro punto del que se oye hablar mucho es del almacenamiento en la nube, donde los datos se almacenan y guardan por ciencia infusa, pero realmente estas empresas que proporcionan estos servicios a través de internet cuentan con sistemas avanzados de seguridad y configuraciones RAID con una gran redundancia de datos para evitar la pérdida de los mismos.

 

¿Qué es la tecnología RAID?

El término RAID proviene del inglés “Redundant Array of Independent Disks” o para los de habla hispana, “Matriz Redundante de Discos Independientes“. Sólo con el nombre ya podemos hacernos una idea de la función de esta tecnología, que no es más que crear un sistema para el almacenamiento de datos utilizando múltiples unidades de almacenamiento entre las que se distribuirán o replicarán los mismos. Por lo tanto, estas unidades de almacenamiento podrán ser discos duros HDD o mecánicos, como unidades SSD o de estado sólido.

La tecnología RAID está dividida en configuraciones, a las que llamamos niveles, mediante las cuales se pueden obtener diferentes resultados en cuanto a las posibilidades para almacenar los datos. En un primer vistazo, lo que se aprecia de un RAID es un único almacén de datos, aunque realmente este compuesto por varios discos duros físicamente independientes.

El objetivo final de esta tecnología es ofrecer al usuario una capacidad mayor de almacenamiento y redundancia de datos para evitar su pérdida y proporcionar mejores niveles de lectura y escritura de datos que si tuviésemos sólo un disco duro. Esto variará en función del nivel de RAID que se implemente.

Cabe destacar que para que la escalabilidad de los discos sea óptima lo recomendable es utilizar discos idénticos tanto en prestaciones como en tecnología de fabricación.

En el caso de las empresas, esta tecnología se ha utilizado desde hace muchos años debido a la importancia de sus datos, y estas cuentan con uno o varios servidores dedicados específicamente para gestionar este almacén de datos con hardware diseñado para este uso. Pero en la actualidad, casi todos podemos montar un sistema RAID si tenemos una placa base relativamente nueva con un chipset que implemente este tipo de instrucciones internas. Tan sólo sería necesario conectar varios discos a nuestra placa base para empezar a configurarlo desde Linux, Mac o WIndows.

 

Ventajas y Desventajas del uso de RAID

Ahora que ya conocemos que es un RAID y dónde poder utilizarlo, debemos saber las ventajas y desventajas que tendríamos al implementar un sistema de este tipo.

Ventajas de un RAID

  • Alta tolerancia a fallos: mediante el uso de RAID se puede obtener una tolerancia a fallos mucho mejor que si sólo existiese un disco, aunque estará condicionado por las configuraciones adoptadas.
  • Mejoras en el rendimiento de lectura y escritura de datos: dependiendo de las configuraciones aplicadas, hay sistemas orientados a la mejora de prestaciones mediante la división de bloques en varias unidades para que trabajen en paralelo.
  • Buena escalabilidad y mejoras en la capacidad de almacenamiento: por lo que veremos más adelante son sistemas fácilmente escalables, según la configuración aplicada, en la que además sería posible utilizar discos de distinta naturaleza, arquitectura, capacidad y antigüedad.

Desventajas de un RAID

  • No asegura la recuperación ante desastres: hay aplicaciones que permiten la recuperación de ficheros de un disco dañado o corrupto, en el caso de RAID se necesitan controladores diferentes que no necesariamente serán compatibles con estas aplicaciones, por lo que un fallo en cadena o de varios discos podría provocar pérdidas de datos irrecuperables.
  • Migraciones complejas: hacer una copia de un disco es bastante simple, pero hacerlo con un RAID completo a otro similar es bastante complejo si no se dispone de las herramientas adecuadas.
  • Alto coste inicial: implementar un RAID con dos discos es sencillo y barato pero si queremos configuraciones más complicadas y con redundancia serán necesarios más discos por lo que se aumentaría el coste de montar este tipo de sistema.

Qué es lo que no se puede hacer con un RAID

  • La mejora en la velocidad no está asegurada: hay configuraciones sencillas de realizar, pero no todas las applicaciones son capaces de trabajar bien con un RAID y, en muchas ocasiones, no se van a obtener mejoras al utilizar dos discos en lugar de uno para almacenar los datos de forma dividida.
  • No es un medio de protección de datos: un RAID va a replicar los datos, pero no va a protegerlos. Por ejemplo el daño que un virus pueda hacer en un disco duro independiente, si entra en un RAID, necesitaremos un sistema de seguridad que lo proteja o tendremos el mismo resultado.

 

Niveles de RAID existentes

RAID 0

Configuración RAID 0

El primero de todos es el Nivel 0 o conjunto dividido. En este caso no hay redundancia de datos, ya que la función es la de distribuir los datos que se almacenan entre los discos duros conectados al equipo.

El objetivo de este nivel es proporcionar una mejora en la velocidad de acceso a los datos, ya que la información se almacena de forma repartida para tener acceso simultáneo a mayor cantidad de información con sus discos conectados en paralelo.

Este nivel no tiene información de paridad ni redundancia de datos por lo que si se rompe una de las unidades se perderían los datos que hubiese en su interior, a no ser que se hiciesen copias de seguridad externas a esta configuración.

Para realizar la configuración de RAID 0 es necesario prestar atención al tamaño de los discos que lo forman. En este caso será el disco de menos tamaño el que determinará el espacio añadido en el RAID.

Por ejemplo, si disponemos de un disco de 1TB y otro de 500 GB, el tamaño funcional será de 1 TB, cogiendo el de 500 GB y otros 500 GB del disco de 1 TB, por lo que en este caso, será ideal utilizar discos de un tamaño similar para poder utilizar todo el espacio disponible.

 

RAID 1

Configuración RAID 1

La configuración RAID 1 o también llamada espejo (mirroring) es una de las más utiliadas debido a que proporciona redundancia de datos y una buena tolerancia a fallos. En este caso creamos un almacén con información duplicada en dos discos duros, o dos conjuntos de discos duros, de tal forma que al almacenar el dato este se replique automáticamente en su unidad espejo, disponiendo así de dos veces el mismo dato.

A ojos del sistema operativo sólo tenemos una unidad de almacenamiento. En el caso de que esta falle automáticamente se buscará el dato en la unidad replicada. También es útil aumentar la velocidad de lectura de datos ya que podremos leer la información de forma simultánea en las dos unidades espejadas.

 

RAID 2

Configuración RAID 2

Este nivel RAID es poco utilizado, debido a que se basa en realizar un almacenamiento de forma distribuida en varios discos a nivel de bit. A su vez se crea un código de error de esta distribución de datos y se almacenará en unidades destinadas exclusivamente a este propósito. De esta forma todos los discos podrán ser monitorizados y sincronizados para escribir y leer datos. Debido a que los discos actuales ya llevan un sistema de detección de errores, esta configuración es contraproducente y se utiliza el sistema de paridad.

 

RAID 3

Configuración RAID 3

La configuración RAID 3 tampoco es muy utilizada en la actualidad. Consiste en dividir los datos a nivel de byte en las diferentes unidades que forman el RAID, excepto una, en la que se almacenará la información de paridad para poder unir los datos al ser leídos. Con esta configuración cada byte almacenado tiene un bit extra de paridad para la identificación de errores y la posibilidad de recuperación de datos en el caso de que se perdiese una unidad.

La ventaja de esta configuración es que los datos están divididos en varios discos y el acceso a la información es muy rápido. Para aplicar esta configuración se necesitan como mínimos 3 discos duros.

 

RAID 4

Configuración RAID 4

En RAID 4, también se almacenan los datos de forma dividida en bloques entre los discos del almacén, pero dejando uno de ellos para almacenar los bits de paridad. Se diferencia con RAID 3 en que si se pierde una unidad de datos, estos pueden ser reconstruidos en tiempo real gracias al los bits de paridad calculados.

Está orientado principalmente al almacenamiento de ficheros de un gran tamaño sin la necesidad de tener redundancia entre ellos, pero la escritura de los mismos es más lenta debido a la necesidad de realizar el cálculo de paridad cada vez que se escribe algún dato.

 

RAID 5

Configuración RAID 5

El RAID 5 también es conocido como sistema distribuido con paridad. En este caso se utiliza con más frecuencia que los niveles 2, 3 y 4, sobretodo en dispositivos NAS.

En este tipo de configuración la información se almacena de forma dividida en bloques, que se repartirán entre los distintos discos duros que forman el RAID, y además genera un bloque de paridad para asegurar la redundancia de datos y la posibilidad de la reconstrucción de los datos en caso de que un disco se corrompa o falle. Este bloque de paridad se almacena en una unidad diferente a los bloques de datos implicados en el bloque calculado, por lo que de esta forma la información de paridad estará almacenada en un disco diferente al utilizado para los bloques de datos.

En este caso, también se necesitarán al menos tres unidades de almacenamiento para asegurar la redundancia de los datos con paridad y sólo se tolerará el fallo en una unidad a la vez. En caso de perderse dos a la vez, perderíamos información de paridad y al menos uno de los bloques de datos implicados.

Además de esta configuración, existe una variante de la misma, RAID 5E, en la cual se introduce un disco extra de reserva para minimizar el tiempo de reconstrucción de los datos si una de las unidades fallase.

 

RAID 6

Configuración RAID 6

La configuración RAID 6 es una amplicación de RAID 5, en la que se añade un segundo bloque de paridad. Los bloques de datos se repartirán de nuevo en unidades diferentes y los bloques de paridad también estarán almacenados en dos unidades diferentes. De esta forma el sistema será tolerante al fallo de hasta dos unidades simultáneamente, pero a raíz de esto, necesitaremos como mínimo 4 unidades para poder realizar esta configuración.

Al igual que en la configuración del RAID 5, en este caso también existe una variante, RAID 6E, con el mismo objetivo de disponer de una unidad de reserva para la recuperación de datos.

 

Niveles de RAID anidados

Además de las diferentes configuraciones RAID que hemos visto existen los niveles anidados, que como su nombre indica, son sistemas que cuentan con un nivel RAID principal, pero que a su vez contienen otros subniveles en otra configuración.

Pasaremos a explicar los niveles anidados más utilizados en la actualidad.

RAID 0+1

Configuración RAID 0+1

La configuración anidada RAID 0+1 o también llamada espejo de divisiones consiste en un nivel principal de tipo RAID 1 encargada de realizar las funciones de replicación de los datos que se encuentran en un primer subnivel a un segundo. A su vez existe un subnivel RAID 0 encargado de almacenar los datos de forma distribuida entre las unidades. De esta forma disponemos de un nivel principal encargado de hacer la función de espejo y de subniveles encargados de hacer la división de los datos, por lo que si una unidad falla los datos están guardados en el otro RAID 0 espejado.

La desventaja de esta configuración es la escalabilidad, al añadir un disco adicional en un subnivel, debemos de añadir también uno en el otro subnivel, por lo que el coste será mayor que en un nivel convencional.

Además, la tolerancia a fallos permitirá la rotura de un disco en cada subnivel o dos en el mismo subnivel. Cualquier otra combinación provocaría la pérdida de datos.

 

RAID 1+0

Configuración RAID 1+0

En este caso sería lo contrario al anterior, la configuración de RAID 1+0 o también denominada división de espejos. En esta configuración disponemos de un nivel principal de tipo 0 que dividirá los datos almacenados entre los distintos subniveles y, a su vez, varios subniveles de tipo 1 encargados de replicar los datos en las unidades que disponen.

Además en esta configuración, la tolerancia a fallos nos permitirá la posibiliad de que se rompiesen todos los discos de un subnivel a excepción de uno, siendo necesario que quede al menos uno en cada subnivel para evitar la pérdida de datos.

 

RAID 50

Configuración RAID 50

En el nivel anidado RAID 50 se dispone de un nivel RAID 0 principal que divide los datos en varios subniveles configurados como RAID 5, con sus respectivos 3 discos duros. En cada bloque existirán una serie de datos con su correspondiente paridad. En este caso puede fallar un disco en cada RAID 5, asegurando la integridad de los datos, pero si fallá más de una unidad perderemos los datos almacenados en las mismas.

 

RAID 100 y RAID 101

Configuración RAID 100 y RAID 101

Además de los niveles anidados vistos de dos niveles, también podemos tener un árbol de tres niveles, como es el caso de las configuraciones RAID 1+0+0 o RAID 1+0+1.

En la configuración de RAID 100 disponemos de dos subniveles RAID 1+0 divididos a su vez por un nivel principal en RAID 0.

En el caso de RAID 101 dispone de un RAID 1 como nivel principal y varios subniveles de RAID 1+0. En este caso la velocidad de acceso y redundancia es muy buena y ofrece una gran tolerancia a fallos, aunque los costes de montar esta configuración es considerablemente más alto que en las vistas anteriormente.

 

 

Esto es todo por el momento, espero que esta información sea de utilidad para entender mejor que es un sistema de almacenamiento RAID y las posibilidades de configuración existentes en el mismo.

Y como siempre, si tienen alguna duda o sugerencia es bienvenida en la sección de comentarios.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada.