You are on page 1of 16

Facultad Politcnica

Sistemas Operativos de Microcomputadoras

Sistemas de almacenamiento raid

Prof.: Ing. Walter Fidelino Cubilla Caballero

Integrantes: Marcelo Arvalos Derlis Frutos Nicols Mendez Tito Quintana

Ever Quionez

San Lorenzo- paraguay 2013

INTRODUCCIN
Hasta principios de los aos 90, el mtodo tradicional para almacenar la informacin consista en conectar discos duros HDD (Hard Disk Drive) individuales creando un almacenamiento de conexin directa DAS (Direct Attached Storage), hoy estos sistemas siguen utilizndose pese a sus desventajas. Los HDD en s resultan bastante asequibles, pero el costo asociado a su conexin y gestin, as como la demora que conllevan los procesos de manipulacin de los datos, es lo que resulta elevado en comparacin con tecnologas de almacenamiento mas recientes. Emplear varios HDD combinados en paralelo para formar una nica unidad lgica identificada con un nmero de unidad lgica LUN (Logical Unit Number), en la que se almacenan los datos de forma redundante. Esta combinacin de discos se denomina arreglo redundante de discos independientes RAID (Redundant Array of Independent Disks) aunque en sus inicios fue denominada arreglo redundante de discos de bajo costo (Redundant Array of Inexpensive Disks).

Sus Orgenes
Como hemos visto, el procesamiento en paralelo se utiliza cada vez ms para agilizar el rendimiento de la CPU. Con el paso de los aos, a varias personas se les ha ocurrido que la E/S en paralelo podra ser una buena idea tambin. En su artculo de 1988, Patterson y colaboradores sugirieron Seis organizaciones de discos especficas que se podran utilizar para mejorar el rendimiento del disco, su confiabilidad o ambas caractersticas (Patterson y colaboradores, 1988). Estas ideas fueron adoptadas de inmediato por la industria y han conllevado a una nueva clase de dispositivo de E/S conocido como RAID. La idea bsica detrs de un RAID es instalar una caja llena de discos a un lado de la computadora (que por lo general es un servidor grande), reemplazar la tarjeta controladora de discos con un controlador RAID, copiar los datos al RAID y despus continuar la operacin normal.

RAID 0 REPARTO DE BLOQUES - STRIPING

RAID nivel 0 requiere al menos dos HDD para poder ser implementado. Es el modo RAID ms rpido. Las capacidades disponibles de cada disco se aaden juntas, de modo que se monta un solo volumen en el ordenador. Funcionamiento RAID 0 implementa un arreglo de discos en franjas en donde los datos son divididos en bloques y cada bloque es almacenado en un disco distinto. Ventajas En esta configuracin un arreglo de discos mejora el desempeo de entrada/salida al distribuir la carga de escritura y lectura a travs de varios canales y platinas de disco. El mejor desempeo es alcanzado cuando los datos son distribuidos en varios controladores con slo un disco por controlador.

No hay sobrecarga por el clculo de paridad Diseo simple Sencillez de implementacin. No es un RAID debido a que no es redundante ni tolerante a fallas La falla de una platina resulta en la prdida de los datos de todo el arreglo.

Desventajas

Recomendaciones

Nunca se debe de utilizar en ambientes de misin crtica. Es muy til en produccin y edicin de vdeo e imgenes, as como aplicaciones de pre impresin. En general para aplicaciones que requieran de un alto ancho de banda.

Aplicaciones RAID 0 es ideal para los usuarios que necesitan la mxima velocidad y capacidad. Los editores de vdeo que trabajan con archivos grandes pueden utilizar RAID 0 al editar varios flujos de vdeo para un rendimiento ptimo de la reproduccin. Una matriz RAID 0 es ms adecuado para el trabajo activo con archivos (por ejemplo, edicin de vdeo) y no debe utilizarse como una solucin de copia de seguridad de almacenamiento independiente o en sistemas crticos para la misin

RAID 1 ESPEJO Y DUPLICACIN

El RAID nivel 1, tambin llamado espejo, tambin denominado SAFE es un modo RAID seguro que requiere al menos 2 unidades y que trabaja con pares de unidades. En este nivel se realiza un arreglo de discos en espejo donde los datos son escritos y ledos de manera simultnea en dos HDD distintos como se muestra en la figura. Para mejor desempeo, el controlador debe ser capaz de realizar dos lecturas concurrentes independientes o dos escrituras duplicadas por cada par de HDD en espejos. Ventajas En esta configuracin un arreglo de discos puede realizar una escritura o dos lecturas por par en espejo, duplicando la tasa de transaccional de lectura de discos simples con la misma tasa transaccional de escritura que los discos tradicionales. Una redundancia total de datos significa que no es necesaria la reconstruccin en caso de falla de algn disco, sino slo una copia.

La tasa de transferencia por bloques es la misma que en los discos tradicionales.

Bajo ciertas circunstancias RAID 1 puede soportar fallas simultneas mltiples de discos. Es el diseo RAID ms simple. Sencillez de implementacin.

Desventajas

Es el que tiene mayor derroche de disco de todos los tipos de RAID, con el 100% de derroche. Tpicamente la funcin RAID es llevada a cabo por el software del sistema cargando a la UCP al servidor, degradando el desempeo del mismo. Probablemente no soporte cambio en caliente de un disco daado cuando se implementa por software.

Recomendaciones

Buscar una implementacin por hardware. Funciones administrativas y financieras.

En general para aplicaciones que requieran de una alta disponibilidad.

RAID 2: Cdigo de Correccin de Errores con cdigo de Hamming

Cdigo Hamming: es un cdigo detector y corrector de errores que lleva el nombre de su inventor, Richard Hamming. En los datos codificados en Hamming se pueden detectar errores en un bit y corregirlos, sin embargo no se distingue entre errores de dos bits y de un bit (para lo que se usa Hamming extendido). Esto representa una mejora respecto a los cdigos con bit de paridad, que pueden detectar errores en slo un bit, pero no pueden corregirlo.

Introduccin: RAID nivel 2 requiere al menos dos platinas de disco para poder ser implementado. Para mejor desempeo, el controlador debe de ser capaz de realizar dos lecturas concurrentes independientes por par espejo o dos escrituras duplicadas por par de discos en espejo.

Funcionamiento Cada bit de cada palabra es escrito a un disco, 4 en el ejemplo grfico. Cada palabra tiene su Cdigo Hamming de Correccin de Errores (CHCE) almacenada en los discos CHCE. Durante la lectura el CHCE verifica y corrige los datos o errores especficos en los discos. Ventajas En esta configuracin un arreglo de discos puede realizar una escritura o dos lecturas por par en espejo, duplicando la tasa de transaccional de lectura de discos simples con la misma tasa transaccional de escritura que los discos tradicionales. Una redundancia total de datos significa que no es necesaria la reconstruccin en caso de falla de algn disco, sino slo una copia.

Capacidad de correccin de errores al paso. Es posible alcanzar tasas de transferencia muy altas.. A mayor tasa de transferencia requerida, es mejor la relacin de los discos de datos a los discos CHCE. El diseo del controlador es relativamente simple comparado con los niveles 3,4 y 5.

Desventajas

Puede tener una alta relacin de los discos CHCE a los discos de datos con tamaos de palabra pequeos, tornando el sistema ineficiente. Costo de nivel de entrada muy alto, requiere de una muy alta tasa de transferencia para justificarlo. No existen implementaciones comerciales ya que comercialmente no es viable.

Recomendaciones

(Ninguna).

RAID 3: Transferencia en paralelo con paridad

RAID nivel 3 requiere cuando menos 3 discos para funcionar.

Funcionamiento
El bloque de datos es subdividido en bandas y escrito en los discos de datos. Las bandas de paridad son generadas durante la escritura, almacenadas en los discos de paridad y verificado durante la lectura

Ventajas

Muy alta tasa de transferencia de lectura. Muy alta tasa de transferencia de escritura. La falla de un disco tiene impacto poco relevante para la capacidad de transferencia. Baja relacin de discos de paridad contra los de datos, lo que aumenta la eficiencia.

Desventajas

En el mejor de los casos la tasa de transacciones es la misma que en configuraciones de un solo disco. Diseo de controlador relativamente simple. Muy complejo y demandante de recursos para implementarse por software.

Recomendaciones

Produccin de video y transmisiones digitales en lnea.

Edicin de imgenes. Edicin de vdeo. Aplicaciones de preedicin. Cualquier tipo de aplicacin que requiera alta densidad de transferencia de datos.

RAID 4: Discos independientes de dato con disco compartido de paridad

RAID nivel 4 requiere cuando menos 3 discos para funcionar.

Funcionamiento
Cada bloque completo es escrito en un disco de datos. La paridad para bloques del mismo rango es generada durante las escrituras y almacenada en el disco de paridad, y verificada durante las lecturas.

Ventajas

Muy alta tasa transaccional de lectura. Baja relacin de discos de paridad contra los de datos, lo que aumenta la eficiencia. Alta tasa de transferencia agregada para lectura.

Desventajas

Tiene la peor tasa transaccional de escritura as como para escritura agregada. Diseo muy complejo de controlador. Reconstruccin de datos compleja e ineficiente en caso de falla de disco. Tasa de transferencia en lectura por bloques igual a la de un disco simple.

Recomendaciones

(Ninguna)

RAID 5: Discos independientes de datos con bloques distribuidos de paridad.

RAID 5 combina la distribucin en bandas del RAID 0 con la redundancia de datos en una matriz que tenga un mnimo de tres discos. La diferencia entre RAID 3 y un RAID 5 es que una configuracin RAID 3 ofrecer mejor rendimiento a expensas de una capacidad total ligeramente menor. Los datos se distribuyen en bandas entre todos los discos y en cada banda se escribe un bloqueo de paridad (P) para cada bloque de datos. Si un disco fsico falla, los datos del disco averiado pueden reconstruirse en un disco de recambio. Los datos no se pierden en caso de avera de un solo disco, pero si falla un segundo disco antes de que se reconstruyan los datos en una unidad de repuesto, se perdern todos los datos de la matriz.

Funcionamiento
Cada bloque de datos completo es escrito en un disco de datos; la paridad para los bloques en en mismo rango es generada durante las escrituras, almacenada en locaciones distribuidas y verificada durante las lecturas.

Ventajas
Tiene la ms alta tasa de transacciones de lectura. Regular tasa de transacciones de escritura.

Baja relacin entre los discos de paridad contra los discos de datos ofreciendo una alta eficiencia. Buena tasa de transferencia de agregado. Es el nivel de RAID ms verstil. La falla de un disco tiene impacto sensible en el desempeo. El diseo del controlador es el ms complejo. La reconstruccin de datos en caso de falla de un disco es compleja, comparada con RAID 1. Tasa de transferencia en bloques individuales de datos igual que la de un disco sencillo.

Desventajas

Recomendaciones
Servidores Servidores Servidores Servidores de aplicaciones y archivos. de bases de datos. Web, correo electrnico y noticias. de Intranet.

RAID 6
Discos independientes de datos con con dos esquemas independientes de paridad

RAID nivel 6 requiere n+2 discos para funcionar.

Funcionamiento
Esencialmente RAID 6 es una extensin de RAID 5 que aumenta la tolerancia a fallos utilizando bandas de paridad bidimensionales. Las bandas de paridad bidimensionales consisten en la utilizacin de un segundo esquema independiente de distribucin de bandas de paridad. Los datos son separados en bandas a nivel de bloques a travs de todos los discos, como en RAID 5, y un segundo conjunto de paridad es calculado y escrito en todos los discos; RAID 6 provee una tolerancia a fallos extremadamente alta y puede soportar mltiples fallas simultneas de discos.

Ventajas
Muy alta tolerancia a fallos de disco. Tolerancia a fallas de mltiples discos.

Desventajas
Diseo complejo del controlador. Alta sobrecarga del controlador para calcular direcciones de paridad. Pobre desempeo para la escritura. Requiere de n+2 discos debido al esquema de paridad bidimensional.

Recomendaciones
Ideal para aplicaciones de misin crtica.

Arreglos de doble nivel


Existen otros niveles de arreglos que son combinaciones de los bsicos ya descritos. stos se clasifican como arreglos de doble nivel y cada uno posee sus caractersticas especficas derivadas de los niveles bsicos que los originan. Del mismo modo existen arreglos propietarios que los fabricantes elaboran para soluciones puntuales. Los arreglos de doble nivel se utilizan tanto en los sistemas DAS como en otras soluciones de almacenamiento que les sucedieron. Actualmente existen diversos niveles disponibles, por ejemplo: RAID nivel 1E, RAID nivel 1.5, RAID nivel 50, RAID nivel 53, RAID nivel 60, RAID nivel 10 y RAID nivel 0+1.

RAID 10: Divisin de espejos

MIRRORING STRIPING

MIRRORING

RAID 10 (tambin llamado RAID 1+0) es otro nivel de RAID que combina los atributos de otros niveles, especficamente RAID 1 y RAID 0. Es una "distribucin de conjuntos duplicados", lo que significa que los datos se distribuyen en bandas entre dos matrices duplicadas. La distribucin en bandas se produce entre las matrices y la duplicacin se produce dentro de la misma matriz, lo que hace muy rpida la reconstruccin. Las matrices RAID 10 deberan tener los discos en mltiplos de cuatro.

En una matriz RAID 10, un disco de cada par duplicado puede fallar sin prdida de datos. Sin embargo, el disco en funcionamiento en una matriz con un disco averiado se convierte en el punto dbil de toda la matriz. Si el segundo disco de un par duplicado falla, se perder toda la matriz.

Funcionamiento

RAID 10 es una implementacin de un arreglo en bandas cuyos segmentos son arreglos de RAID 1.

Ventajas
Misma tolerancia a fallas que RAID 1. Misma sobrecarga para tolerancia a fallos que el espejeo por s mismo. Al crear segmentos con las bandas de RAID 1 se alcanzan altas tasas de Entrada/Salida En ciertas circunstancias RAID 10 puede soportar fallas simultneas de varios discos. Alto costo / Alta sobrecarga Todas las platinas de disco se deben de mover en paralelo para alcanzar el mximo desempeo sostenido Escalabilidad limitada a un alto costo inherente Solucin ideal para sitios que requieren RAID 1 con desempeo adicional. Servidores de bases de datos que requieran alto desempeo y tolerancia a fallas.

Desventajas

Recomendaciones

RAID 0+1 Espejo de divisiones

RAID 0+1 es un modo RAID seguro que est compuesto de un duplicado de conjuntos distribuidos. Las matrices RAID 0+1 deberan tener los discos en mltiplos de cuatro. En una matriz RAID 0+1, el quinto disco puede ser de repuesto o permanecer sin utilizar. En el diagrama, a la derecha, la matriz B es un duplicado de la matriz A. En un RAID 0+1 pueden fallar hasta dos discos sin prdida de datos, mientras

que los discos que fallen no formen parte de diferentes pares del RAID 0. En referencia al diagrama, los discos 1 y 2 pueden fallar y los datos se conservarn en los discos 3 y 4.

FUNCIONAMIENTO:

El RAID nivel 0+1 es recomendable implementar en entornos

donde las aplicaciones requieran alto desempeo sin que sea necesario alcanzar la mxima confiabilidad. Generalmente se usa en servidores destinados a brindar aplicaciones para el tratamiento de imgenes y tambin en servidores de archivos. Pueden fallar hasta dos discos sin prdida de datos

Ventajas:
En un RAID 0+1 es que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro conjunto de nivel 0 para reconstruir el conjunto global

Desventaja: el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar dos fallos simultneos de discos salvo que sean en la misma divisin.

Recomendaciones:

Dados estos cada vez mayores riesgos del RAID 0+1 (y su vulnerabilidad ante los fallos dobles simultneos), muchos entornos empresariales crticos estn empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden un mecanismo de paridad subyacente.

RAID 30
UNA DIVISIN DE NIVELES RAID CON PARIDAD

El RAID 30 o divisin con conjunto de paridad dedicado es una combinacin de un RAID 3 y un RAID 0.

VENTAJAS El RAID 30 proporciona tasas de transferencia elevadas combinadas con una alta fiabilidad a cambio de un coste de implementacin muy alto. La mejor forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30 trocea los datos en bloque ms pequeos y los divide en cada conjunto RAID 3, que a su vez lo divide en trozos an menores, calcula la paridad aplicando un XOR a cada uno y los escriben en todos los discos del conjunto salvo en uno, donde se almacena la informacin de paridad. El tamao de cada bloque se decide en el momento de construir el RAID, Etc...

Finalidades del Sistema RAID


I II III IV Mejorar la tolerancia a fallos y errores Aumentar la integridad de los datos Mejorar el rendimiento Ofrecer una alternativa econmica frente a los sistemas SCSI

Tcnicas para mejorar el sistema RAID


Mayor Fiabilidad: RAID emplea dos tcnicas para aumentar la fiabilidad. La redundancia de los datos implica el almacenamiento de los mismos datos en ms de una unidad. Es muy eficaz pero tambin es muy costoso. La paridad de datos se realiza mediante un algoritmo matemtico. Es menos costoso que la redundancia, ya que no requiere el uso de un conjunto redundante de unidades de disco. Alta Disponibilidad: Se divide en dos aspectos: La integridad de los datos: capacidad de obtener los datos adecuados en cualquier momento. Reparacin dinmica de sectores (debidos a errores de software) La tolerancia a fallas: capacidad para mantener los datos disponibles en caso de que se produzcan uno o varios fallos en el sistema. Mejora del Rendimiento/ Velocidad: RAID permite a varias unidades trabajar en paralelo, lo que aumenta el rendimiento del sistema.

Conclusiones
Se han analizado aspectos que caracterizan a los sistemas de respaldo de datos mediante la implementacin de la tcnica RAID y se ha determinado que el uso de esta tcnica tiene mltiples ventajas y aplicaciones que poseen diferentes caractersticas que hacen que haya una variedad de soluciones en correspondencia con los niveles RAID implementados. Se han puntualizado caractersticas como la complejidad del controlador, la tasa de transferencia de datos durante los procesos de lectura y escritura, la capacidad de redundancia y tolerancia ante fallos, as como los escenarios ms adecuados para cada nivel implementado. Cualquier implementacin de niveles RAID ofrece mayor rendimiento y tolerancia ante posibles fallos que si se empleara un nico HDD o un grupo de ellos conectados de forma independiente JBOD (Just a Bunch Of Disks), mtodo popular de combinar mltiples HDD para crear un nico disco virtual de capacidad aditiva donde los datos son almacenados sin fragmentar y que no se clasifica como un RAID.

You might also like