You are on page 1of 9

BASES

DE
DATOS
II
BASES
DE
DATOCO
LUMNAR
ES
ING.
OSWALD
O DIAZ R.
INTEGRA
NTES:
EDUARD
O VERA
C.
JHONATH
AN
LECHIN
M.

Contenido
1.

Titulo.............................................................................................................. 3

2.

Objetivos:........................................................................................................ 3
2.1

Objetivo General......................................................................................... 3

2.2

Objetivos Especficos.................................................................................... 3

3.

Antecedentes.................................................................................................... 3

4.

Introduccin..................................................................................................... 3

5.

Marco Terico................................................................................................... 4

4.1.

Qu son Bases De Datos Columnares?................................................................4

4.2.

Bases de datos columnares para un ambiente Data Warehouse.....................................5

4.3.

Introduccin a operaciones y consultas en bases de datos columnares............................5

4.3.1.

Creacin de registros.................................................................................... 5

4.3.2.

Acceso a los datos........................................................................................ 6

4.3.3.

Actualizando y eliminando datos......................................................................6

4.4.

Tcnicas de indexacin, compresin y paralelizacin................................................6

4.5.

Principales bases de datos columnares..................................................................7

4.5.1.

Project Gemini............................................................................................ 7

4.5.2.

Infobright.................................................................................................. 7

4.5.3.

Vertica...................................................................................................... 7

4.5.4.

QD Technology........................................................................................... 8

4.5.5.

SyBase...................................................................................................... 8

4.5.6.

ParAccel.................................................................................................... 8

5.

Referencias...................................................................................................... 8

ESPE Pgina 2

1. Titulo
Base de Datos Columnares

2. Objetivos:
2.1 Objetivo General
Investigar todo lo referente a las Base de Datos Columnares.

2.2 Objetivos Especficos

Identificar las ventajas y desventajas de una Base de Datos Columnar.


Indicar el tipo de implementacin.
Implementar ejemplos.

3. Antecedentes
A medida que pasa el tiempo el volumen de datos crece conjuntamente con el pasar
de aos, por lo cual las bases de datos se llenan con gran cantidad de informacin
haciendo que el tiempo de respuesta de bsquedas a consultas sea cada vez ms
lento, por lo cual se ha buscado innovar y dar una solucin a dicha problemtica.
Las grandes empresas y organizaciones que emplean grandes almacenes de datos
especialmente utilizados para anlisis de negocios e informes, con procesamiento
complejo de minera de datos da como necesidad mejorar el rendimiento lo cual
supera las capacidades de las tradicional Base de Datos Relacional.
Las Bases de Datos Columnares han ido creciendo por los resultados obtenidos y
las ventajas de implementacin que significa como optimizar recursos y mejorar
tiempo de respuesta entre otras muchas, en Ecuador por desconocimiento no existe
una mayor implementacin de Bases Columnares.

4. Introduccin
ESPE Pgina 3

Con la facilidad que actualmente tienen las personas para poder acceder a internet, ha
generado que los usuarios generen una gran cantidad de informacin la cual es muy
importante para el anlisis y las organizaciones tomen mejores decisiones.
Todo esto ha ocasionado que las bases de datos relacionales tengan bajo rendimiento, lo
cual implica que los desarrolladores deban optimizar consultas, programacin y ejecucin
de procesos ya que estos pueden tardar mucho en la recopilacin de los datos solicitados.
Teniendo en cuenta todo esto, se ha puesto como solucin un cambio de paradigma,
dejando de analizar los datos de forma relacional.
Las Base de Datos Columnares fueron creadas en 1970 en productos Model 204 y
ABABAS dicho enfoque ha resurgido en Verta y en cierta medida en QD Technology. Son
bases de datos organizadas columna por columna diseadas para soportar grandes
cantidades de informacin.
En el siguiente trabajo se realiz para la materia de Base de Datos II de Ingeniera en
Sistemas e Informtica de la Universidad de las Fuerzas Armadas ESPE. Es una
investigacin documental con modalidad bibliogrfica, cuyo objetivo principal es investigar
toda la informacin referente a las Base de Datos Columnares

5. Marco Terico
5.1 Qu son Bases De Datos Columnares?
Este modelo de base de datos permite que la informacin sea almacenada de forma efectiva,
evitando los valores nulos, simplemente no insertando nada al momento que un valor no exista.
Las unidades de datos ya no son insertadas como filas convirtindolas a pares de llaves y
valores dando la definicin de cada una de las columnas .
Figura 1. Tabla basada en filas y columnas

Fuente: (Cruz, 2012, p. 8)

ESPE Pgina 4

Este modelo de columnas es utilizado con ms frecuencia en ambientes Data Warehouse para
los anlisis OLAP. Entre las bases de datos ms conocidas estn Hbase, Cassandra, Hypertable,
etctera.

5.2 Bases de datos columnares para un ambiente Data Warehouse


Estas bases de datos brindan una solucin al problema del incremento masivo de datos, debido
a la facilidad de acceso y resumen de datos que es posible lograr debido a su estructura de
columnas. Esto es muy til en los ambientes Data Warehouse y as generar de forma ms
eficiente reportes de inteligencia de negocios o reportes OLAP para el anlisis de datos.
La principal comparacin entre las bases de datos basadas en filas y columnas es comnmente
sobre la eficiencia de acceso al disco para la carga de datos. Se pueden mencionar los
beneficios que provee esta tecnologa:
Las bases de datos columnares son ms eficientes para el clculo de valores, tales
como, sumas, conteos, restas, promedios, etctera.
Estas bases de datos son ms eficientes para la insercin de datos, esto debido a que un
dato de columna puede ser escrito y reemplazado sin afectar o buscar otros valores de
las columnas.
Las bases de datos columnares encajan perfectamente para reportes de inteligencia de
negocios por su rapidez de acceso a todos los datos para ser analizados.

5.3 Introduccin a operaciones y consultas en bases de datos columnares


5.4
Un aspecto muy importante para la poblacin de datos son las operaciones de creacin, lectura,
actualizacin y eliminacin de datos. Por lo que es importante conocer cmo estas operaciones
se aplican en el mundo de NoSQL, en esta tecnologa las operaciones de creacin y lectura son
las ms importantes, tanto as, en algunas ocasiones son las nicas utilizadas.

5.4.1 Creacin de registros


Al crear un nuevo registro un usuario, significa que debe existir una forma de
identificar que el registro ya existe, si no este debe ser actualizado y no creado
nuevamente.
En las bases de datos relacionales los registros son almacenados segn una llave
primaria la cual identifica a cada registro como nico. Cuando es necesario realizar una
insercin se realiza una bsqueda por medio de la llave primaria para determinar si el
valor existe o no.
Las bases de datos columnares no estn definidas por el concepto de relaciones, ya que
las tecnologas NoSQL evitan las uniones entre los datos. Estas bases de datos
almacenan los datos de forma desnormalizada casi replicando una tabla de hechos en el
Data Warehouse.

ESPE Pgina 5

5.4.2 Acceso a los datos


La forma ms fcil y eficiente de ejecutar consultas en las bases de datos columnares,
es por medio de un indicador que direccione al dato que se desea consultar. Estos
valores son ordenados y almacenados para que su acceso sea ptimo. Por lo que,
siempre es necesario indicar una Llave/Valor el cual identifique cada uno de los
registros.
Esto significa que los datos sern accedidos por medio de un valor. Es de mucha
utilidad relacionar el valor de la llave con los datos contenidos en la tabla. Como una
buena prctica es muy comn combinar las columnas de la tabla para crear valores de
llave, esto depender de qu datos sean los ms consultados.

5.4.3 Actualizando y eliminando datos


Las bases de datos relacionales estn basadas en los principios de atomicidad,
consistencia, aislamiento y durabilidad, las cuales consolidan la integridad de los datos,
para aplicar las actualizaciones sobre los datos.
Las bases de datos columnares al contrario no dan mayor importancia a las
transacciones de actualizacin y en algunos casos las ignora por completo. Para
iniciarse debe tener claro que los conceptos de bloqueo no existen en las bases de datos
columnares, ya que los bloqueos en los sistemas distribuidos son muy complejos y
genera deficiencia en tiempos de respuesta.
Algunas bases de datos columnares soportan muy limitadamente el bloqueo de lecturaescritura a nivel de valores. Esto significa que los valores sern bloqueados cuando
cualquier columna d ese valor, si est siendo modificada, actualizada o creada.
La atomicidad en las bases de datos columnares soportan los ms mnimos principios,
comparado con las tradicionales. Estas son comnmente establecidas en sistemas
distribuidos con lo que es muy complejo contar con una perfecta integridad y
consistencia de datos, ya que algn fallo o error en un servidor puede afectar por
completo los datos reales en el clster.

5.5 Tcnicas de indexacin, compresin y paralelizacin.


Hoy los sistemas columnares combinan su estructura columnar con tcnicas que incluyen la
indexacin, compresin y paralelizacin.
Tiempo de carga: Son a menudo medidos en gigabytes por hora, que puede ser
extremadamente lento, cuando de decenas o cientos de gigabytes de datos se trata. La
cuestin a menudo carece de una respuesta sencilla, porque la velocidad de carga puede
variar en funcin de la naturaleza de los datos y las elecciones realizadas por el usuario.
Pruebas realistas basadas en sus propios datos son el mejor camino para una respuesta
clara.
Carga Incremental: Una vez que un conjunto de datos se ha cargado, todo debe ser
recargado cada vez que hay una actualizacin. Muchos sistemas columnares permiten
carga incremental, teniendo slo los registros nuevos o modificados y la fusin de los

ESPE Pgina 6

datos anteriores. Las Cargas incrementales a menudo deben completarse peridicamente


con una reconstruccin completa.
Compresin de datos: Algunos sistemas columnares pueden comprimir mucho la fuente
de datos y archivos resultantes a fin de tomar una fraccin de espacio en el disco original.
Puede ocasionar en estos casos un impacto negativo en el rendimiento por la
descompresin de datos a realizar la lectura. El enfoque ms adecuado depender de sus
circunstancias.
Limitaciones estructurales: Las bases de datos columnares utilizan diferentes tcnicas
para imitar una estructura relacional. Algunos requieren la misma clave principal en todas
las tablas, es decir, la jerarqua de la base de datos est limitada a dos niveles. Los lmites
impuestos por un sistema en particular no parece tener importancia, pero recuerde que sus
necesidades pueden cambiar maana. Limitaciones que parece aceptable ahora podra
evitar que la ampliacin del sistema en el futuro.
Tcnicas de acceso: Algunas bases de datos de columnares slo se pueden acceder
utilizando su propio proveedor de lenguaje de consultas y herramientas. Estos pueden ser
muy poderosos, incluyendo capacidades que son difciles o imposibles usando el estndar
SQL. Pero a veces faltan funciones especiales, tales como las consultas que comparan
valores con o en los registros.
Rendimiento: Los sistemas columnares por lo general superan a los sistemas de relaciones
en casi todas las circunstancias, pero el margen puede variar ampliamente. Las consultas
que incluyen clculos o acceso individual a los registros puede ser tan lento o ms que un
sistema relacional adecuadamente indexado.
Escalabilidad: El punto de las bases de datos columnares es obtener buenos resultados en
grandes bases de datos. Pero no puede asumir todos los sistemas pueden escalar a decenas
o centenares de terabytes.

5.6 Principales bases de datos columnares


5.6.1

Project Gemini
Ese es el nombre que recibe la interesante propuesta que nos hacen desde Microsoft, para
renovar su base de datos OLAP. Se trata de un almacenamiento en memoria y orientado a
columnas de Analysis Services para ser explotado desde Excel, entre otras opciones. Se
trata de empezar a jugar fuerte en el campo del BI, aprovechando la herramienta basada en
la popular hoja de clculo que se incluye dentro del portfolio ofrecido actualmente por
Microsoft.

5.6.2 Infobright
Combina una base de datos orientada a la columna con la red de conocimiento para
ofrecer una arquitectura de auto-gestin de Data Warehouse optimizado para el anlisis.
Este software sofisticado elimina el tiempo y el esfuerzo que suelen participar en la
ejecucin y la gestin de un Data Warehouse, liberando su tiempo y su presupuesto.

ESPE Pgina 7

5.6.3 Vertica
Es el nico DBMS habilitado para gestionar terabytes de datos ms rpido y ms fiable
que cualquier otro producto de almacenamiento de datos. Cambia completamente la
economa de la BI, que permite rpidamente iniciar un espectro mucho ms amplio de
anlisis del negocio.

5.6.4 QD Technology
De respuesta rpida (QD ) es una solucin de base de datos relacional que permite a los
ejecutivos de negocios y analistas de datos fcil y cmodamente obtener respuestas
rpidas a consultas de base de datos de copias locales de su base de datos. Consultas
correr ms rpido que con otras soluciones y ya que se ejecutan en los ordenadores de
usuario, que no interfieran con otros las actividades de los usuarios, y se puede ejecutar en
cualquier lugar.

5.6.5 SyBase
Es una base de datos relacional basada en columnas que es intrnsecamente ms apropiado
para el adecuado procesamiento de consultas que un enfoque basado en filas. Debido a
que est basado en columnas,Sybase IQ aprovecha las caractersticas de cada columna en
la tabla, en un nmero de diferentes caminos.

5.6.6

ParAccel
Es una base de datos robusta, relacional y totalmente transaccional DBMS para Data
Warehousing, analtica y con aplicaciones BI. Su impresionante velocidad se construye en
la sintonizacin manual de estructuras como ndices, vistas materializadas y tablas de
resumen no son necesarias. Este verstil rendimiento no depende de un diseo de esquema
estrella, su flexible esquema neutral permite tambin desencadenar el poder
de ParAccel para normalizar y de normalizar los datos.

6. Conclusiones

La principal ventaja de este tipo de Base de Datos es el rpido acceso a los datos:
el cual nos permite consultar rpidamente los datos columna a columna, al
guardarse fsicamente de manera contigua.
Con el fin de satisfacer la necesidad de un mejor tiempo de respuesta y un
rendimiento eficaz, se necesita un enfoque alternativo de base de datos, que
comienza por el almacenamiento de datos orientados por columnas en lugar de
filas.
Las bases de datos Columnares son vigentes hoy en da dado que, ha optimizado
los accesos a disco durante los procesos de lectura y escritura lo cual significa
mayor eficiencia.

ESPE Pgina 8

7. Referencias
Cruz, E. d. (11 de 2012). http://biblioteca.usac.edu.gt/. Recuperado el 01 de 06 de 2016, de
http://biblioteca.usac.edu.gt/tesis/08/08_0647_CS.pdf
Valero, N. (21 de 07 de 2009). Gravitar. Recuperado el 01 de 06 de 2016, de
http://gravitar.biz/bi/base-datos-columnar/

ESPE Pgina 9

You might also like