You are on page 1of 5

Datamart

Un Datamart es una base de datos departamental, especializada en el


almacenamiento de los datos de un área de negocio específica. Se caracteriza por
disponer la estructura óptima de datos para analizar la información al detalle
desde todas las perspectivas que afecten a los procesos de dicho departamento.
Un datamart puede ser alimentado desde los datos de un datawarehouse, o
integrar por si mismo un compendio de distintas fuentes de información.

Por tanto, para crear el datamart de un área funcional de la empresa es preciso


encontrar la estructura óptima para el análisis de su información, estructura que
puede estar montada sobre una base de datos OLTP, como el propio
datawarehouse, o sobre una base de datos OLAP. La designación de una u otra
dependerá de los datos, los requisitos y las características específicas de cada
departamento. De esta forma se pueden plantear dos tipos de datamarts:
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, según los
requisitos de cada área o departamento, las dimensiones y los indicadores
necesarios de cada cubo relacional. El modo de creación, explotación y
mantenimiento de los cubos OLAP es muy heterogéneo, en función de la
herramienta final que se utilice.
Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común
es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser
las operaciones más usuales) aprovechando las características particulares de
cada área de la empresa. Las estructuras más comunes en este sentido son las
tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones
oportunas), y las vistas materializadas, que se construyen con la misma estructura
que las anteriores, pero con el objetivo de explotar la reescritura de queries
(aunque sólo es posibles en algunos SGBD avanzados, como Oracle).
Los datamarts que están dotados con estas estructuras óptimas de análisis
presentan las siguientes ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validación directa de la información
Facilidad para la historización de los datos
DATA WAREHOUSE VS. DATA MART
La duplicación en otro entorno de datos es un término que suele ser mal
interpretado e incomprendido. Así es usado por los fabricantes de SGBD en el
sentido de simple réplica de los datos de un sistema operacional centralizado en
sistemas distribuidos. En un contexto de Data Warehouse, el término duplicación
se refiere a la creación de Data Marts locales o departamentales basados en
subconjuntos de la información contenida en el Data Warehouse central o
maestro.
Según define Meta Group, "un Data Mart es una aplicación de Data Warehouse,
construida rápidamente para soportar una línea de negocio simple". Los Data
Marts, tienen las mismas características de integración, no volatilidad, orientación
temática y no volatilidad que el Data Warehouse. Representan una estrategia de
"divide y vencerás" para ámbitos muy genéricos de un Data Warehouse.
Esta estrategia es particularmente apropiada cuando el Data Warehouse central
crece muy rápidamente y los distintos departamentos requieren sólo una pequeña
porción de los datos contenidos en él. La creación de estos Data Marts requiere
algo más que una simple réplica de los datos: se necesitarán tanto la
segmentación como algunos métodos adicionales de consolidación.
La primera aproximación a una arquitectura descentralizada de Data Mart, podría
ser venir originada de una situación como la descrita a continuación.

El departamento de Marketing, emprende el primer proyecto de Data Warehouse


como una solución departamental, creando el primer Data Mart de la empresa.
Visto el éxito del proyecto, otros departamentos, como el de Riesgos, o el
Financiero se lanzan a crear sus Data Marts. Marketing, comienza a usar otros
datos que también usan los Data Marts de Riesgos y Financiero, y estos hacen lo
propio.
Esto parece ser una decisión normal, puesto que las necesidades de información
de todos los Data Marts crecen conforme el tiempo avanza. Cuando esta situación
evoluciona, el esquema general de integración entre los Data Marts pasa a ser, la
del gráfico de la derecha.
En esta situación, es fácil observar cómo este esquema de integración de
información de los Data Marts, pasa a convertirse en un rompecabezas en el que
la gestión se ha complicado hasta convertir esta ansia de información en un
auténtico quebradero de cabeza. No obstante, lo que ha fallado no es la
integración de Data Marts, sino su forma de integración.
En efecto, un enfoque más adecuado sería la coordinación de la gestión de
información de todos los Data Marts en un Data Warehouse centralizado.
En esta situación los Data Marts obtendrían la información necesaria, ya
previamente cargada y depurada en el Data Warehouse corporativo, simplificando
el crecimiento de una base de conocimientos a nivel de toda la empresa.
Esta simplificación provendría de la centralización de las labores de gestión de los
Data Marts, en el Data Warehouse corporativo, generando economías de escala
en la gestión de los Data Marts implicados.
Según un estudio de IDC (International Data Corporation) tras analizar 541
empresas, la distribución de las implantaciones de Data Warehouse y Data Marts
en la actualidad, y sus opiniones respecto a esta distribución en el futuro, nos
muestra los siguientes datos:
En la gráfica, observamos, cómo en la actualidad, de las empresas consultadas,
un 80% de ellas cuentan con implantaciones de Data Warehouse o Data Marts.
La proporción actual de implantaciones de Data Warehouse es casi el doble que el
de Data Mart.
No obstante, seguramente tras la andadura inicial de alguno de estos proyectos de
Data Mart, se ve como más adecuado para el futuro este enfoque "divide y
vencerás", previéndose una inversión de estos papeles y duplicando la
implantación de Data Marts a los Data Warehouse.
Probablemente, el 5% de usuarios que disponen de tecnología de Data
Warehouse y piensan renunciar a ella en el futuro, no han realizado previamente
un estudio de factores implicados en un Data Warehouse, o han pasado por la
situación inicial de partida, y no se han planteado una reorganización del mismo.