You are on page 1of 7

INDICE

1.1. Data WareHouse


1.1.1 Introducción
1.2.1 Qué es un data warehouse?
1.2. Objetivos fundamentales de un data warehouse
1.3. Elementos básicos de un data warehouse
1.4. Procesos básicos del data warehouse
1.4.1. Extracción de datos
1.4.2. Transformación de datos
1.4.3. Carga de datos
1.5. Razonas básicas para implementar un Data WareHouse
1.6. Ventajas del Data WareHouse
1.6.1. Beneficios para los usuarios
1.6.2. Beneficios para el área de sistemas
1.7. Costos de un Data WareHouse

1.7.1. Costos de construcción


1.7.2. Costos de operación
1.8. Bibliografía

1.9. Linografía
DATAWAREHOUSE

Introducción

Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de
información sobre temas específicos de negocios, para permitir nuevas consultas, análisis, reportador y decisiones.
De acuerdo con W. H. lnmon, quien es considerado como el padre del Data WareHouse: Un Data WareHouse es un
conjunto de datos integrados orientados a una material que varían con el tiempo y que no son transitorios, los
cuales soportan el proceso de toma de decisiones de una administración."

QUÉ ES UN DATA WAREHOUSE?

Un Data warehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una
o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes
velocidades de respuesta.

Objetivos fundamentales de un data warehouse

• El data warehouse hace que la información de la organización sea accesible:


Sus contenidos son entendibles y navegables, y el acceso a ellos son caracterizado por el rápido desempeño. Estos
requerimientos no tienen fronteras y tampoco limites fijos.
• Cuando hablamos de entendible significa, que los niveles de información sean correctos y obvios. Y navegables es
reconocer el destino en la pantalla y llegar a donde queramos con un solo clic. Su rápido desempeño, nos da a
entender, el cero tiempo de espera.
• El data warehouse hace que la información de la organización sea consistente:
La información de una parte de la organización puede hacerse coincidir con la información de la otra parte de la
organización. Si dos medidas de la organización tienen el mismo nombre, entonces deben significar la misma cosa.
Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes.
• La información consistente significa, información de alta calidad. esta información es contabilizada y completada.
• El data warehouse es información adaptable y elástica:
El data warehouse está diseñado para cambios continuos. Cuando se le hace nuevas preguntas, los datos
existentes y las tecnologías tampoco cambian ni se corrompen.
Cuando se agregan datos nuevos, los datos existentes y las tecnologías tampoco cambian ni se corrompen. El
diseño del Data Marts separados que hacen al Data WareHouse, deben ser distribuidos e incrementados.
• El data warehouse es un seguro baluarte que protege los valores de la información:
El data warehouse no solo controla el acceso efectivo de los datos, si no que da a los dueños de la información gran
visibilidad en el uso y abuso de los datos, aun después de haber dejado el data warehouse.
• El data warehouse es la fundación de la toma de decisiones:
El data warehouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera, las
decisiones que son hechas después de que haya presentado las evidencias.
La mejor etiqueta que preside sigue siendo la mejor descripción de lo que queremos construir: Un sistema de
soporte a las decisiones.
Elementos básicos de un data warehouse
Los elementos básicos de un data warehouse son:
Sistema fuente Modelo dimensional
Area de tráfico de datos Procesos de negocios
Servidor de presentación Data mart
Data warehouse Herramientas de acceso a datos por
Almacenamiento operacional de datos usuarios finales
Olap Ad Hoc Query Tool
Rolap Modelado de aplicaciones
Molap Meta data
Aplicaciones para usuarios finales

• Sistema fuente: Son sistemas operacionales de registros donde sus funciones son capturar las
transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.
• Área de tráfico de datos: Es un area de almacenamiento y grupo de procesos, que limpian, transforman,
combinan, remover los duplicados, guardan, archivan, y preparan los datos fuentes para ser usados en el
data warehouse.
• Servidor de presentación: Es la maquina física objetivo en donde los datos atos del data warehouse son
organizados y almacenados por los usuarios finales, reportes y otras aplicaciones.
• Modelo dimensional:: Es una disciplina específica para el modelado de datos que es una alternativa para
los modelos de entidad – relación.
• Procesos de negocios: Es el grupo coherente de actividades de negocios que hacen sentido a los
usuarios del negocio del data warehouse.
• Data mart:: Es el subgrupo lógico del data warehouse completo.
• Data warehouse: Son búsquedas fuentes de datos de la empresa. Y ess la unión de todos los data marts
que la constituyen.
• Almacenamiento operacional de datos: datos: Es el punto de integración por los sistemas operacionales. Es el
acceso al soporte de decisiones por los ejecutivos.
• OLAP: Es la actividad general de búsquedas para presentación de texto y números del data warehouse,
también es un estilo dimensional especifico de búsqueda y presentación de información y que es
ejemplificada por vendedores de OLAP.
• ROLAP: Es un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un
estilo dimensional.
• MOLAP: Es un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de
datos que tienen un fuerte estilo dimensional.
• Aplicaciones para usuarios finales: Es una colección de herramientas que hacen los queries, analizan y
presentan la información objetivo para el soporte de las necesidades del negocio.
• Herramientas de acceso a datos por usuarios finales:
finales: Es un cliente de data warehouse.
• Ad Hoc Query Tool: Ess un tipo especifico de herramientas de acceso a datos por usuarios finales que
invita al usuario a formar sus propios queries manipulando directamente las tablas relacionales y sus
uniones.
• Modelado de aplicaciones: Es un tipo de cliente de data warehouse con capacidades analíticas que
transforma o digiere las salidas del data warehouse.
• Meta data: La meta base es toda la información en el ambiente del data warehouse que no son asi mismo
los datos actuales.

Procesos

básicos
del data warehouse
• Extracción de datos: Este es el primer paso para obtener la información hacia el ambiente del data
warehouse. Es la selección sistemática de datos operacionales usados para poblar el componente de
almacenamiento físico DW.
• Transformación de datos: Una vez que la información es extraída hacia el área de tráfico de datos, hay
posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve,
seleccionar únicamente los datos necesarios para el data warehouse, combinar fuentes de datos,
haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una
dimensión. Son los procesos para sumar y realizar otros cambios en los datos operacionales para reunir
los objetivos de orientación a temas e integración principalmente.
• Carga de datos: Al final del proceso de transformación, los datos están en forma para ser cargados. La
carga de datos es la inserción sistemática de datos en el componente de almacenamiento físico DW.

Las razones básicas de porque una organización implementa data warehouse:

• Para realizar tareas en los servidores y discos, asociados queries y reportes en servidores y discos
que no son utilizados por sistemas de procesos de transacciones.
Muchas de las empresas quieren instalar sistemas de procesos de transacciones para que haya una alta
probabilidad de que las transacciones sean completadas en un tiempo razonable.
Estos sistemas de procesos de transacciones hacen que las transacciones y peticiones sean más rápidas
en menores tiempos dados a que los queries y reportes consumen mucho más de su límite permitido en
los recursos de servidores y discos, por tal motivo las empresas han implementado una arquitectura de
data warehouse que utiliza sus servidores y discos por separados para algunos de los queries y reportes.
• Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y
que no son apropiados para los procesos de transacciones.
Existen maneras de modelar los datos que usualmente agilizan los queries y reportes (ejemplo: el
esquema del modelo de estrella) y que no son apropiados para los procesos de transacciones porque la
técnica de modelado bajaría el rendimiento y complicaría el proceso de transacciones.
También existen tecnologías que aceleran el proceso de queries y reportes pero baja la velocidad en el
proceso de transacciones (ejemplo: La indexación de bitmaps ).
Y tecnologías de servidores que incrementan la velocidad en el proceso de transacciones, pero que
disminuye la velocidad del proceso de queries y reportes (ejemplo: La tecnología de recuperación de
transacciones). Todo esto entonces esta en el cómo se hacen l.ops modelos de datos y que tecnología se
utiliza, inclusive que productos se adquieren para el impacto de los procesos de los queries y reportes.
• Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los
aspectos técnicos de tecnologías de bases de datos es requerida para escribir y mantener queries
y reportes.
Frecuentemente un data warehouse puede ser instalado de manera que los queries y reportes puedan ser
escritos por personal sin tantos conocimientos técnicos, lo que hace que su mantenimiento y construcción
se haga sin más complejidad.
• Para proveer un repositorio del sistema de proceso proceso de transacciones limpio que puede ser
reportado y que no necesariamente requiere que se arregle el sistema de proceso de
transacciones.
El data warehouse provee la oportunidad de limpiar los datos sin cambiar los sistemas de proceso de
transacciones, sin embargo algunas implementaciones de data warehouse provee el significado para
capturar las correcciones hechas a los datos del data warehouse y alimenta las las correcciones hacia el
sistema de procesos de transacciones. Muchas veces hace más sentido hacer las correcciones de esta
manera que aplicar las correcciones directamente al sistema de proceso de transacciones.
• Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de
transacciones y de las fuentes externas y de los los datos que deben ser almacenados solamente para
el propósito de hacer queries y reportes.
Desde hace mucho tiempo que las compañías necesitan reportes con la la información de múltiples
sistemas y han hechoextracciones de datos para después correrlos bajo la lógica de búsqueda
combinando la información de las extracciones con los reportes generados, lo que en muchas ocasiones
es una buena estrategia. Pero cuando se tienen muchos datos y las búsquedas se vuelven muy pesadas y
después limpiar la búsqueda, entonces lo apropiado seria un data warehouse.

Ventajas del data warehouse

- Beneficios

Para los usuarios:

Confianza en el uso de sistemas:


sistemas: El incremento en la rapidez de las consultas afianzara el uso de los
sistemas operativos de la empresa.

Reducción en tiempos de consultas:


consultas: Se adquiere una solución que reduce tiempos de espera por parte de
los usuarios.

Apoyo a la toma de decisiones:


decisiones Los empresarios tendrán a la mano los resúmenes de información para
armar reportes comparativos, utilizando los indicadores más comunes de la empresa, para apoyarse en la toma
de decisiones.
Para el área de sistemas

Facilidad de uso: La facilidad de uso de esta herramienta le permitirá tener un DW en minutos.

Acceso a cualquier base de datos: El soporte para accesar múltiples bases de datos amplía las áreas de
aplicación de estas herramienta, para generar resúmenes operativos de su información.

Mayor rendimiento: El rendimiento de los servidores de su empresa se verá altamente beneficiado, debido a
que el tiempo de consulta se verá disminuido.

Costos de un data warehouse

Los costos de un data warehouse se clasifican en:

• Costos de construcción
• Costos de operación

Costos de construcción: Los costos de construir un DW son similares para cualquier proyecto de tecnología
de información. Estos pueden ser clasificados en tres categorías:

• RRHH: La gente necesita contar con un enfoque fuerte sobre el conocimiento del área de la empresa y de
los procesos empresariales.
• Tiempo: Se debe a establecer el tiempo no tan solo para la construcción y entrega de resultados de DW,
si no también para la planeación del proyecto y la definición de la arquitectura.
• Tecnología: Muchas tecnologías nuevas son introducidas por el DW. El costo de esta nueva tecnología
puede ser tan solo la inversión inicial del proyecto.

Costos de operación: Una vez que esta construido y entregado un DW debe ser soportado para que
tenga un valor empresarial, son estas actividades de soporte, las fuentes de continuos costos operacionales para un
DW. Se puede distinguir tres costos de operación:

• Evolutivos: Ajustes continuos del DW a través del tiempo, como cambio de expectativas y productos del
aprendizaje del RRHH del proyecto mediante su experiencia usando el DW.
• Crecimiento: Incremento en el tiempo en volúmenes de datos, del numero de usuario del DW, lo cual con
llevara a un incremento de los recursos necesarios como a la demanda de monitoreo.
• Cambios: El DW requiere soportar cambios que ocurren tanto en el origen de datos que éste usa, como
en las necesidades de la información que éste soporta.
Los dos primeros tipos de costo de operación, son básicos en la mantención de cualquier sistema de
información; sin embargo, se debe tener esencial cuidado en los costos de operación por cambio, ya que
ellos consideran el impacto producto de la relación del OLTP y del ambiente empresarial, con el DW.

Bibliografía
• Laudon Keneth C. , Laudon Jane P. New Edition año(2006)
• C.J.DATE capitulo 21 pag (708 - 713)
• Silberschatz korth
• Sudarshan pag(274 - 278)

Linografía

• http://www.dwinfocenter.org/casefor.html
• http://datawarehouse.ittoolbox.com/
• http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
• http://www.dataprix.com/es/data-warehose
• http://www.materiabiz.com/mbz/ityoperaciones/nota.vsp?nid=33043
• http://todobi.blogspot.com/2005/12/once-pasos-para-construir-un.html

You might also like