You are on page 1of 25

PROYECTO DE INVESTIGACIN

TTULO DEL TRABAJO:

SISTEMA DATA MART PARA EL SEGUIMIENTO Y CONTROL DE LOS


ALUMNOS DE EDUCACION INICIAL DEL COLEGIO CRISTO MILAGROSO

ASIGNATURA:
METOLOGIA DE LA INVESTIGACION

CICLO: IX

ESPECIALIDAD:
INGENIERA DE SISTEMAS Y SEGURIDAD INFORMTICA

AUTOR:
HERNAN VILCAPUMA ALONSO

Lima, 2015

AGRADECIMIENTO

Par poder realizar esta Investigacin de la mejor manera posible fue necesario del
apoyo de muchas personas a las cuales quiero agradecer.

Agradezco la valiosa colaboracin del Profesor Ferrer Maizondo como gua del
curso de Metodologa de la Investigacin durante el desarrollo de la misma.
A los directivos de la Universidad Peruana Simn Bolvar por aperturar el Curso de
Metodologa de la Investigacin

INDICE
INTRODUCCION............5
CAPITULO I
PRESENTACION DE INVESTIGACION........7
1. Formulacin del problema....7

2. Objetivos
2.1. Objetivo general.....9
2.2. Objetivos especficos.....9
Capitulo II
Marco terico...10
3. Fundamentos de los Data Mart Y Data Warehouse...10
3.1 Data Warehouse..................10
3.2 Orientacin al tema...10
3.3 Datos Integrados.......10
3.4 Datos Histricos.11
3.5 Datos no voltiles....................11
4. Diferencia entre un Data Mart y Data Warehouse....................12
5. Data Mart.....................13
5.1 Definiciones generales Data Mart13
5.2 Razones para crear un Data Mart.......13
5.3 Caractersticas Data Mart....................15
5.4 Tipos de Data Mart.....15
Data Mart OLAP...15
Data Mart OLTP...16
6. OLAP VS OLTP.......16
7. Mercados y Tecnologas.17
7.1 Mercado de Datos de Data Mart17
7.2 Tecnologa de Data Mart.17
8, Ventajas y Desventajas de Data Mart.18
9, Arquitectura de Data Warehouse.19
10. Arquitectura de Data Mart...20
11. Importancia de Data Mart y Data Warehouse..21
12. Desarrollo de Data Mart y Data Warehouse.22
BIBLIOGRAFIA..23
CONCLUSION25

INTRODUCCION
Actualmente, en cualquier entidad que procese informacin y que cuente con una
base de datos, sabemos que es necesario que esta se actualice constantemente,
y el propsito de ella es proveer informacin a la empresa con un adecuado
manejo como transformaciones, bsqueda de patrones y consolidaciones.
En este sentido, y puesto que los cambios que se producen actualmente en las
tecnologas y sistemas de informacin son demasiado rpidos, en este proyecto
hacemos un anlisis y diseo de una herramienta llamada Data Warehouse. Esta
tecnologa de la informacin representa el ltimo avance dentro de las bases de
datos, y se configura como el entorno idneo para la consulta y el anlisis de la
informacin procedente tanto de los sistemas transaccionales internos, como de
las fuentes de informacin externas de inters para la empresa.
La finalidad del Data Warehouse consiste en convertir los datos contenidos en las
bases de datos corporativas de las organizaciones, en informacin y sta, a su
vez, en conocimiento til en el proceso de toma de decisiones estratgicas. El
Data Warehouse es una herramienta que va a permitir a los directivos de las
organizaciones formular preguntas, realizar consultas y analizar los datos en el
momento, forma y cantidad que precisen sin necesidad de tener que acudir al
personal informtico de la empresa.
Desde mediados de los aos ochenta, en los que las tecnologas de la
informacin se esforzaban por automatizar los procesos de tipo repetitivo o
administrativo haciendo uso de los sistemas de informacin operacionales, los
Data Warehouse han sufrido una gran evolucin. En los ltimos aos, el concepto
de Data Warehouse ha ido perfeccionndose (gracias al aumento de la capacidad
de almacenamiento, la expansin de internet y las nuevas herramientas de
consulta de datos) y adaptndose a las necesidades crecientes de informacin en
las empresas de forma que los actuales Data Warehouse pueden proporcionar
soluciones a todo tipo de usuarios.
Por ltimo, cabe mencionar la existencia del Data Mart que por ahora podramos
decir que son una versin ms reducida de un Data Warehouse. Estos Data Mart a
5

menudo contienen informacin especfica de algn departamento concreto de la


organizacin como pueden ser marketing o finanzas. Idealmente, estos Data Mart
deberan ser un subconjunto del Data Warehouse, a fin de mantener consistencia
de datos corporativos y mantener la seguridad e integridad de la informacin que
se est usando.
Hoy en da, debido al coste de desarrollo e implantacin de un Data Warehouse en
la organizacin, se hace patente una mayor demanda de Data Mart en las
mismas. Como veremos ms adelante elegir una u otra opcin ofrecer una serie
de ventajas y desventajas para la empresa que quiera poner en marcha su
implantacin.
El presente proyecto de tesis permite ilustrar paso a paso la implementacin de un
Datamart Para los alumnos de educacin inicial del COLEGIO CRISTO
MILAGROSO, el cual viene asumiendo fundamentalmente la responsabilidad de
gestionar activos valiosos como es el capital humano. Una buena gestin de los
recursos tcnicos, econmicos y humanos contribuye a la mejora del Colegio.
En el planteamiento del problema vamos a delimitar el problema del presente
trabajo de investigacin que se realiza en el COLEGIO CRISTO MILAGROSO y
formulamos el problema general de investigacin y los problemas especficos, as
como los objetivos
As mismo se trabajara el marco terico en donde encontramos un repaso por los
entornos, modelos y arquitecturas principalmente empleados en la construccin
del Data Warehouse.

CAPITULO I

Presentacin de la Investigacin
1. FORMULACION DEL PROBLEMA

En la actualidad, la informacin se ha convertido en un bien muy preciado. [BIT


2002].

Las

empresas

buscan

emplear

dicha

informacin

para

generar

conocimiento til dirigido a la mejora de sus procesos empresariales. De esta


forma, la ventaja competitiva de las organizaciones radica en la forma de
interpretar la informacin y convertirla en un elemento diferencial.
En tanto las tecnologas de la informacin en la actualidad permiten poder mejorar
este desempeo organizacional desde la parte operativa hasta la etapa gerencial
para la toma decisiones de las cuales depende toda la organizacin.
Las soluciones basadas en la Inteligencia de Negocios permiten proveer
informacin valiosa para la toma de decisiones. Entre los tipos de solucin de
Inteligencia de Negocios existentes en la actualidad, una de las ms utilizadas es
el Data Mart. (Kimball, R. 2002).
El Data Mart propuesto se convertir en una herramienta que brindara informacin
til para la toma de decisiones en el rea de educacin inicial de un colegio.
Adems permitir un fcil acceso a la informacin por parte de los usuarios de
manera independiente y sin necesidad de conocimientos tcnicos. Esto le
permitir a la empresa manejar adecuadamente su informacin para optimizar
procesos internos, mejorar la calidad de dicha institucin educativa, prever
posibles fallas o accidentes mediante un correcto mantenimiento preventivo, es
decir, ofrecer un mejor servicio a los usuarios.
En estos ltimos aos la informacin ha pasado de ser el proceso de
automatizacin

de

tareas

rutinarias

ser

un

proceso

de

verdadera

informatizacin de las empresas. Ahora la informacin se convierte en un aliado


estratgico de gran importancia para la supervivencia de las empresas. Este ha
sido el principal motivo que ha impulsado la difusin de los almacenes de datos, al
contar las empresas con una enorme cantidad de datos mal gestionados.
Para mantener competitiva una organizacin necesita una buena gestin de datos
que minimice las duplicidades en su tratamiento y que asegure la cantidad de los

mismos, de manera que puedan servir como fuente para la toma de decisiones
estratgicas y tcticas.
Esto conlleva a afirmar que los aspectos relativos a la explotacin, el control y la
auditoria de los almacenes de datos cobran gran importancia tanto para los
especialistas informticos como para los directivos de las empresas.
Atendiendo a lo planteado anteriormente, las empresas necesitan sistematizar la
informacin para la toma de decisiones, principalmente aquellas en las que se
identifican grandes volmenes de datos, clientes, productos y transacciones. En
este tipo de organizaciones tambin entrar las educativas.
En el colegio de, CRISTO MILAGROSO ubicado en el distrito de LA VICTORIA,
URB. BALCONCILLO, se encuentra con una gran ineficiencia a la hora de
organizar, ubicar y brindar informes de alumnos matriculados por cada ao de
estudio.
Actualmente todos los datos lo tienen en un documento de Excel, el cual se
encuentra desordenado, disperso y con datos de sobra, dificultando la elaboracin
de informes, asistencias, reportes, que la UGEL pide mensualmente.
La presente investigacin pretender elaborar un buen control para los alumnos
de educacin inicial matriculados en el colegio CRISTO MILAGROSO, donde
realizan el control de asistencia, cantidad de alumnos matriculados por aulas, que
docente se encontrara en cada aula, y el pedido de la UGEL, en cuanto a reportes,
informes y/u otra informacin.

2. OBJETIVOS
2.1 Objetivo General

Desarrollar un sistema Data Mart para el seguimiento y control del alumnado de


educacin inicial para el colegio CRISTO MILAGROSO.
2.2 Objetivos Especficos

Disear un sistema Data Mart que permita tener un mejor acceso a la

informacin del alumnado.


Proponer una herramienta que permita seguir y controlar al alumnado de
educacin inicial del colegio CRISTO MILAGROSO.

CAPITULO II

Marco terico
3. FUNDAMENTOS DE LOS DATA MART Y DATA WAREHOUSE
3.1 DATA WAREHOUSE
Segn Bill Immon (1994) se puede definir a un Data Warehouse como una
coleccin de datos orientada a un determinado mbito (empresa, organizacin,
etc.), integrado, no voltil y variable en el tiempo, que ayuda a la toma de
decisiones en la entidad en la que se utiliza.
3.2 ORIENTACION AL TEMA

El Data Warehouse ser organiza alrededor de los temas principales de la empresa.


As los datos se estructuran por temas, contrariamente a los datos de los sistemas
transaccionales,

organizados

generalmente

por

procesos

funcionales.

La

integracin de los diferentes temas en una estructura nica es necesaria para que
la informacin comn a varios temas no se repita.
3.3 DATOS INTEGRADOS
Antes de llegar al Data Warehouse, los datos deben formatearse y unificarse para
llegar a un estado coherente. Un dato debe tener nicamente una descripcin y
una codificacin. Las diferencias que existen en los datos de las fuentes dependen
de la visin deseada por el usuario, de la utilizacin que se hace, o de los
programadores. La integracin de datos constituye una gran parte de la labor de
construir un Data Warehouse y se realiza mediante los proceso de extraccin,
transformacin y carga o procesos ETL.

3.4 DATOS HISTRICOS


Un Data Warehouse almacena el histrico de datos de la empresa y los datos
actuales con los que cuenta. Suponiendo que cada da se obtienen los datos, cada
dato de un da sobre algo constituye un dato diferente al de otro da sobre lo
mismo. Una vez ingresada la informacin al Data Warehouse, sta no se actualiza,
a no ser por casos excepcionales.
3.5 DATOS NO VOLTILES
Los datos que son almacenados no sufren ninguna actualizacin solo son
incrementados. El perodo cubierto para un DW va de 2 a 10 aos.
La informacin es til slo cuando es estable. Los datos operacionales cambian
sobre una base momento a momento. La perspectiva ms grande, esencial para el
anlisis y la toma de decisiones, requiere una base de datos estable.
La no volatilidad es, de cierta forma una consecuencia de que los datos sean
histricos. Al no actualizarse los datos, una consulta sobre determinados datos
ser siempre la misma.

10

Hay algunas consecuencias muy importantes de esta diferencia bsica, entre el


procesamiento operacional y del Data Warehouse. En el nivel de diseo, la
necesidad de ser precavido para actualizar las anomalas no es un factor en el
Data Warehouse, ya que no se hace la actualizacin de datos. Esto significa que
en el nivel fsico de diseo, se pueden tomar libertades para optimizar el acceso a
los datos, particularmente al usar la normalizacin y desnormalizacin fsica

4. DIFERENCIA ENTRE UN DATA MART Y UN DATA WAREHOUSE


Un Data Warehouse

maneja informacin de distintas reas tpicamente es

implementado como el repositorio central de informacin de toda una


organizacin, mientras que un Data Mart maneja informacin de un departamento
en particular. La tabla siguiente muestra una comparacin de las principales
diferencias entre el Data Mart y el Data Warehouse:
Categora

Data Warehouse

Data Mart

Alcance

Corporativo

rea de Negocios

Temas

Multiples

Simples

Fuentes de Datos

Muchas

Pocas

Tamaos

100 GB-TB+

< 100 GB

Tiempo de implementacin

De meses a aos

Meses

11

Fuente
http://download.oracle.com/docs/cd/E10352_01/doc/bi.1013/e10312/dm_concepts.
htm
LOS PROCESOS ETL
Los sistemas ETL (de las siglas en ingles Extraction, Transformation, Load) se
encargan de las funciones de extraccin de distintas fuentes de datos, sean estas
transaccionales o externas, transformacin, realizando tarea de limpieza y
consolidacin de datos y la carga del Data Warehouse o Data Mart.
Entre las principales funciones de los sistemas ETL tenemos (Hernndez, 2003):
-

La extraccin de datos.
El filtrado de datos.
La carga inicial de Data Warehouse o Data Mart.
Refresco del Data Warehouse o Data Mart: Operacin peridica que
actualiza los cambios de las fuentes externas al Data Warehouse o Data
Mart.

5. DATA MART
5.1 Definiciones generales Data Mart
Segn define Meta Group,Un Data Mart es una aplicacin de Data Warehouse,
construida rpidamente para soportar una lnea de negocio simple.
Los Data Marts, tiene las mismas caractersticas de integracin, no volatilidad,
orientacin temtica que el Data Warehouse. Representan una estrategia de
divide y vencers para mbitos muy genricos de un Data Warehouse.
Se define como un pequeo DataWarehouse, para un determinado nmero de
usuarios, para un rea funcional, especifica de la compaa. Tambin podemos
definir que un Data Martes es un subconjunto de una bodega de datos para un
propsito especfico.
.Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por
disponer la estructura ptima de datos para analizar la informacin al detalle
desde todas las perspectivas que afecten a los procesos de dicho departamento.
Un Datamart puede ser alimentado desde los datos de un DataWareHouse, o
integrar por si mismo un compendio de distintas fuentes de informacin

12

5.2 Razones para crear un Data Mart


Segn (Gross, 2001) las razones para el desarrollo del Data Mart
Fcil acceso a los datos que se necesitan frecuentemente.
Crea vista colectiva para grupo de usuarios.
Mejora el tiempo de respuesta del usuario final.
Facilidad de creacin.
Costo inferior al de la aplicacin de un completo almacn de datos.
Los usuarios potenciales son ms claramente identificables que en un almacn
de datos completo...
Dar a los usuarios acceso a los datos que ellos necesitan para analizarlos mas
a menudo
Pueden fcilmente extenderse a la toma de decisiones estratgicas, que

pueden brindar beneficios grandes y tangibles


Permite entender y administrar simultneamente macro y micro perspectivas
del rea de comercio exterior, lo que puede ahorrar incontables horas de
trabajo y ayudar a evitar errores que pueden ser el resultado de suposiciones
que se hicieron con base en datos incompletos o incorrectos.
Segn (C.J. Date, 2001) hay tres enfoques principales para la creacin de un Data
Mart:

Los datos pueden ser simplemente extrados del data Warehouse: de

hecho, sigue un enfoque de divide y vencers sobre la carga de trabajo


general de apoyo para la toma de decisiones, a fin de lograr un mejor
rendimiento y escalabilidad. Por lo general, los datos extrados son
cargados en una base de datos que tiene un esquema fsico que se parece
mucho al subconjunto aplicable del data Warehouse; sin embargo, puede
ser simplificado de alguna manera gracias a la naturaleza especializada del
Data Mart.
A pesar del hecho de que el data Warehouse pretende proporcionar un
punto de control nico, un Data Mart puede ser creado todava en forma
independiente (es decir, no por medio de la extraccin a partir del data
Warehouse). Dicho enfoque puede ser adecuado si el data Warehouse es
inaccesible por alguna razn. Digamos razones financieras, operacionales o
incluso polticas(o puede ser que ni siquiera exista todava el data
Warehouse; vea el siguiente punto).

13

Algunas instalaciones han seguido un enfoque de primero el Data Mart,


donde los Data Marts son creados conforme van siendo necesarios y el
Data Ware House general es creada, finalmente, como una consolidacin
de los diversos Data Marts.

5.3 Caractersticas Data Mart: segn Immon (1999):

Son pobladas por usuarios finales: los usuarios finales con su capacidad
tcnica y conocimientos podrn utilizar el Sistema Data Mart.
Se actualizan constantemente: continuamente los datos van restaurndose.

Contienen mucha informacin de detalle: abarca gran nmero de

informacin especfica.
Orientado al tema: Los datos en la base de datos estn organizados de
manera que todos los elementos de datos relativos al mismo evento u

objeto del mundo real queden unidos entre s.


Integrado: La base de datos contiene los datos de todos los sistemas

operacionales de la organizacin, y dichos datos deben ser consistentes.


De tiempo variante: Toda la informacin del Data Mart es requerida en
algn momento

No voltil: La informacin no se modifica ni se elimina, una vez almacenado


un dato, ste se convierte en informacin de slo lectura, y se mantiene

para futuras consultas.


Escalable: capacidad para crecer sin perder calidad en los servicios
ofrecido
14

5.4 Tipos de Data Mart


De acuerdo a Immon (1999) existen dos tipos de Data Mart: dependientes e
independientes. Un Data Mart dependiente es aquel cuya fuente de datos es un
Data Warehouse, Un Data Mart independiente es aquel cuya fuente de datos son
los sistemas transaccionales, el Data Mart a construir en el presente trabajo de
grado.
5.4.1 Data Mart OLAP
Para (torres 2007), Los sistemas de soporte a la decisin usando tecnologas de
Data Warehouse, se llaman sistemas OLAP (On-Line Analytical ProcessingProcesamiento analtico en lnea). En general, estos sistemas deben:(Torres,
2007)

Soportar requerimientos complejos de anlisis :


Analizar datos desde diferentes perspectivas
Soportar anlisis complejos contra un volumen ingente de datos

La funcionalidad de los sistemas OLAP se caracteriza por ser un anlisis


multidimensional de datos corporativos, que soportan los anlisis del usuario y
unas posibilidades de navegacin, seleccionando la informacin a obtener.
5.4.2 Data Mart OLTP
El proceso transaccin en lnea OLTP (On-Line Transaction Processing
Procesamiento de transacciones en Lnea) es un tipo de proceso especialmente
rpido en el que las solicitudes de los usuarios son resultados de inmediato;
naturalmente, ello implica la concurrencia de un mecanismo que permite el
procesamiento de varias transacciones a la vez. (Torre, 2007)

6. OLAP VS OLTP
OLAP o procesamiento analtico en lnea, es el paradigma de anlisis
multidimensional de un Data Warehouse. Este concepto se contrapone al de OLTP
o procesamiento transaccional en lnea, que es el empleado por los sistemas
fuentes para optimizar la recogida de informacin. En pocas palabras, mientras
OLTP se encarga de procesar ptimamente multitud de pequeas transacciones
de captura de informacin (su entrada, modificacin o eliminacin), OLAP se
dedica al anlisis de enormes cantidades de informacin; por ende realizara pocas
transacciones, pero estas procesaran un volumen muy superior (cientos de miles
de registros). (Torres, 2007)
15

Las aplicaciones OLTP se caracterizan por la creacin de muchos usuarios,


actualizaciones o recuperacin de registros individuales. Por consiguiente, las
bases de datos OLTP se perfeccionan para actualizacin de transacciones. Las
aplicaciones OLAP son usadas por analistas y gerentes que frecuentemente
quieren una vista de datos de nivel superior, como las ventas totales por lnea de
producto, por regin, etc. Las bases de datos OLAP normalmente se actualizan en
lote, a menudo de mltiples fuentes, y proporcionan un back-end analtico
poderoso a las aplicaciones de mltiples usuarios. Por tanto, las bases de datos
OLAP se perfeccionan para el anlisis.

7. MERCADOS Y TECNOLOGIAS
7.1 Mercados de datos de Data Mart

Data Mart es especfica para una necesidad de datos seleccionados,


enfatizando el fcil acceso a una informacin relevante.
Data Mart se destaca por una definicin de requerimientos ms fcil y
rpida. Tambin se simplifica el desarrollo de todo el mecanismo de su base
16

de datos y con ello baja substancialmente todo el coste del proyecto, as


como su duracin.
7.2 Tecnologa de Data Mart

Aspect Data Mart es una solucin completa de reportes para la empresa,


que le proporciona un mayor entendimiento de las operaciones de sus
negocios y reduce el tiempo que consumen estas tareas. Esta solucin
consolida datos de mltiples fuentes para darle una perspectiva de las
operaciones del centro de contacto de su empresa y as poder identificar
rpidamente los procesos de cambio necesarios.(Snchez, 2003)

8. Ventajas y desventajas de Data Mart


Ventajas

Se caracteriza por disponer la estructura ptima de datos para analizar la


informacin al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento.
Un data Mart puede ser alimentado desde los datos de un data Warehouse
o integrar por si mismo un compendio de distintas fuentes de informacin.
Puede estar montada sobre una base de datos OLTP, como el propio data
Warehouse, o sobre una base de datos OLAP.
Poco volumen de datos, mayor rapidez de consulta.
Facilidad para la historizacin de los datos.
Validacin directa de la informacin.
Son simples de implementar.
Conllevan poco tiempo de construccin y puesta en marcha.
Permiten manejar informacin confidencial.
Reflejan rpidamente sus beneficios y cualidades.
Reducen la demanda del depsito de datos.

Desventajas:

Inadvertidamente se puede usar datos no compatibles con otros Data Marts


que luego alarguen el tiempo de unificacin.

Si el Data Warehouse es construido primero, se requiere de hardware


adicional para soportar Data Marts individuales.

17

Datos descentralizados debido a que cada Data Mart corresponde a una


base de datos individual por tema o por rea.

No permite el manejo de grandes volmenes de informacin por lo que


muchas veces se debe recurrir a un conjunto de Data Marts para cubrir
todas las necesidades de informacin de la empresa.

9. Estructura de un DATAWAREHOUSE (DWH):


A continuacin en la Figura 13, se muestra la representacin de una estructura
Bsica de un Data Warehouse: (Torres, 2007)

18

Los sistemas de Data Warehousing son el centro de la arquitectura de los


Sistemas de Informacin de los 90s. Han surgido como respuesta a la
problemtica de extraer informacin sinttica a partir de datos atmicos
almacenados en bases de datos de produccin. Uno de los objetivos
principales de este tipo de sistemas es servir como base de informacin para la
toma de decisiones.
Los beneficios obtenidos por la utilizacin de este tipo de sistemas se basan en
el acceso interactivo e inmediato a informacin estratgica de un rea de
negocios.

10. Estructura de un DATAMART:


A continuacin en la Figura 14, se muestra la arquitectura de un esquema de
Data Marts:

19

Los Data Mart son un conjunto de modelos de negocio relacionados entre si.
Los Data Marts son diseados para satisfacer las necesidades especficas de
grupos comunes de usuarios (divisiones geogrficas, divisiones
organizacionales, etc.). Los Data Marts son generalmente, subconjuntos del
Data Warehouse, pero pueden tambin integrar un nmero de fuentes
heterogneas, e inclusive ser ms grandes, en volumen de datos, que el propio
Warehouse central.

11. Importancia de Data Warehouse y el Data Mart


De acuerdo a Fernndez, M., 2002,
El diseo de las bases de datos
transaccionales sobre las que corren los aplicativos no est orientado a la
extraccin de la informacin. (Fernndez, M.2002).
20

Sera posible trabajar con la base de datos transaccional, aunque nada


recomendable, el tiempo de respuesta incidira sobre el rendimiento del sistema
puesto que estas bases de datos han sido diseadas para una escritura y
modificacin intensiva, no para su lectura.
As el diseo de las bases de datos transaccionales y las desarrolladas para
abordar proyectos de Business Intelligence (BI) son totalmente distintos.
Las bases de datos de BI (Data Ware House o Data Marts) estn especficamente
diseadas para abordar consultas, por lo que son capaces de recoger datos de
diferentes aplicativos y homologarlos en un repositorio central, todo ello con la
ayuda de las herramientas de Extraccin, Transformacin y Carga (ETL).
Tomar los datos desde varias bases de datos operacionales y transformarlos en
datos requeridos para el depsito, se refiere a la transformacin o a la integracin
de datos.
Las bases de datos operacionales, diseadas para el soporte de varias
aplicaciones de produccin, frecuentemente difieren en el formato. Los mismos
elementos de datos, si son usados por aplicaciones diferentes o administrados por
diferentes software DBMS (sistema gestos BD), puede n definirse al usar nombres
de elementos inconsistentes y ser codificados de manera diferente.
Todas estas inconsistencias deben resolverse antes que los elementos de datos
sean almacenados en el Data Mart.
Muchos almacenes de datos comienzan siendo Data Mar (para minimizar riesgos)
y se va ampliando su mbito ya que estos estn cerrados en un tema concreto y
estn diseados para una unidad de negocio especifica. La implementacin
incremental reduce riesgos y asegura que el tamao del proyecto permanezca
manejable en cada fase (Lombart, 0., 2007).

12. Desarrollo de Data Mart y Data Warehouse


Segn (Inmon, B., 1998) las razones para desarrollar en una empresa Data
Warehouse antes de Data Mart o viceversa, depende de factores tales como la
naturaleza de la organizacin, tamao, requerimientos, estructuracin y
distribucin geogrfica de la misma. Por este motivo no existe un planteamiento
21

estandarizado, que permita aplicarlo, indistintamente del tipo de empresa que lo


requiera (Inmon, B., 1998).
El diseador de los Data Marts o Data Warehouse debe tener presente algunos
aspectos que hacen la diferencia entre estos dos planteamientos:

Los Data Marts son creados para satisfacer las necesidades especficas de
un departamento de acuerdo a los objetivos de los mismos. La Data
Warehouse se crean para satisfacer las necesidades globales de una
corporacin, pero no se puede satisfacer las necesidades de ambos.

La granularidad entre un planteamiento y otro es muy diferente; los Data


Marts estn constituidos por datos resumidos o agregados, por otro lado los
datos en la Data Warehouse mantienen ms detalle sobre los datos de la
empresa, por esto resulta muy complejo pasar datos de los Data Marts
hacia la Data Warehouse

Los datos contenidos en los Data Marts son ms recientes histricamente


que los contenidos en la Data Warehouse.

Las relaciones en cuanto a temas en los Data Marts no son las mismas que
las que se pueden encontrar en la Data Warehouse.

Los tipos de consultas realizadas en los Data Marts son muy diferentes a
las realizadas en la Data Warehouse.

En los Data Marts los usuarios son relectores de informacin, mientras que
en la Data Warehouse los usuarios son exploradores de informacin.

Dado lo expuesto anteriormente, el tomar una decisin sobre cual planteamiento


seleccionar, es necesario evaluar detenidamente las caractersticas presentes en
la empresa, relacionarlas con las propiedades de cada estructura y a partir de esta
relacin decidir cul de ellas utilizar. (Consulting Data Team, 1999).

BIBLIOGRAFIA

Bitam, (2002). BITAM, Business Intelligence. Consultado en:


http://www.bitam.com//spanish //AcercaDeBi.htm

22

Date, C.J. (2001). Introduccin a los sistemas de bases de datos.

Fernndez, M. (2002). Inteligencia aplicada al negocio, Damation.

Hernandez, J. (2003). Departamento de Sistemas informticos


Computacion

Univerisidad.

Consultado

y
en

http://www.dsic.upv.es/~jorallo/cursoDWDM/dwdm-I.pdf

Inmon, W.H. (1994). Using the data warehouse.

Inmon, W.H, (May 28, 1999). Building the Operational Data Store, 2nd
Edition.

Lombart, O. (2007). BI: Inteligencia aplicada al negocio. Consultado en


Febrero

2015

en

http://www.eldiarioexterior.com/conocimiento/docs/BI_Inteligencia_aplicada_
al_negocio_pdf

Lujan, S. (2005). Diseo de Almacenes de Datos con UML. Consultado en


febrero 2015 en : http://gplsi.dlsi.ua.es/~slujan/diseno-almacenes-datos-uml

Proceso ETL (Extract, transform and load) en Wikipedia. recuperado de


febrero 2015 de http://es.wikipedia.org/wiki/Extract,_transform_and_load

Snchez, K (2003) GENERALIDADES Y PATRONES DE DESARROLLO

DE DATA MARTS REVISTA.


Torres, L (2007): Business Intelligence.[Publicado 12/10/2007 Gravitar:
Informacin sin Lmites consultado http://www.gravitar.biz/index.php/bi/biterminologia-1/]

Consulting Data Team (1999). Consultando en febrero 2015 en :


http://www.datateam.com.mx/datateam/soluciones/data_m
23

CONCLUSIONES

La implementacin del Data Mart en la institucin contribuye a la mejor


administracin y gestin de la informacin de los alumnos, disminuyendo
los tiempos del desarrollo de reportes y tiempos en la toma de decisiones
que son necesarios para decisiones estratgicas basadas en informacin
de calidad. 24

Se extrajo datos de distintas fuentes logrando informes finales confiables.

Toda la informacin se encuentra almacenada en un solo almacn de datos.

Se logr informacin precisa y eficiente.

Se crearon indicadores de gestin, que nos sirven para realizar un anlisis


de la informacin.

25

You might also like