You are on page 1of 30

www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

B1G1T04 - CONCEPTO DE BASE DE DATOS.

1. INTRODUCCION. EVOLUCIN DE LOS SISTEMAS TRADICIONALES A LAS BASES DE DATOS ............. 3


1.1 SISTEMAS TRADICIONALES DE FICHEROS. INCONVENIENTES .................................................................... 3
1.2 SISTEMAS ORIENTADOS A LA BASE DE DATOS................................................................................................ 3
2. CONCEPTO DE BASE DE DATOS ................................................................................................................................ 4
2.1 INDEPENDENCIA DE LOS DATOS. NIVELES DE ABSTRACCIN .................................................................... 4
2.1.1 INDEPENDENCIA DE LOS DATOS. DEFINICIN DE ANSI ........................................................................... 4
2.1.2 NIVELES DE ABSTRACCIN ............................................................................................................................. 5
2.2 VENTAJAS E INCONVENIENTES DEL USO DE BASES DE DATOS................................................................... 5
2.2.1 VENTAJAS............................................................................................................................................................ 5
2.2.2 INCONVENIENTES ............................................................................................................................................. 6
3. PRINCIPALES COMPONENTES DE UN ENTORNO DE BASE DE DATOS.......................................................... 6
3.1 DATOS......................................................................................................................................................................... 6
3.2 METADATOS ............................................................................................................................................................. 7
3.3 EL SISTEMA GESTOR DE BASE DE DATOS.......................................................................................................... 7
3.4 USUARIOS DE LA BASE DE DATOS....................................................................................................................... 8
3.5 ELEMENTOS DE SEGURIDAD ................................................................................................................................ 9
3.6 LENGUAJES DE BASES DE DATOS ........................................................................................................................ 9
4. UTILIZACIN DE LA BASE DE DATOS EN LA ORGANIZACIN ..................................................................... 10
4.1 SISTEMA DE INFORMACIN EN UNA ORGANIZACIN. COMPONENTES .................................................. 10
4.1.1 CONCEPTO DE SISTEMA DE INFORMACIN .............................................................................................. 10
4.1.2 COMPONENTES DE UN SISTEMA DE INFORMACIN................................................................................ 10
4.2 NIVELES DE GESTIN Y DE USUARIOS EN UNA ORGANIZACIN. ............................................................. 10
5. LOS SISTEMAS TRANSACCIONALES (PED) .......................................................................................................... 11
5.1 CONCEPTO DE TRANSACCIN BAJO UN SISTEMA DE BBDD....................................................................... 11
5.2 TRANSACCIONES Y PROCESAMIENTO MULTIUSUARIO .............................................................................. 12
5.3 SISTEMAS OLTP. CARACTERSTICAS ................................................................................................................ 12
6. SISTEMAS DE INFORMACIN DE GESTIN (MIS).............................................................................................. 13
6.1 QUE ES UN M.I.S.? ................................................................................................................................................. 13
6.2 UN POCO DE HISTORIA. ANTECEDENTES......................................................................................................... 13
6.3 UN CAMBIO EN LA ARQUITECTURA.................................................................................................................. 14
6.4 PUESTA EN MARCHA DEL M.I.S. DENTRO DE LA ORGANIZACIN ............................................................. 14
7. SISTEMAS DE SOPORTE A LA DECISIN (DSS) ................................................................................................... 14
7.1 ARQUITECTURA DEL DSS. ................................................................................................................................... 15
7.1.1 EL COMPONENTE DE DIALOGO ................................................................................................................... 15
7.1.2 EL COMPONENTE DE DATOS ........................................................................................................................ 16
7.1.3 EL COMPONENTE MODELO .......................................................................................................................... 16
7.2 EL REA DE AYUDA A LA TOMA DE DECISIONES .......................................................................................... 16
7.3 VENTAJAS Y DESVENTAJAS DE USAR DSS. ..................................................................................................... 17
7.3.1 VENTAJAS DE USAR UN DSS .......................................................................................................................... 17
7.3.2 DESVENTAJAS DE USAR UN DSS ................................................................................................................... 17
8. ALMACENES DE DATOS (DATA WAREHOUSE) ................................................................................................... 17
8.1 CONCEPTO DE ALMACN DE DATOS. ............................................................................................................... 18
8.1.1 ANTECEDENTES DE LOS ALMACENES DE DATOS ..................................................................................... 18
8.1.2 QUE ES UN DATA WAREHOUSE? ............................................................................................................... 18
8.1.3 CARACTERSTICAS .......................................................................................................................................... 19

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 1 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

8.1.4 OBJETIVOS........................................................................................................................................................ 19
8.2 COMPONENTES DE UN ALMACN DE DATOS. ................................................................................................ 19
8.2.1 MODELO DE DATOS CORPORATIVO............................................................................................................ 20
8.2.2 LIMPIEZA Y CARGA DE DATOS OPERATIVOS ............................................................................................. 21
8.2.2.1 Identificacin de las fuentes de datos. ............................................................................................................................... 21
8.2.2.2 Limpieza de los datos operativos....................................................................................................................................... 21
8.2.2.3 Documentacin de los formatos. ....................................................................................................................................... 21
8.2.2.4 Transformacin y carga.................................................................................................................................................... 21
8.2.3 RESULTADO: ALMACN DE DATOS.............................................................................................................. 22
8.2.4 EXTRACCIN Y RECUPERACIN DE LOS DATOS....................................................................................... 22
8.2.4.1 Acceso a los datos. ............................................................................................................................................................ 22
8.2.4.2 Recuperacin de los datos. ................................................................................................................................................ 22
8.2.4.3 Complejidad de las consultas. ........................................................................................................................................... 22
8.2.4.4 Anlisis multidimensional................................................................................................................................................. 22
8.3 ESTRUCTURA LGICA DEL ALMACN: DATOS Y METADATOS. ................................................................ 23
8.3.1 METADATOS ..................................................................................................................................................... 23
8.3.2 DATOS DETALLADOS ACTUALES .................................................................................................................. 23
8.3.3 DATOS DETALLADOS HISTRICOS............................................................................................................... 24
8.3.4 DATOS LIGERAMENTE RESUMIDOS............................................................................................................. 24
8.3.5 DATOS MUY RESUMIDOS ............................................................................................................................... 24
8.4 ESTRUCTURA FSICA DEL ALMACN: ARQUITECTURA............................................................................... 24
8.4.1 ARQUITECTURA CENTRALIZADA.................................................................................................................. 24
8.4.2 ARQUITECTURA DISTRIBUIDA...................................................................................................................... 24
8.4.3 ARQUITECTURA DISTRIBUIDA POR NIVELES............................................................................................. 25
8.5 COMPARACIN DE DW Y BD. .............................................................................................................................. 25
8.6 ELEMENTOS BSICOS DE UN DW....................................................................................................................... 25
8.6.1 SISTEMA ORIGEN............................................................................................................................................. 25
8.6.2 DATA STAGING REA ...................................................................................................................................... 26
8.6.3 SERVIDOR DE PRESENTACIN (PRESENTATION SERVER)....................................................................... 26
9. CONCLUSIN ................................................................................................................................................................. 26
10. BIBLIOGRAFA .......................................................................................................................................................... 27
11. ESQUEMA RESUMEN ............................................................................................................................................ 28

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 2 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

1. INTRODUCCION. EVOLUCIN DE LOS SISTEMAS TRADICIONALES A LAS BASES


DE DATOS

1.1 SISTEMAS TRADICIONALES DE FICHEROS. INCONVENIENTES

Los sistemas tradicionales de ficheros son sistemas orientados hacia el proceso, es decir, se pone el nfasis en el
tratamiento que reciben los datos, los cuales se almacenan en archivos diseados para una aplicacin concreta.
Las aplicaciones se disean e implantan independientemente unas de otras y los datos se duplican si las
diferentes aplicaciones los necesitan, en lugar de transferirse entre ellas.

Los principales inconvenientes de estos sistemas tradicionales de ficheros son:

Redundancia: Duplicidad innecesaria de informacin.


Mal aprovechamiento del equipo de almacenamiento: como consecuencia inmediata de la redundancia.
Aumento de los tiempos de proceso: Se repiten los mismos controles y operaciones en los distintos
ficheros, con lo que se consume ms tiempo de CPU del necesario. En el caso de modificar un campo
hay que hacerlo en todos los registros de todos los ficheros que lo contengan.
Inconsistencia de la informacin: por la alta redundancia. Si se deja de actualizar un dato en uno de los
archivos donde aparece, la informacin proporcionada por este dato se vuelve inconsistente.
Aislamiento de los datos: Cada archivo pertenece a un programa y no es posible que estos sean usados
por nuevos programas. Un nuevo programa necesitar su(s) propio(s) archivo(s) de datos que habrn de
crearse aunque parte de los datos ya existan en otros archivos de otros programas, contribuyendo a
aumentar la redundancia y las consecuencias de esta.
Imposibilidad de responder a demandas inesperadas de informacin: Los sistemas tradicionales de
archivos son inoperantes para conseguir un sistema de informacin orientado a la toma de decisiones.
Dependencia total entre los programas y la estructura fsica de los datos: No es posible modificar las
caractersticas fsicas (estructura y mtodos de acceso) de los archivos sin afectar a los programas que
los usan. Conseguir la independencia entre datos y aplicaciones va a ser uno de los principales objetivos
de los sistemas de bases de datos.

1.2 SISTEMAS ORIENTADOS A LA BASE DE DATOS

Ante los problemas descritos con los sistemas tradicionales de ficheros, surge la necesidad de una gestin ms
racional del conjunto de los datos. Poco a poco se fue poniendo mas nfasis en un enfoque distinto, en el cual la
informacin se organizaba y se mantena como un conjunto estructurado que no se diseaba para una aplicacin
concreta. Es decir, surge as un nuevo enfoque que se apoya sobre una base de datos en la que los datos son
recogidos y almacenados una sola vez con independencia de los tratamientos que se van a aplicar sobre ellos.

De esta forma, la informacin contenida en una base de datos est integrada y compartida. Integrada porque
puede considerarse como una unificacin de varios archivos de datos de los que hemos eliminado la redundancia
y compartida porque los programas que antes accedan a los archivos individuales acceden ahora al depsito
comn de datos, por lo que cada usuario o aplicacin tendr acceso a un subconjunto de los datos y como
consecuencia diferentes usuarios vern de formas muy diferentes la misma base de datos.

Es importante destacar que los subconjuntos de datos a los que acceden las diferentes aplicaciones o usuarios
no tienen por qu ser disjuntos, por lo que usuarios o aplicaciones distintas pueden acceder a la misma parte de
la base de datos para utilizarla con propsitos diferentes.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 3 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

2. CONCEPTO DE BASE DE DATOS


Una primera definicin de bases de datos sera: "Una Base de Datos (BD) es una coleccin o depsito de datos
integrados, almacenados en soporte secundario (no voltil) y con redundancia controlada. Los datos, que han de
ser compartidos por diferentes usuarios y aplicaciones, deben mantenerse independientes de ellos y su definicin
(estructura de la BD), nica y almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha
de permitir captar las interrelaciones y restricciones existentes en el mundo real. Los procedimientos de
actualizacin y recuperacin, comunes y bien determinados, facilitarn la seguridad del conjunto de los datos", De
Miguel et. al. (1999).

Veamos en qu consiste cada uno de los aspectos mencionados en esta definicin de Base de Datos que no son
ms que distintas definiciones segn distintas perspectivas. La BD es un conjunto de datos relativos a una
determinada parcela del mundo real que se almacenan en un soporte informtico no voltil. Adems, no debe
existir redundancia, es decir, no deben existir duplicidades perjudiciales ni innecesarias (a ser posible un
determinado tipo de dato, slo deben aparecer en un sitio en la BD). En ocasiones, es necesaria cierta
redundancia (a nivel de almacenamiento fsico) que mejora la eficiencia de la BD). Sin embargo, esta redundancia
siempre debe ser controlada por el sistema para que no se produzcan inconsistencias. Por otro lado, las BD han
de atender a mltiples usuarios de la organizacin as como a distintas aplicaciones.

Otras definiciones de base de datos son:

Conjunto de datos de la empresa memorizados en un ordenador, que es utilizado por numerosas


personas y cuya organizacin esta recogida en un modelo de datos.
Coleccin o depsito de datos, donde estos se encuentran lgicamente relacionados entre s, tienen una
definicin y una descripcin comunes y estn estructurados de una forma particular.
Coleccin o deposito de datos integrados, con redundancia controlada y una estructura que refleje las
interrelaciones y restricciones existentes en el mundo real; los datos, que han de ser compartidos por
diferentes usuarios y aplicaciones, deben mantenerse independientes de estos(as), y su definicin y
descripcin, nicas para cada tipo de dato, han de estar almacenados junto con los mismos. Los
procedimientos de actualizacin y recuperacin, comunes y bien determinados, habrn de ser capaces de
conservar la integridad, seguridad y confidencialidad del conjunto de los datos.

Ahora, despus de ver estas definiciones, podemos enumerar las principales caractersticas de los datos
almacenados en una base de datos, que son:

Estn organizados.
Estn relacionados.
Son accesibles de diferentes formas sin grandes dificultades.
Se almacenan solo una vez.

2.1 INDEPENDENCIA DE LOS DATOS. NIVELES DE ABSTRACCIN

Como hemos visto, en los sistemas de base de datos se plantean dos objetivos principales:

Independencia de la base de datos de los programas para su utilizacin.


Proporcionar a los usuarios una visin abstracta de los datos. El sistema esconde los detalles de
almacenamiento fsico (como almacena y mantiene los datos), pero deben extraerse eficientemente.

2.1.1 INDEPENDENCIA DE LOS DATOS. DEFINICIN DE ANSI

La independencia de los datos es la capacidad de un sistema para permitir que las referencias a los datos
almacenados, especialmente en los programas y en sus descriptores de datos, estn aislados de los cambios y

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 4 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

de los diferentes usos en el entorno de los datos, como puede ser la forma de almacenar dichos datos, el modo
de compartirlos con otros programas y como se reorganizan para mejorar el rendimiento del sistema de Bases de
Datos.

2.1.2 NIVELES DE ABSTRACCIN

Para conseguir esta independencia entre los datos y las aplicaciones es necesario separar la representacin
fsica y lgica de los datos, distincin que fue reconocida oficialmente en 1978, cuando el comit ANSI/X3/SPARC
propuso un esqueleto generalizado para sistemas de base de datos. Este esqueleto propone una arquitectura de
tres niveles, los tres niveles de abstraccin bajo los que poda verse una base de datos: el nivel interno, el nivel
conceptual y el nivel externo.

NIVEL EXTERNO: visin que de la base de datos tiene un usuario o aplicacin en particular.

NE1 NE2 NE3

NIVEL CONCEPTUAL: contiene el diseo conceptual de la base de datos.

NIVEL CONCEPTUAL

NIVEL INTERNO: es el que define la estructura fsica de la base de datos.

NIVEL INTERNO

Esta arquitectura de tres niveles nos proporciona la deseada independencia, que definimos como la capacidad
para cambiar el esquema en un nivel sin tener que cambiarlo en ningn otro nivel. Distinguimos dos tipos de
independencia:

Independencia lgica de datos: Cambio del esquema conceptual sin cambiar las vistas externas o las
aplicaciones.
Independencia fsica de los datos: Cambio del esquema interno sin necesidad de cambiar el esquema
conceptual o los esquemas externos.

2.2 VENTAJAS E INCONVENIENTES DEL USO DE BASES DE DATOS

2.2.1 VENTAJAS

Control sobre las inconsistencias y redundancias: En los sistemas tradicionales de ficheros cada
aplicacin tiene sus datos privados, lo que provoca una alta redundancia y desaprovechamiento del
espacio en disco. La redundancia debe minimizarse y controlarse con las bases de datos. Aunque se
mantenga cierto grado de redundancia por motivos de rendimiento u otros, el sistema proporciona
mecanismos para garantizar la consistencia. Se controla la redundancia garantizando que los datos
redundantes se actualicen de forma automtica.
Mejor servicio a los usuarios: En los sistemas convencionales suele ser difcil obtener una informacin
para la cual no fueron diseados. Una vez que varios de estos sistemas se combinan para crear una base
de datos centralizada, adems de mejorar sustancialmente la disponibilidad de la informacin tambin

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 5 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

garantiza que los datos son actuales. Asimismo es posible responder mas gilmente a nuevas
necesidades del usuario no planteadas anteriormente.
Los datos pueden compartirse: Las necesidades de datos de nuevas aplicaciones pueden atenderse con
los ya existentes sin tener que almacenar nuevos datos.
Mejora la flexibilidad del sistema: A menudo se plantea la necesidad de cambiar los datos almacenados.
Estos cambios, a travs de un sistema de Base de Datos, no tienen el impacto sobre las aplicaciones que
tendran en un sistema convencional.
Menor coste de desarrollo y mantenimiento: Aunque el coste inicial de una base de datos puede ser
superior al de un sistema tradicional, los costes en mantenimiento y desarrollo de aplicaciones son
menores.
Pueden hacerse cumplir las normas establecidas: Al tener un control centralizado de las bases de datos,
el administrador (a instancias del responsable de la informacin de la organizacin) puede garantizar
que se observen las normas de la empresa aplicables a la representacin de los datos.
Restricciones de seguridad: El administrador puede asegurar que el nico modo de acceso sea a travs
de los canales establecidos, y definir controles de autorizacin que pueden afectar a cada modo de
acceso (modificacin, insercin, borrado o lectura), segn las necesidades de cada usuario.
Se desarrolla un modelo de datos: En los sistemas convencionales los ficheros de datos se disean
teniendo en mente las necesidades particulares de la aplicacin que los va a utilizar, dejando de lado la
visin ms general. En los sistemas de Base de Datos al estar la informacin centralizada, se hace
necesario un punto de vista ms general a la hora de disear el modelo de datos.
Se reduce el espacio de almacenamiento: Al integrar en un solo espacio los datos de varios sistemas
aislados y evitar que se repitan, se requiere un menor volumen para almacenar los mismos datos. Por
otro lado esto facilita las tareas de realizacin de copias de seguridad y su recuperacin.

2.2.2 INCONVENIENTES

Instalacin costosa.
Necesidad de personal especializado.
Necesidad de hardware adicional: Al ser los requerimientos superiores a los de un sistema tradicional, ya
sea en cuanto a memoria, capacidad de proceso, etc.
El sistema adquiere mayor complejidad: Al integrarse dentro del S.O. un nuevo sistema activo que
interacciona con l e influye en la capacidad de responder al usuario.
Implantacin larga y difcil.
Falta de rentabilidad a corto plazo.

3. PRINCIPALES COMPONENTES DE UN ENTORNO DE BASE DE DATOS


Ahora vamos a desmenuzar un poco ms el concepto de base de datos, y vamos describir sus componentes
bsicos, justificando adems la necesidad de cada uno de ellos.

3.1 DATOS

Una base de datos no tiene sentido sino est compuesta por datos. Lo que no est tan claro es la forma en que
estos datos se deben disponer, qu datos se deben almacenar y cmo los debe entender la mquina.

La disposicin de los datos depende del mbito de aplicacin concreto en que se enmarque la base de datos. No
es lo mismo una base de datos que almacene un dibujo vectorial de monumentos histricos que una base de

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 6 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

datos para almacenar las reservas de clientes en un hotel. Lo que vara fundamentalmente en uno y otro caso, es
la forma en que los datos se relacionan entre s, y el tipo de accesos a la informacin que va a realizar el usuario.
Adems, los datos deben disponerse de manera que las consultas sean lo ms eficientes posible, evitando a la
vez la existencia de datos duplicados que pueden dar al traste con la coherencia de la base de datos. De esta
forma, no slo se consideran datos aquellos que el usuario desea almacenar, sino toda estructura de apoyo que
el sistema necesite para hacer ms eficiente una consulta.

Los ndices son ficheros auxiliares que facilitan el acceso a los datos que se encuentran en el fichero principal de
la base de datos. La gran ventaja de los ndices es que el mantenimiento de los mismos lo realiza de forma
automtica el sistema. De esta forma se obtiene una gran eficiencia en las consultas, sin que el usuario tenga que
trabajar ms. Pues bien, este fichero aparte, creado con el nico objetivo de facilitar el acceso a la informacin,
tambin lo consideramos datos, aunque deban ser gestionados automticamente, e incluso algunos usuarios no
tengan ni la menor idea de su existencia.

Por otro lado, es muy importante decidir qu datos se van a almacenar. Hay que encontrar un equilibrio entre las
situaciones en las que almacenamos datos de ms (histricos muy poco utilizados) y en las que se almacenan
datos de menos (guardando los estrictamente necesarios en el momento de definir la base de datos).

Por ltimo, tambin es interesante, por cuestiones de seguridad y aprovechamiento de los recursos, decidir en
qu formato se van a almacenar los datos: si se van a almacenar encriptados para que nadie los pueda copiar, o
si se van a codificar o a comprimir de alguna forma para hacer que ocupen menos espacio.

3.2 METADATOS

Desde el momento en que se crea una base de datos, hasta el momento en que se desecha porque se compra
un sistema mejor, o se instala una nueva base de datos, la estructura de la base de datos (o sea, los datos que se
deciden almacenar, y la estructura con que se almacenan) cambia a medida que cambian las necesidades sobre
la informacin a obtener de la base de datos.

Dado que la base de datos que solucione unas necesidades concretas puede adoptar muchas formas posibles,
es muy interesante el poseer algn lugar que indique al personal encargado de mantener la base de datos, cul
es el objetivo de cada dato particular almacenado en la base, as como en qu aplicaciones es utilizado, y con
qu propsito, si es un dato fundamental, o si puede ser omitido por el que introduce los datos, etc.

De esta forma, antes de modificar el esquema o estructura de la base de datos, el departamento de proceso de
datos debe consultar esta informacin sobre los datos de la base, con cuidado para no cometer errores graves
que repercutan sobre el buen funcionamiento de todo el sistema.

Esta informacin que el sistema guarda sobre los datos almacenados, es lo que se llaman metadatos, es decir,
datos acerca de los datos. Es ms, estos metadatos se almacenan en el diccionario de datos o Catalogo.

3.3 EL SISTEMA GESTOR DE BASE DE DATOS.

En un sistema de base de datos, debe existir una capa intermedia entre los datos almacenados en la base de
datos, las aplicaciones y los usuarios de mismo. Se trata del Sistema de Gestin de la Base de Datos (SGBD).
Acta de intermediario entre los usuarios y aplicaciones y los datos proporcionando medios para describir,
almacenar y manipular los datos, y proporciona herramientas al administrador para gestionar el sistema, entre
ellas las herramientas de desarrollo de aplicaciones, generadores de informes, lenguajes especficos de acceso a
los datos, como SQL (Structured Query Language) o QBE (Query By Example) en bases de datos relacinales.

Un SGBD se puede definir como un conjunto coordinado de programas, procedimientos, lenguajes, etc. que
suministra, tanto a los usuarios finales como a los analistas, programadores o el administrador, los medios
necesarios para describir, recuperar y manipular los datos almacenados en la base, manteniendo su integridad,
confidencialidad y seguridad. Entre sus funciones destacan:

Definicin y control centralizado de los datos: Definicin de todos los elementos de datos en la base de
datos en los tres niveles definidos anteriormente (interno, conceptual y externo). Descripcin de los datos

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 7 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

(campos, grupos, registros, tablas), e interrelaciones entre las diferentes estructuras de datos. La base de
datos es autodescriptiva, es decir, contiene informacin que describe su estructura (los metadatos).
Manipulacin de los datos: Suministrar mecanismos que faciliten la interaccin con la base de datos: El
SGBD debe ser capaz de atender las solicitudes del usuario para extraer, modificar o aadir datos a la
base de datos. Estos mecanismos suelen venir dados en forma de lenguajes de manipulacin y definicin
de datos. Adems, garantizan la independencia de los datos, en el sentido de que, pese a la evolucin del
esquema de los datos, las aplicaciones deben sufrir las mnimas modificaciones imprescindibles.
La Seguridad y la Integridad: Debe proporcionar los medios para definir y gestionar las autorizaciones de
acceso, ya sea mediante claves de acceso al sistema o mediante la definicin de vistas externas de
usuario, para evitar as accesos fraudulentos a los datos. Por otro lado, tambin proporciona los medios
para garantizar la integridad y la consistencia de los datos definiendo (en el diccionario de datos)
restricciones sobe los valores que pueden tomar.
Permitir hacer copias de seguridad: Proporciona capacidades de recuperacin ante fallos y de copia de
seguridad.
Garantiza la disponibilidad de la informacin: Permite el acceso simultaneo a los datos por parte de varios
usuarios. Debe controlar que la informacin representada por los datos al final de cada acceso de usuario
siga siendo coherente.
Interactuar con el Sistema Operativo: Como el S.O es el nico que puede acceder a los dispositivos de
entrada/salida, si el SGBD debe leer o escribir en estos dispositivos debe interactuar con el S.O.

3.4 USUARIOS DE LA BASE DE DATOS.

Las personas que trabajan con una base de datos se pueden catalogar como usuarios de bases de datos.
Podemos clasificar en cuatro clases los usuarios de un sistema de base de datos:

Usuarios normales: No saben nada de la estructura interna de la base de datos. Interaccionan con ella a
travs de las aplicaciones desarrolladas por los programadores, y son incapaces de acceder a los datos
directamente a travs del lenguaje del S.G.B.D. La interfaz de este tipo de usuarios es una interfaz de
formularios, donde el usuario puede rellenar los campos apropiados del formulario.
Programadores de aplicaciones. Reciben peticiones de otros usuarios, para el acceso a los datos, y se
encargan de escribir los programas que satisfacen dichas necesidades. Normalmente estos programas
estn escritos en lenguajes de programacin:
convencional (Pascal, Basic, C, Cobol etc.), en el que se insertan rdenes especiales que es capaz
de comprender el S.G.B.D. De esta forma el S.G.B.D. suministra los datos, y el lenguaje convencional
(tambin llamado anfitrin porque alberga las sentencias reconocidas por el S.G.B.D.) los procesa,
presenta al usuario, modifica, etc.
de cuarta generacin que combinan estructuras de control imperativo, con instrucciones del lenguaje
de manipulacin de datos, y adems incluyen caractersticas especiales para facilitar la generacin
de formularios y la presentacin de datos en pantalla. La mayora de los sistemas de bases de datos
comerciales incluyen un lenguaje de cuarta generacin.
Usuarios sofisticados: son aquellos que interactan con la base de datos sin programas escritos,
haciendo uso directamente del lenguaje que proporciona el SGBD. Por ejemplo, el SQL.
Usuarios especializados: son usuarios sofisticados que escriben aplicaciones de bases de datos
especializadas. Entre estas aplicaciones estn los sistemas de diseo asistido por ordenador, sistemas
de bases de conocimiento, sistemas expertos etc.

Finalizamos este apartado con la quinta clase de usuarios de bases de datos. Son los administradores de bases
de datos. Usuarios especiales que son los responsables del control general del sistema desde el punto de vista
tcnico. Entre sus funciones cabe destacar:

Definir el esquema conceptual, con el lenguaje de Definicin de Datos.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 8 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Definir el esquema interno. La estructura de almacenamiento y los mtodos de acceso.


Diseo fsico e implementacin de la base de datos.
Modificar el esquema y la organizacin fsica de los datos. Para reflejar las necesidades cambiantes de la
organizacin y para mejorar el rendimiento.
Establecer las restricciones de seguridad, integridad y confidencialidad. Concesin de permisos y
privilegios para el acceso a los datos.
Definir los procedimientos de copia de seguridad y recuperacin.
Supervisar el rendimiento del sistema y responder a los cambios en los requerimientos.

3.5 ELEMENTOS DE SEGURIDAD

El administrador debe conocer en profundidad los elementos de seguridad que suministra el S.G.B.D., y sacar el
mximo partido posible de ellos. En general, se pueden tener niveles de acceso clasificados por:

La informacin a que se tiene acceso. En una empresa grande y ampliamente informatizada, cada
usuario debe poder acceder exclusivamente a los datos que competen a su tarea. Por tanto, debe existir
un mecanismo de seguridad que restrinja el mbito de acceso de cada usuario en funcin de sus
competencias.
Las operaciones que se pueden realizar sobre la informacin. No slo es importante el acceder o no a los
datos, sino tambin la forma en que este acceso se produce, en funcin de las caractersticas propias de
la seccin. En general, las operaciones que se pueden efectuar se agrupan en cuatro grandes bloques:
Altas, Bajas, Modificaciones, y Consultas.
El acceso al diccionario de datos y a la estructura de la base de datos. Como se ha comentado
anteriormente, los metadatos almacenados en el diccionario de datos y que almacenan informacin sobre
la estructura de la base de datos, son gestionados, a su vez, como si de una base de datos especial se
tratase. Sin embargo, dada su primordial importancia, su acceso debe estar muy restringido, ya que
cualquier modificacin puede dar lugar a resultados desastrosos en la base de datos: prdida de
informacin, corrupcin en los datos, falta de integridad, etc. Por ello, es necesaria la existencia de
prioridades o privilegios especiales que slo permitan el acceso al personal que compone la
administracin de la base de datos, que es el nico capacitado para modificar estos metadatos.

3.6 LENGUAJES DE BASES DE DATOS

La interaccin del usuario con la base de datos debe efectuarse a travs de alguna tcnica que haga fcil la
comunicacin, y que permita al usuario centrarse en el problema que desea solucionar, ms que en la forma de
expresarlo con las tcnicas que se le suministran. La mejor forma de alcanzar este objetivo, es darle un lenguaje
parecido al lenguaje natural, que le permita expresar de forma sencilla los requerimientos.

En funcin de estos requerimientos, podemos tener, fundamentalmente dos tipos de lenguajes para
comunicarnos con el S.G.B.D.:

Lenguaje de definicin de datos (LDD). Este lenguaje es utilizado en exclusiva por el administrador de la
base de datos, ya que permite la construccin de sentencias que le indican al S.G.B.D: las caractersticas
particulares de la base de datos sobre la que se est trabajando, as como la creacin de nuevas bases
de datos. La creacin de esquemas y su modificacin, la creacin y supresin de ndices, la
especificacin de unidades de almacenamiento en los ficheros, etc.
Lenguaje de manipulacin de datos (LMD). El lenguaje de manipulacin de datos es el que usan los
usuarios sofisticados para efectuar sus operaciones sobre la base de datos. Como se indic, estas
operaciones son bsicamente de insercin, eliminacin, modificacin y consulta de datos, aunque
tambin se pueden introducir capacidades para crear vistas de los datos que faciliten otros accesos. Los
usuarios sofisticados interaccionan con el S.G.B.D. a travs de este lenguaje, mediante una interfaz

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 9 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

agradable y fcil de usar. Los programadores de aplicaciones emplean el LMD dentro de un lenguaje de
programacin que les da potencia expresiva. Para ello, el LMD que emplean se extiende de diferentes
formas para poderse integrar fcilmente en el lenguaje anfitrin, ya que ambos, LMD y lenguaje anfitrin
deben poderse comunicar adecuadamente para que las aplicaciones resultantes sean simples de
programar y de utilizar.

4. UTILIZACIN DE LA BASE DE DATOS EN LA ORGANIZACIN


Las bases de datos son ampliamente usadas en multitud de aplicaciones en: Banca, Lneas areas,
Universidades, Telecomunicaciones, Ventas, Recursos humanos etc. Esto significa que las bases de datos
forman una parte esencial de las empresas actuales.

4.1 SISTEMA DE INFORMACIN EN UNA ORGANIZACIN. COMPONENTES

4.1.1 CONCEPTO DE SISTEMA DE INFORMACIN

Toda organizacin necesita para su funcionamiento un conjunto de informaciones que han de transmitirse entre
sus diferentes elementos, as como desde y hacia el exterior de la propia organizacin. Un sistema de informacin
se disea con el fin de satisfacer las necesidades de informacin de una organizacin, en la que est inmerso. El
sistema de informacin toma datos del entorno (tanto de la organizacin, como de las fuentes externas) y los
resultados de las operaciones sobre esos datos sern la informacin que dicha organizacin necesita para su
gestin y toma de decisiones.

4.1.2 COMPONENTES DE UN SISTEMA DE INFORMACIN

Contenido: (Datos: hechos conocidos con significado implcito que pueden ser almacenados). Es el centro
del sistema de informacin. Los datos contenidos en un sistema de informacin pueden ser:
De tipo referencial: son aquellos que contienen informacin acerca de donde se encuentra la
informacin buscada.
De tipo factual: Son aquellos que contienen la informacin en si. A su vez pueden ser: estructurados
y no estructurados.
Equipo fsico. Ordenadores y perifricos.
Soporte Lgico. Incluye todo el software necesario para la implantacin del sistema de informacin:
Sistemas Operativo, Sistemas de base de datos, software de comunicaciones y otros programas para
tratamientos especficos.
Administrador. Los datos y las informaciones manejadas por nuestro sistema de informacin han de ser
gestionadas por las personas adecuadas. Tendremos, por un lado los responsables de tomar las
decisiones estratgicas y polticas con respecto a la informacin de la empresa y por otro los
responsables de dar apoyo tcnico para poner en prctica estas decisiones.

4.2 NIVELES DE GESTIN Y DE USUARIOS EN UNA ORGANIZACIN.

En toda organizacin hay tres niveles de gestin (operacional, tctico y estratgico) y el sistema de informacin
debe disearse para satisfacer las necesidades y facilitar informaciones adecuadas a cada unos de los niveles.

En el nivel operacional, los usuarios manejan datos elementales que describen los sucesos que caracterizan las
actividades de la organizacin. Esta informacin, compuesta por datos totalmente desagregados (microdatos) es
necesaria para los procesos comnmente denominados administrativos (tareas diarias y de rutina) y el volumen
de datos manejado ser muy grande. En este nivel situamos a los llamados sistemas transaccionales.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 10 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

En el nivel tctico se definen los objetivos especficos y el control de gestin. En el nivel estratgico se definen los
objetivos generales y la elaboracin de planes. En los niveles tctico y estratgico, cuyos usuarios tienen
necesidades de informacin muy distintas, obtendrn del nivel anterior (operacional), mediante procesos de
elaboracin adecuados (generalmente de agregacin) junto con datos provenientes del exterior, las informaciones
necesarias para la ayuda a la decisin.

Junto con estos niveles de gestin tambin se pueden distinguir 3 niveles de usuarios: personal, mandos
intermedios y ejecutivos. Estos niveles se corresponden con los 3 diferentes tipos de automatizacin de los
sistemas de negocios:

Los PED (Procesamiento Electrnico de Datos) o DP (Data Processing) que tienen el foco de atencin en
el nivel operativo de almacenamiento, procesamiento y flujo de los datos, as como procesar
eficientemente las transacciones y realizar informes resmenes para los dirigentes. Tpicamente el
enfoque DP se usa para transformar un conjunto de datos brutos en la siguiente informacin:
Estadstica (P. Ejem. Nmeros que representan la media, la moda y la varianza de los datos).
Representaciones grficas (P. Ejem. Histogramas, Diagramas de barras, Diagramas de pastel, etc.)
Los SIG (Sistemas de Informacin de Gestin) o MIS (Management Information Systems) que se
caracterizan porque su foco de atencin est en la informacin orientada a mandos intermedios, por la
integracin de las tareas de PED, por sus funciones en los negocios y por la generacin de informes.
Los STD (Sistema de Apoyo a la Toma de Decisiones) o DSS (Decision Support Systems, ms centrados
en la decisin y orientados a los altos ejecutivos

Por otro lado los datos provenientes del nivel operacional almacenados en bases de datos, as como en otros
soportes, pueden estar organizados en almacenes de datos (Data Warehouses) que sirven de base para la
extraccin y el descubrimiento de conocimiento en bases de datos (KDD, Knowledge Discovering in Databases) y
para la minera de datos (Data Mining)

5. LOS SISTEMAS TRANSACCIONALES (PED)

5.1 CONCEPTO DE TRANSACCIN BAJO UN SISTEMA DE BBDD

Uno de los problemas ms complejos que se plantea en los sistemas de bases de datos es garantizar la
consistencia de la base de datos a pesar de los fallos del sistema y de la ejecucin concurrente. Para dar solucin
a los problemas de recuperacin y concurrencia, se introduce el concepto de transaccin .

Una transaccin es una secuencia de operaciones llevadas a cabo como una unidad lgica de trabajo simple.
Para asegurar la integridad de los datos se necesita que el sistema de base de datos mantenga las siguientes
propiedades de las transacciones:

Atomicidad: Una transaccin debe ser una unidad atmica de trabajo: o todas sus operaciones se llevan a
cabo o no se realiza ninguna de ellas.
Consistencia: Cuando termina, una transaccin debe dejar la base de datos en un estado consistente
(suponiendo que est ejecutndose de forma aislada, sin otras transacciones concurrentes). Asegurar la
consistencia es responsabilidad de los mecanismos de control de concurrencia.
Aislamiento: Las modificaciones realizadas por una transaccin deben aislarse de las modificaciones
llevadas a cabo por otras posibles transacciones concurrentes. Una transaccin debe ver los datos en el
estado en el que estaban antes de que cualquier otra transaccin concurrente los modificara o bien los ve
tras su modificacin, pero nunca en un estado intermedio. El aislamiento es una propiedad de las
transacciones por lo cual una transaccin ve en todo momento la base de datos en un estado consistente.
Una transaccin en ejecucin no hace visibles sus datos a otras transacciones concurrentes hasta que no
termina y hace permanentes sus cambios.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 11 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Durabilidad: Una vez que la transaccin ha terminado con xito, sus efectos deben hacerse permanentes
en la base de datos. Las modificaciones deben persistir incluso en caso de un fallo del sistema. El SGBD
garantiza que los resultados de las transacciones terminadas sobrevivan a fallos posteriores del sistema.

La bibliografa suele referirse a estas propiedades como ACID, por sus siglas en ingls (Atomicity, Consistency,
Isolation, Durability). Es frecuente tambin encontrar referencias a la acidity de una transaccin.

Los programadores son los responsables de establecer el inicio y el final de cada transaccin en puntos que
hagan cumplir la consistencia lgica de los datos.

Es responsabilidad del SGBD proporcionar los mecanismos que garanticen la integridad fsica de cada
transaccin, aqu destacamos:

Facilidades que protejan el aislamiento de las transacciones.


Facilidades de registro que aseguren la durabilidad de las transacciones. Si la ejecucin de la transaccin
es interrumpida por cualquier tipo de fallo, el SGBD es el responsable de determinar qu hacer con la
transaccin una vez recuperado del fallo:
Terminar la transaccin (hacer lo que queda por hacer)
Abortarla (deshacer lo que se haya hecho)
Caractersticas de gestin de transacciones que garantizan la atomicidad y la consistencia de las
transacciones. Una vez que la transaccin ha comenzado, esta debe ser completada con xito o el gestor
deshace todas las modificaciones de datos realizadas por esta desde el comienzo de la transaccin.

5.2 TRANSACCIONES Y PROCESAMIENTO MULTIUSUARIO

Cuando dos o ms usuarios acceden concurrentemente a una base de datos, el procesamiento de transacciones
adquiere una nueva dimensin. Ahora el SGBD no solo debe recuperarse adecuadamente de los fallos del
sistema sino que tambin debe asegurar que las operaciones de los usuarios o aplicaciones no interfieren unas
con otras.

Idealmente, cada usuario debera poder acceder a la base de datos como si tuviera acceso exclusivo a ella, sin
preocuparse de las acciones del resto de los usuarios. Esto se logra mediante diferentes mecanismos que se
conocen como esquemas de control de concurrencia.

5.3 SISTEMAS OLTP. CARACTERSTICAS

Para cualquier organizacin actual, la captura de datos sobre sus operaciones diarias es indispensable para su
funcionamiento continuado, por lo que el almacenamiento sistemtico de transacciones es una actividad comn
en el da a da. Los sistemas que se utilizan con tal fin son los llamados OLTP (On-Line Transaction Processing) y
suelen estar constituidos por bases de datos y sistemas on-line optimizados para la insercin de grandes
volmenes de registros, habitualmente recogidos de uno en uno. En adelante, denominaremos a los datos as
recogidos como datos operativos, para distinguirlos de los que se guardan en los almacenes de datos.

En principio, la informacin necesaria para la gestin corporativa se podra extraer de estos sistemas y sus bases
de datos asociadas. No obstante, como vamos a ver a continuacin, los sistemas OLTP tienen caractersticas que
hacen que esa solucin no sea la ms adecuada:

Heterogeneidad: viene producida por la cantidad de fuentes de las que proceden los datos operativos y
se manifiesta en la falta de consistencia a la hora de elegir formatos de representacin, la aparicin de
registros redundantes, errneos, contradictorios o, simplemente, intiles para la extraccin de
informacin.
Falta de organizacin: es producto tanto de la necesidad de efectuar el almacenamiento de forma rpida,
para que no se produzcan cuellos de botella en los tiempos de respuesta de sistema, como de la

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 12 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

dispersin de los sistemas en que se almacenan estos datos diarios. Esto conduce a que, de forma
natural, los datos queden almacenados atendiendo a criterios geogrficos (donde se recogen) y de
transaccin (que operacin los produjo).
Inadecuacin para dar respuesta a consultas complejas: esto se debe a que las bases de datos utilizadas
estn optimizadas para ofrecer grandes rendimientos en las operaciones de insercin y actualizacin,
tanto en velocidad como en volumen. Para lograr este objetivo suelen tener un nivel de redundancia muy
bajo, es decir, que distribuyen la informacin en gran nmero de tabla relacionadas entre si y con un
mnimo de informacin agregada o precalculada. Esta organizacin de las tablas, til en bases de datos
que van a estar sufriendo constantes actualizaciones, se convierte en un obstculo para realizar
consultas complejas, ya que al estar la informacin dispersa entre mltiples tablas, la recuperacin de la
informacin requiere una gran cantidad de operaciones de unin natural (join), costosas tanto en recursos
de mquina como en tiempo. Adems, realizar una consulta compleja, cuya respuesta va a demandar
gran cantidad de recursos por parte de la mquina OLTP, producir un impacto negativo en la capacidad
de procesamiento y almacenaje de nuevas transacciones. Dado el nmero suficiente de usuarios y
consultas concurrentes de este tipo, puede suceder incluso que se inutilice el sistema. Por supuesto, el
hecho mismo de que sigan llegando sin cesar nuevos registros mientras se realiza la consulta implica que
sus resultados no van a ser todo lo fiables que sera de desear.

Por estos motivos, trabajar sobre las base de datos operativas, que utilizan para llevar el da a da, no es la forma
ms eficaz de extraer informacin til para la toma de decisiones, tanto por los errores que se pueden producir al
tratar con datos dispersos y sin limpiar, como por la repercusin que podra tener sobre el rendimiento del sistema
el trabajar directamente sobre los equipos que se usan para recoger transacciones on-line, vitales para el
funcionamiento de la organizacin.

6. SISTEMAS DE INFORMACIN DE GESTIN (MIS)

6.1 QUE ES UN M.I.S.?

Existen varias definiciones, veamos dos de ellas:

Conjunto de medios para reunir los datos necesarios para la gestin y difundir la informacin obtenida con
el tratamiento de estos datos.
Proceso por el que los datos importantes para la empresa son identificados, analizados, recolectados y
puestos a su disposicin.

De estas definiciones se deduce que el primer objetivo de un sistema de gestin es incrementar la inteligencia de
los procesos del negocio y el conocimiento de los trabajadores implicados en estos procesos.

6.2 UN POCO DE HISTORIA. ANTECEDENTES

En los primeros das de los sistemas de informacin vieron la luz las aplicaciones. Su diseo estaba
marcado por las necesidades puntuales del da a da de diferentes departamentos. La integracin entre
ellas no era un objetivo.
Pronto dio comienzo el mantenimiento de esas aplicaciones. Las aplicaciones necesitaban cambios por
muchas razones: nuevos requisitos, cambios en el negocio, nuevas oportunidades.
Al mismo tiempo que comenzaba el mantenimiento surga la necesidad de extraer ms informacin de
estas aplicaciones. El primer intento para satisfacer esta necesidad fue la escritura de programas que
listasen informes.
La primera limitacin de estos listados es que accedan a una nica aplicacin. Hubo que definir
interfaces entre las aplicaciones para que pudiesen compartir datos entre ellas.
La segunda limitacin es que los informes haba que modificarlos de forma constante.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 13 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Se introdujeron herramientas 4GL para poder escribir y modificar informes a gran velocidad. Listaban
muchos ms informes, pero con los mismos problemas que antes. Se introducen entonces herramientas
de extraccin.
Surge el PC. Con las herramientas de extraccin los usuarios ya pueden acceder y manipular
directamente la informacin. A medida que aumentaba la potencia de los PCs aumentaba el volumen de
los datos almacenados en ellos. Luego las redes,...
Aqu llegados los usuarios padecen la misma falta de integracin, consistencia, coherencia y las mismas
limitaciones que antes de la llegada del PC. Pero esto no trae como consecuencia que decrezca la
demanda de informacin, al contrario, sta siempre crece.

6.3 UN CAMBIO EN LA ARQUITECTURA

El corazn del problema es que las aplicaciones estn profundamente marcadas por las primeras
consideraciones que dirigieron su desarrollo: las necesidades departamentales enfocadas sobre las
necesidades del da a da.
La arquitectura sobre la que se construyeron estas aplicaciones (OLTP) no es vlida para soportar las
necesidades de los sistemas de informacin de gestin actuales.
En estos sistemas la arquitectura de datos nunca fue un objetivo del negocio. La complejidad y
dinamismo de la economa digital ha colocado en un lugar predominante la habilidad de los gestores
para ver lo que est ocurriendo, desvelando las dificultades de acceso a la informacin de la empresa.
Es en este momento cuando la calidad y disponibilidad de la informacin se convierte en un objetivo
primordial del negocio.
Cmo compensar la carencia de una arquitectura de datos?
Creando una gran base de datos virtual para integrar los datos de las aplicaciones existentes, que
pasarn a formar parte de esta base de datos una vez que hayan sido depurados y reconciliadas sus
disparidades. Esto posibilitar que los datos sean utilizados para la gestin.
La solucin pasa por separar el procesamiento en dos grandes categoras:
Proceso Operacional OLTP.
Procesamiento para el sistema de soporte de decisiones (DSS/OLAP).

6.4 PUESTA EN MARCHA DEL M.I.S. DENTRO DE LA ORGANIZACIN

La implementacin consiste, en una primera fase, en el anlisis de las necesidades de informacin a las que
desea acceder cada empresa. Para ello se integrarn en el sistema todos aquellos datos operacionales
necesarios, adems de otras fuentes de informacin que sea necesario incorporar.

Definida la estructura de las bases de datos se proceder a la carga de la informacin y se crearn las
agregaciones de datos para mejorar el rendimiento del sistema en los procesos de consulta ms habituales.

Finalmente, se incluirn en el sistema los procedimientos que permitan la actualizacin de la informacin, cuya
periodicidad depender de las necesidades de cada usuario.

7. SISTEMAS DE SOPORTE A LA DECISIN (DSS)


Como ya se coment, los STD (Sistema de Apoyo a la Toma de Decisiones) o DSS (Decision Support Systems),
estn ms centrados en la decisin y orientados a los altos ejecutivos. Las bases de datos que soportan estos
sistemas son de gran tamao y pueden resultar minas de informacin para adoptar decisiones empresariales,
como los artculos que debe haber en inventario y los descuentos que hay que ofrecer.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 14 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

La utilizacin de Sistemas de Soporte a la Decisin (DSS) es muy adecuada para afrontar una variedad de
situaciones al interactuar: interfaces de usuarios, que hacen que dichos sistemas se adecuen a las necesidades
de los usuarios; bases de datos, que incluyen toda la informacin necesaria; y finalmente; procesos de decisin
que ayudan al experto en la difcil tarea de establecer posibles soluciones.

Segn L. Adelman se pueden definir los DSS como "programas informticos interactivos que utilizan mtodos
analticos, tales como anlisis de decisin, algoritmos de optimizacin, programas de planificacin de rutinas, etc.,
para el desarrollo de modelos ayudando a los creadores de decisin a formular alternativas, analizar sus
impactos, e interpretar y seleccionar opciones apropiadas para la implementacin."

Los sistemas de soporte a la decisin pueden considerarse como una tercera generacin de aplicaciones
asistidas por ordenador. Al principio, los ordenadores mainframe fueron usados mayormente para el
procesamiento de transacciones. Durante los aos 70 y 80, el concepto de DSS creci y se desarroll en los
campos de bsqueda, desarrollo y prctica.

Los Sistemas de Informacin de Gestin (MIS) suministraron:

Informes planificados para desarrollar bien las necesidades de informacin,


Informes de demandas para la informacin especfica solicitada, y
la habilidad para consultar en una base de datos, datos especficos.

Los MIS carecan de algunos de los atributos necesarios para soportar la creacin de decisin. Atributos tales
como, enfoque, metodologa de desarrollo, manejo de gestin de datos, uso de ayuda analtica, y dilogo entre el
usuario y el sistema. El DSS se extendi y combin la tecnologa de la base de datos y la tecnologa de modelado
dando a los usuarios finales acceso a ellos. Los datos y modelos se unieron ntimamente junto con el usuario.

7.1 ARQUITECTURA DEL DSS.

Veamos ahora como se plantea la arquitectura del DSS, estudiando los componentes de esa arquitectura.

Una manera til de pensar en las partes de los componentes de un DSS y las relaciones entre las partes est en
utilizar el dilogo, los datos, y el modelo (DDM). En esta conceptualizacin, hay un dilogo (D) entre el usuario y
el sistema, los datos (D) que soporta el sistema, y los modelos (M) que suministra el anlisis de las capacidades.
Estudiamos ahora con ms detalle cada una de estas partes.

7.1.1 EL COMPONENTE DE DIALOGO

Una apreciacin de la importancia del componente de dialogo se obtiene reconociendo que desde la perspectiva
del usuario, el dilogo es el sistema. Lo importante es lo que el usuario debe conocer para usar el sistema, las
opciones para dirigir las acciones del sistema, y las presentaciones alternativas de las respuestas del sistema.
Dentro del componente dialogo destacan:

La Base de Conocimiento. La base de conocimiento incluye lo que el usuario conoce acerca de la


decisin y acerca de cmo usar el DSS.
El Lenguaje de accin. Las acciones que el usuario realiza para controlar el DSS se describen de varias
formas, dependiendo del diseo del sistema.
El Lenguaje de Presentacin. El PC o la estacin de trabajo usada en una base autnoma, como una
unidad en la red de rea local, o como un terminal inteligente conectado a un mainframe tiene una
significativa expansin y mejora la salida desde que est presente un DSS. Una de las mayores
contribuciones del PC es su capacidad de presentacin de grficos.
Estilos de Dilogo. Las combinaciones o conjuntos de opciones para implantar la base de conocimiento,
el lenguaje de accin, y el lenguaje de presentacin, tomados a la vez, son llamados "estilo de dilogo".

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 15 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

7.1.2 EL COMPONENTE DE DATOS

Los datos juegan un papel importante en el DSS: se acceden directamente por el usuario o son una entrada para
el procesamiento de los modelos. El componente de datos es manejado en:

Las fuentes de datos. Mientras ha crecido la importancia del DSS, llega a ser cada vez ms crtico para el
DSS utilizar todas las fuentes de datos importantes dentro de la organizacin, y tambin desde fuentes
externas. Desde luego, el concepto de fuentes de datos debe expandirse para incluir documentos que
contienen conceptos, ideas, y opiniones que son muy importantes para crear la decisin.
Los Almacenes de Datos. Las bases de datos separadas para aplicaciones de apoyo a la decisin se
estn desarrollando mediante la creacin de almacenes de datos. Estas son bases de datos especiales
que estn diseadas para permitir a los creadores de decisin hacer sus propios anlisis. Tambin se
conocen a veces como bases de datos de informacin. En un tpico almacn de datos, los datos que se
necesitan primero se extraen del mainframe y de otras bases de datos. Con anterioridad a ponerlos en el
almacn de datos, los datos se procesan (es decir, "se limpian") para hacerlos ms tiles para el apoyo a
la decisin. Entonces los datos son mantenidos por un servidor de base de datos. Los administradores
hacen los anlisis de apoyo a la decisin, utilizando el comnmente conocido como procesamiento
analtico en lnea (OLAP).

7.1.3 EL COMPONENTE MODELO

El modelo suministra las capacidades de anlisis para un DSS. Hay muchos tipos diferentes de modelos y varias
formas en las que se pueden catalogar. Se pueden hacer distinciones importantes en base a su propsito,
tratamiento de aleatoriedad, y por su aplicacin o uso:

El propsito de un modelo puede ser o la optimizacin o la descripcin. El modelo de optimizacin es uno


que busca identificar puntos de maximizacin o minimizacin. Un modelo descriptivo describe el
comportamiento del sistema. Pero un modelo descriptivo slo describe el comportamiento del sistema; no
sugiere perfeccionar las condiciones.
Con respecto a la aleatoriedad, casi todos los sistemas son probabilsticos. Esto es, que el
comportamiento del sistema no se puede predecir con seguridad porque se presenta un grado de
aleatoriedad. Aunque la mayora de los sistemas son probabilsticos, la mayora de los modelos
matemticos son deterministas.
Segn para que se emplean existe una variedad de modelos, tales como:
Los modelos estratgicos los usan los directivos para ayudar a determinar los objetivos de la
organizacin, los recursos que se necesitan para cumplir sus objetivos, y las polticas que rigen la
adquisicin, el uso y la disposicin de estos recursos.
Los modelos tcticos comnmente son empleados para la gestin media para ayudar a atribuir y
controlar el uso de los recursos de la organizacin.
Los modelos operacionales normalmente son para soportar decisiones de trminos pequeos (es
decir diariamente, semanalmente) usualmente encontrados en niveles organizativos inferiores.

7.2 EL REA DE AYUDA A LA TOMA DE DECISIONES

Dentro de una organizacin el rea de ayuda a la toma de decisiones puede abarcar a su vez todas o algunas de
las reas que se muestran a continuacin:

El rea de procesamiento analtico en lnea (Online Analytical Processing, OLAP) trata de las
herramientas y las tcnicas para el anlisis de los datos que pueden dar respuestas casi instantneas a
las consultas que soliciten datos resumidos, aunque la base de datos sea extremadamente grande.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 16 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

El campo del anlisis estadstico, tambin se incluye en la ayuda a la toma de decisiones. Los lenguajes
de consulta de bases de datos no resultan adecuados para el rendimiento de los anlisis estadsticos
detallado de los datos. Se han creado una serie de paquetes que ayudan en el anlisis estadstico. A
estos paquetes se les han aadido interfaces con las bases de datos para permitir que se almacenen en
la base de datos grandes volmenes de datos y se recuperen de forma eficiente para su anlisis
Las tcnicas de bsqueda de informacin intentan descubrir de manera automtica las reglas y las pautas
estadsticas de los datos. El campo de la minera de datos combina las tcnicas de bsqueda de la
informacin creadas por los investigadores en inteligencia artificial y los expertos en anlisis estadsticos
con las tcnicas de implantacin eficiente que permiten utilizarlas en bases de datos muy grandes.
Las grandes empresas tienen varios orgenes de datos que necesitan utilizar para adoptar decisiones
empresariales. Para ejecutar de manera eficiente las consultas sobre datos tan diferentes, las empresas
han creado los almacenes de datos. Los almacenes de datos renen los datos de varios orgenes bajo un
esquema unificado en un solo sitio. Por tanto, ofrecen al usuario una sola interfaz uniforme para los datos.

7.3 VENTAJAS Y DESVENTAJAS DE USAR DSS.

7.3.1 VENTAJAS DE USAR UN DSS

Aumento en el nmero de alternativas examinadas.


Mejor entendimiento del sistema.
Respuesta rpida a situaciones inesperadas.
Capacidad para efectuar anlisis especfico.
Comunicacin mejorada.
Control y Ahorro de costes.
Mejores decisiones.
Ahorro de tiempo.
Mejor uso de elaboracin de recursos informticos.

7.3.2 DESVENTAJAS DE USAR UN DSS

Alto coste de adquisicin y mantenimiento.


Para pequeos volmenes de informacin no son rentables.
Alto grado de sofisticacin requerido; tiene alto grado de incertidumbre y potencial para el error.
El DSS no es un experto, slo comunica a los usuarios los resultados de suposiciones y modelos
correspondientes de sus constructores a problemas actuales.

8. ALMACENES DE DATOS (DATA WAREHOUSE)


Ya se ha comentado que tanto los Sistemas de Soporte a la Decisin (DSS), como los Sistemas de Informacin
de Gestin (MIS), presentan problemas para recuperar datos de las bases de datos operacionales. Para lograr la
integracin de estos tipos de sistemas se deber contar con un repositorio de datos preparado para tal fin. Este
repositorio se crear bajo las caractersticas de un Data Warehouse (DW). El DW, convertir entonces los datos
operacionales en una herramienta competitiva, por hacerlos disponibles a los usuarios que lo necesiten para el
anlisis y toma de decisiones. Una vez definido el DW se implementarn las aplicaciones de acceso a los datos,
estas aplicaciones estn determinadas por las caractersticas nombradas en los sistemas MIS y DSS.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 17 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

8.1 CONCEPTO DE ALMACN DE DATOS.

La tecnologa de los almacenes de datos Data warehouse, se encuadra dentro de la lnea de evolucin de las
bases de datos hacia una mayor funcionalidad e inteligencia. Las empresas actuales han visto aumentada su
capacidad de generar y recoger datos (introduccin de Internet en las empresas, tecnologas de entrada de
datos...). Estas grandes cantidades de datos (obtenidas a un coste relativamente bajo) no aportan, en principio,
informacin a las organizaciones. Ante esta situacin se puede llegar a la siguiente conclusin: Una organizacin
puede ser rica en datos y pobre en informacin, sino sabe como identificar, resumir y categorizar los datos.
(MADNICK, 1993).

Los encargados de adoptar las decisiones empresariales necesitan tener acceso a la informacin de todas las
fuentes que contienen datos relevantes de la empresa. La formulacin de consultas a cada una de las fuentes es
a la vez engorrosa e ineficiente. Adems, puede que los orgenes de datos solo almacenen los datos actuales,
mientras que es posible que los encargados de adoptar las decisiones empresariales necesiten tener acceso
tambin a datos anteriores. Los almacenes de datos proporcionan una solucin a estos problemas.

El almacn de datos pretende dar un soporte a la organizacin para proporcionarle una buena gestin de sus
datos, que le ayude en la toma de decisiones estratgicas y tcticas.

8.1.1 ANTECEDENTES DE LOS ALMACENES DE DATOS

A finales de los 80 aparece el DRI (Diccionario de recursos de informacin), cuyos antecedentes son:

Directorio de datos: Componente del SGBD encargado de describir donde y como se almacenan los
datos, y modo de acceder a los datos contenidos en la BD.
Diccionario de datos: Rene la informacin sobre los datos almacenados para que los usuarios
comprendan su significado.
Diccionario / Directorio de datos: Que ana las dos tareas anteriores.
Enciclopedia o Repositorio: Donde se almacenan los datos generados durante el ciclo de vida de un SI
(Sistema de Informacin): esquemas, informacin relativa a la gestin de proyectos, etc.
Diccionario de recursos de informacin: Engloba las capacidades y funciones de todos los almacenesde
datos anteriores. Pretende ser el corazn de toda arquitectura de informacin de la empresa, sirviendo de
soporte para la integracin de sistemas.

Los almacenes de datos recogen la herencia de los DRI con algunos matices derivados de la nueva tecnologa y
de la experiencia.

8.1.2 QUE ES UN DATA WAREHOUSE?

Vamos a dar varias definiciones, para entender mejor lo que es un almacn de datos:

Depsitos de informacin reunida de varios orgenes, almacenada bajo un esquema unificado en un solo
sitio. Una vez reunida, los datos se almacenan mucho tiempo, lo que permite el acceso a datos histricos.
As, los almacenes de datos proporcionan a los usuarios una sola interfaz consolidada con los datos, lo
que hace ms fciles de escribir las consultas de ayuda a la toma de decisiones.
Un Data Warehouse (DW a partir de ahora) es una nueva arquitectura informtica para dar soporte a la
obtencin de informacin relevante. Combina potentes herramientas de modelado multidimensional con
herramientas de acceso a BD, contribuyendo, no slo a mostrar los hechos (datos), sino a comprender
las causas de los hechos.
Un DW es la creacin de una vista lgica unificada de los datos, an cuando estos estn dispersos entre
varias bases de datos fsicas, para as disponer de un nico modelo de trabajo de los datos de la
organizacin.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 18 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Se puede considerar un DW como un repositorio lgico central (aunque los componentes fsicos pueden
estar distribuidos), que almacena los datos de la organizacin a diferentes niveles (desde el ms bajo del
dato puro hasta los niveles ms altos que contienen agregados o resmenes de los datos de niveles
inferiores), que solo contiene datos relevantes para la toma de decisiones y que est optimizado para
permitir el anlisis y la recuperacin de informacin corporativa.

8.1.3 CARACTERSTICAS

Esta coleccin de datos tiene las siguientes caractersticas (Inmon, 1996):

Orientado a las materias: Se centra en entidades de alto nivel (como por ejemplo cliente, producto,...) y
no en los procesos (como hacen los sistemas operacionales).
Integrado: La integracin implica que los datos del almacn son consistentes al elegir convenciones en
nombres, unidades de medida, representacin de campos comunes, etc. Se construye mediante la
integracin de fuentes de datos mltiples, y heterogneas: bases de datos relacionales, ficheros planos,
registros de transacciones on-line. Se aplican tcnicas de limpieza e integracin para asegurar la
consistencia en el nombrado, estructuras codificadas, medidas de los atributos, y dems aspectos entre
las mltiples bases de datos. Cuando los datos se mueven al DW, stos se tienen que transformar.
No voltil: Los datos no cambian una vez que se encuentran en el almacn. Las nicas operaciones que
permite un almacn de datos son la carga de nuevos datos y el acceso a los ya almacenados.
Sirve de soporte a consultas de ayuda la decisin.
Es dependiente del tiempo: Los datos estn asociados a un instante en el tiempo (semestre, ao). Por lo
tanto, los datos representan una imagen esttica del estado de la organizacin en cada momento. Es
decir, que si, por ejemplo, se accede a los datos de hace un mes se obtendrn los datos que describan
la organizacin en aquel momento, sin que se hayan modificado de ninguna manera.

8.1.4 OBJETIVOS

Despus de ver las caractersticas de un DW, podemos ahora comprender mejor cuales son sus objetivos:

Debe conseguir que la informacin sea fcilmente accesible para una organizacin y sus contenidos
comprensibles. Los datos deben ser intuitivos y obvios para el usuario y no slo para el desarrollador. Los
contenidos del DW deben estar etiquetados con nombres comprensibles. Las herramientas de acceso al
DW deben ser fciles de usar y ofrecer resultados en el mnimo tiempo posible.
Debe presentar a la organizacin informacin consistente y creble. La informacin debe ser
cuidadosamente agrupada segn los orgenes de datos sin inconsistencias o duplicidades.
Debe adaptarse a los cambios y al crecimiento. Las necesidades de usuario, las condiciones del negocio,
los datos y la tecnologa cambian inevitablemente a lo largo del tiempo. Estos cambios no deben en
ningn caso invalidar la informacin que haba hasta el momento en el DW.
Debe proteger la informacin relevante, sensible y confidencial de una organizacin. Los accesos al DW
deben mostrar slo la informacin relevante a aquellas personas que estn autorizadas para verla.
Debe ser la base para tomar decisiones dentro de las organizaciones. Es decir, la informacin necesaria
para tomar ciertas decisiones, operacionales, tcticas y estratgicas debe estar contenida en el DW.

8.2 COMPONENTES DE UN ALMACN DE DATOS.

La estructura bsica de un sistema de almacn de datos est compuesta por un modelo de datos corporativo, que
representa la vista conceptual de los datos de la organizacin, un procedimiento de limpieza e insercin de los
datos operativos en el almacn, por el propio almacn junto con unos metadatos que proporcionan informacin

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 19 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

sobre su contenido y, finalmente por unos procesos de extraccin de informacin que son las herramientas de
minera de datos y OLAP.

En la siguiente figura se muestran estos componentes y las relaciones entre ellos:

Modelo de
datos Usuarios
corporativo
BD
OLTP

Metadatos
Limpieza Extraccin
y carga Almacn de datos
de
datos
BD
OLTP

Vamos a presentar a continuacin cada uno de estos componentes, su funcionamiento y cmo encajan en el
proceso global de construccin y mantenimiento de un almacn de datos.

8.2.1 MODELO DE DATOS CORPORATIVO

Es probable que los orgenes de datos que se han creado de manera independiente tengan esquemas diferentes.
Parte de la labor de los almacenes de datos es llevar a cabo la integracin de los esquemas y convertir los datos
a un nico modelo de datos corporativo. Este modelo establece un nico esquema lgico de datos para toda la
organizacin, evitando la fragmentacin producida por la existencia de sistemas de informacin departamentales.

Uno de los fundamentos de un DW y paso previo obligatorio a emprender su construccin, es determinar un


modelo de datos corporativo que identifique y estructure los requisitos de informacin del almacn. Como
resultado se obtiene un esquema conceptual vlido para toda la organizacin, que ofrece una visin estratgica
global de los datos, permitiendo a la vez la creacin de vistas parciales con el grado de detalle adecuado a las
necesidades de cada departamento.

Esta estrategia top-down supone la construccin de un modelo de datos que comprenda todas las entidades y
objetos manejados por una organizacin, lo que es una tarea suficientemente compleja como para que esta sea
una de las principales causas de fracaso en la implantacin de DW. Para disminuir el impacto negativo de esta
tarea, se ha creado el concepto de Supermercado de Datos (Data Marts) que no son sino el resultado de aplicar
una estrategia bottom-up, esto es, comenzar construyendo almacenes de datos departamentales, con sus
correspondientes modelos de datos, antes de construir el almacn de datos corporativo.

La creacin del modelo de datos corporativo es, por lo tanto, la etapa del diseo del DW. Se trata de definir:

Qu informacin, relevante para los usuarios, se va a incluir en el DW.


Qu datos se precisan para obtener la informacin. La mayora vienen de las BD de produccin pero
otros pueden venir de fuentes externas.
Representacin de la informacin: nombres, formatos, unidades, etc. La descripcin detallada de la
informacin del DW est en el diccionario de datos, ste suele incluir:

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 20 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Identificacin de la fuente de datos.


Estructura, unidades, precisin, etc. de los datos.
Estructura, unidades, precisin, etc. de la informacin.
Estructura de la informacin que ven los usuarios finales.
Normas para encontrar, limpiar, transformar y agregar los datos para transformarlos en informacin.
Normas de seguridad aplicables a los datos y a la informacin.

8.2.2 LIMPIEZA Y CARGA DE DATOS OPERATIVOS

8.2.2.1 Identificacin de las fuentes de datos.

Esta operacin sirve para reconocer a qu sistemas (datos propios de la empresa, fuentes externas...) hay que
acceder para conseguir los datos que se van a introducir en el almacn. Esto permitir identificar los sistemas
OLTP afectados, el volumen de datos que se va a capturar, la frecuencia con la que se deber realizar la captura
y los departamentos o reas de la organizacin que se vern afectados por el proyecto de creacin del DW.

8.2.2.2 Limpieza de los datos operativos.

El proceso de limpieza de los datos importados, consiste en:


El descubrimiento y la correccin de inconsistencias, errores, repeticiones o cualquier otra anomala en
los datos que se van a introducir en el almacn.
Transformacin de los trminos operacionales en trminos de negocio uniformes, estndar y auto-
explicativos.
Definicin fsica de un atributo: usar tipos de datos y longitudes significativos.
Uso consistente de los valores de los atributos de las entidades: valores diferentes pero que signifiquen lo
mismo, se convierten a un nico valor.
Asuntos relacionados con valores por defecto y valores perdidos: si no se tiene claro es ms seguro dejar
estos valores en blanco.

8.2.2.3 Documentacin de los formatos.

Es necesario documentar los formatos de los datos que se van a transferir al almacn, para ello hay que tener en
cuenta: el significado de cada uno de ellos, el procedimiento que se ha seguido para su obtencin a partir de los
datos operativos originales y los procesos de sumarizacin o agregacin que se les ha aplicado.

Los datos que conforman esta informacin acerca del contenido del propio almacn reciben el nombre especial
de metadatos que dan lugar al Diccionario de datos. Forman lo que se podra considerar el manual tcnico del
almacn y son imprescindibles para realizar el mantenimiento del almacn e interpretar adecuadamente los
resultados de las consultas que se realicen sobre el mismo.

8.2.2.4 Transformacin y carga.

Este es el ltimo paso y consiste, lgicamente, en la transformacin y carga efectiva de los datos una vez
procesados y documentados. En este proceso se incluye la insercin en el almacn tanto de los datos operativos
procesados y limpiados, como de los metadatos que sirven para documentarlos.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 21 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Esta tarea debe realizarse peridicamente para mantener un grado de sincronizacin aceptable entre el contenido
del almacn y el de las bases de datos OLTP, ya que sino la informacin proporcionada por las herramientas de
extraccin de datos no sera lo suficientemente actual como para ser til.

Por otro lado, el proceso de carga suele ser largo y costoso, ya que hay que procesar una gran cantidad de
registros, lo que hace necesario buscar un equilibrio entre el deseo de mantener actualizado el DW y el coste que
supone en recursos mquina.

8.2.3 RESULTADO: ALMACN DE DATOS.

Tras realizar todas estas etapas, se obtiene como resultado un almacn que contiene unos datos tratados,
documentados y listos para ser utilizados como materia prima de las herramientas de extraccin de informacin.

8.2.4 EXTRACCIN Y RECUPERACIN DE LOS DATOS.

8.2.4.1 Acceso a los datos.

El DW debe ofrecer soluciones a los problemas de acceso a los datos. Algunos de estos problemas suelen ser:

Los datos estn en sistemas a los que el usuario no puede acceder.


El usuario no tiene herramientas para leer correctamente los datos y para ello se le ofrecen una serie de
herramientas de varios tipos: Visualizacin de datos, Anlisis estadstico y Generadores de informes.
Los datos podran estar siendo usados por aplicaciones que impiden su utilizacin por otras aplicaciones.

8.2.4.2 Recuperacin de los datos.

Un DW debe contener toda la informacin sobre el tema correspondiente y debe contar con mecanismos para
recuperarla. Existen tres conceptos fundamentales, que ayudan a llevar a cabo dicha recuperacin, son:

Base de datos. Una BD sobre un tema determinado es un conjunto de datos sobre dicho tema que
cumple los criterios de: Exhaustividad, Ausencia de redundancia y Estructura adecuada.
Diccionario de datos. Define los datos, se sabe cules existen, qu significa cada elemento de datos.
Adems determina el tema y los criterios que deben cumplirse para que los datos sean exhaustivos.
Complementacin relacional. Garantiza la recuperacin de cualquier subconjunto de la informacin,
basndose en cinco operadores: seleccin, proyeccin, interseccin, unin y diferencia.

8.2.4.3 Complejidad de las consultas.

Cuando se realizan consultas complejas a BD de produccin, estas deben ser hechas por especialistas que
saben cmo y dnde buscar esos datos. El DW elimina la intervencin de estos especialistas, eliminando los
posibles problemas de disponibilidad.

8.2.4.4 Anlisis multidimensional

Con el anlisis multidimensional se da respuesta a consultas complejas de los usuarios que reflejan los diversos
componentes de sus organizaciones. Estos componentes pueden ser de dos tipos: Cuantitativos o Cualitativos.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 22 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

A estos componentes tambin se les llama dimensiones, y a los valores de los componentes o dimensiones se les
llama atributos. Adems el detalle con el que se muestran los atributos puede variar, cada dimensin se puede
descomponer en diferentes niveles de detalle, estos dependen de las necesidades del usuario.

Las dimensiones definen dominios como geografa, producto, tiempo, cliente, etc. Los miembros de una
dimensin se agrupan de forma jerrquica (dimensin geogrfica: ciudad, provincia, autonoma, pas...).

El usuario puede navegar por los datos de diferentes maneras:

Perforacin (o drill-down): Consiste en variar el nivel de detalle de los datos, desde lo datos ms
resumidos a los ms detallados. Se dice que drill-down es desagregar y Roll-up es agregar.
Segmentacin (o slicing and dicing): Consiste en recortar un subconjunto de los datos movindose por
los distintos datos de una misma dimensin o cambiando de dimensin. Es decir, es la capacidad de ver
la base de datos desde diferentes puntos de vistas. El corte suele hacerse a lo largo del eje del tiempo
para analizar tendencias. Se dice que slicing es proyeccin y que dicing es seleccin.

8.3 ESTRUCTURA LGICA DEL ALMACN: DATOS Y METADATOS.

La estructura lgica de un almacn se encuentra dividida en cuatro niveles ms uno adicional de metadatos:

METADATOS

DATOS DETALLADOS ACTUALES

DATOS DETALLADOS HISTRICOS

DATOS LIGERAMENTE RESUMIDOS

DATOS MUY RESUMIDOS

Veamos a continuacin cada uno de estos niveles.

8.3.1 METADATOS

Este nivel no es el superior jerrquico de los otros cuatro, sino que se encuentra completamente aparte del resto.
Esto se debe a que no est compuesto por datos extrados a partir de sistemas OLTP, sino por la descripcin del
tratamiento a que se han sometido dichos datos originales.

Los metadatos describen la estructura de los datos contenidos en el almacn, de donde proceden y que
tratamiento sufrieron. Tambin detallan los algoritmos utilizados para crear los resmenes de los dos niveles
superiores de la estructura del almacn (datos ligeramente resumidos y datos muy resumidos). Esta informacin,
ser de utilidad para las herramientas de extraccin de informacin, que la usarn para determinar estrategias de
navegacin y recuperacin.

8.3.2 DATOS DETALLADOS ACTUALES

Son los datos obtenidos directamente al limpiar y homogeneizar los datos provenientes de sistemas OLTP.
Constituyen el nivel ms bajo de detalle, representan el estado de la organizacin en el momento presente y,
debido a que estn sin resumir, constituyen una gran porcin del volumen total de los datos almacenados.

Estos datos son de acceso frecuente, ya que son los ms actualizados, por tanto, es conveniente que se
almacenen en dispositivos de acceso rpido como discos.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 23 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

8.3.3 DATOS DETALLADOS HISTRICOS

Son los datos detallados correspondientes a momentos anteriores al presente, por lo que el nivel de detalle es el
mismo que el de los datos actuales. Al no ser datos a los que se deba acceder con frecuencia, se almacenan en
cintas o cualquier otro dispositivo de almacenamiento masivo.

8.3.4 DATOS LIGERAMENTE RESUMIDOS

Es el primer nivel de agregacin de los datos detallados actuales. Corresponden a consultas o informes de uso
habitual, por lo que al tenerlos preparados de antemano se consigue acelerar considerablemente el rendimiento
global del almacn. Es importante identificar sobre que variables se van a realizar estos resmenes as como su
frecuencia de actualizacin.

8.3.5 DATOS MUY RESUMIDOS

Representan el nivel ms elevado de agregacin, tanto de los datos ligeramente resumidos como de los de
detalle. Corresponden a consultas o informes que se solicitan muy a menudo y que deben obtenerse con gran
rapidez. Dado el alto grado de accesibilidad que deben tener estos datos muy resumidos es normal encontrarlos
fuera del almacn de datos corporativo, formando parte de los almacenes de datos departamentales o Data Mart.

8.4 ESTRUCTURA FSICA DEL ALMACN: ARQUITECTURA.

La estructura fsica del almacn puede presentar cualquiera de las siguientes arquitecturas:

8.4.1 ARQUITECTURA CENTRALIZADA

Consiste en utilizar un nico servidor para guardar todo el almacn de datos.


La ventaja de esta configuracin reside en que maximiza la potencia de clculo disponible para trabajar sobre el
almacn y facilita el mantenimiento del mismo.

La desventaja estriba en que la realizacin de consultas que consumen muchos recursos puede afectar
seriamente al resto de usuarios que slo necesiten acceder a datos de alto nivel (resumidos o muy resumidos).
Adems, un fallo en este servidor puede resultar catastrfico para la organizacin, por lo que la seguridad del
mismo cobra una especial relevancia.

8.4.2 ARQUITECTURA DISTRIBUIDA

Esta segunda opcin se basa en la existencia de varios servidores entre los que se reparten los datos del
almacn. Dado que una de las caractersticas del almacn es que est organizado en torno a temas, resulta
lgico que la distribucin fsica de los datos refleje esta propiedad, asignando as cada servidor a uno o varios
temas lgicos.

La ventaja de esta arquitectura es una mayor distribucin de la carga de proceso a cambio de una mayor
complejidad en el mantenimiento de la estructura del almacn. Tambin sigue presentando el problema de la no-
discriminacin de los datos de ms alto nivel de los de menor nivel, por lo que una operacin que requiera
muchos recursos maquina seguir bloqueando el acceso al resto de usuarios.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 24 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

8.4.3 ARQUITECTURA DISTRIBUIDA POR NIVELES

Esta arquitectura refleja la estructura lgica del almacn, ya que asigna los servidores en funcin del nivel de
agregacin de los datos que contienen. De esta manera se tendr un servidor para los datos de detalle, otro para
los resumidos y otro para los muy resumidos.

Un caso particular se presenta cuando los datos muy resumidos nos estn en un nico servidor, sino que se
duplican en varios para agilizar el acceso a los mismos. En este caso los servidores que los mantienen son Data
Marts. La ventaja de esta arquitectura es que permite un acceso rpido a los datos que se utilizan con ms
frecuencia, sin que sea penalizado por las consultas que se realicen sobre datos de detalle.

8.5 COMPARACIN DE DW Y BD.

En la tabla siguiente, se observan las diferencias entre un sistema de Base de Datos (BD) tradicional y un DW:

BD DW
Contenido Datos aptos para la Informacin para la
produccin. toma de decisiones.
Modelo de datos Jerrquico, CODASYL, Relacional,
relacional o incluso multidimensional
secuencial de ndice.
Utilizacin Produccin de OLTP, por Toma de decisiones.
lotes.
Acceso Lectura y escritura con Lectura con frecuencia
frecuencia aleatoria. secuencial.
N operaciones/ Numerosas Pocas consultas y cada
N de elementos transacciones, y cada una una puede afectar a
afectados afecta a pocos registros. muchos registros.
Volumen de (transacciones) (consultas) puede ser
salida de normalmente pequeo. muy grande.
operaciones
Tiempo Provoca prdidas Demora en las
improductivo empresariales. decisiones.

8.6 ELEMENTOS BSICOS DE UN DW.

8.6.1 SISTEMA ORIGEN

Es un sistema operacional cuya funcin es capturar las transacciones del negocio. A menudo se le llama legacy
system. Las principales caractersticas de este sistema son la disponibilidad y la actualidad de su informacin.

Asumiremos que el sistema origen mantiene poca informacin histrica y que se realizar un cierto tipo de
reporting directamente sobre el sistema fuente que no tiene porque estar recogido en el propio Data Warehouse.

Los sistemas fuentes son normalmente independientes entre si, por lo que seguramente en ellos no se habr
invertido para conformar dimensiones bsicas como los productos, los clientes, la geografa o el tiempo.

Los sistemas origen tienen claves que identifican ciertos objetos del anlisis de manera nica, como por ejemplo
la clave de producto o la clave de cliente. A las claves de estos sistemas fuente se les denomina claves de
produccin, pero no las usaremos directamente en el Data Warehouse como claves, trataremos estas claves
como atributos de las dimensiones que se creen.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 25 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

8.6.2 DATA STAGING REA

Es un rea de almacenamiento y un conjunto de procesos que limpian, transforman, combinan, unifican,


almacenan, archivan y preparan la fuente de datos para su uso en el Data Warehouse. Esta compuesta por un
sistema de ficheros planos.

Consiste en todo aquello que hay entre el origen de datos y el servidor de presentacin. Aunque sera ideal que
incluso consistiera en una nica maquina la realidad es que est distribuida por un conjunto de mquinas.

Esta rea est dominada por las actividades de ordenacin y procesamiento secuencial y en algunos casos ni
siquiera tiene que estar basada en tecnologa relacional. Una restriccin de esta rea es que no se utilizar en
ningn caso para hacer consultas directamente sobre ella o para generar informes a partir de ella misma.

8.6.3 SERVIDOR DE PRESENTACIN (PRESENTATION SERVER)

Es la mquina fsica destino donde el Data Warehouse es organizado y almacenado para ser directamente
consultado por los usuarios finales y otras aplicaciones.

En este sistema los datos se presentarn y almacenarn en un marco multidimensional. Si el servidor est
basado en una base de datos relacional, entonces las tablas estarn organizadas como esquemas en estrella. Si
el servidor de presentacin est basado en una tecnologa de procesamiento analtico on-line no relacional
(tecnologa OLAP), los datos tendrs dimensiones reconocidas como tal.

9. CONCLUSIN
Antes de entrar en profundidad a definir todo lo que rodea al concepto de Base de Datos, hemos visto la
evolucin que han sufrido los Sistemas de Informacin, cuando se pas de los sistemas de ficheros tradicionales
a los sistemas de Bases de Datos. De esta forma podemos comprender con ms claridad la importancia que para
las organizaciones ha tenido el nacimiento de las Bases de Datos.

Despus de definir el concepto de BD hemos estudiado dos puntos clave para entender el alcance de una BD: la
independencia de los datos y los niveles de abstraccin. Tambin revisamos cada uno de sus componentes:
datos, metadatos, el sistema gestor de base de datos, los usuarios de la BD, los elementos de seguridad y los
lenguajes de BD.

Entramos a continuacin en el papel y utilizacin que tienen las bases de datos en las organizaciones,
profundizando en los tres sistemas que actualmente estn soportados en BD dentro de las mismas. Son:

Sistemas transaccionales. OLTP (On-Line Transaction Processing)


Los SIG (Sistemas de Informacin de Gestin) o MIS (Management Information Systems)
Los STD (Sistema de Apoyo a la Toma de Decisiones) o DSS (Decision Support Systems)

Terminamos con una de las reas ms importantes dentro del Apoyo a la toma de decisiones. Son los almacenes
de datos o Data Warehouse. Para comprender todo lo que supone un DW, hemos revisado sus antecedentes, sus
caractersticas y objetivos principales. Posteriormente estudiamos sus componentes: modelo de datos
corporativo, limpieza y carga de datos operativos, el almacn propiamente dicho y la extraccin y recuperacin de
los datos. A continuacin su estructura lgica (datos y metadatos) y su estructura fsica con tres posibles
arquitecturas: centralizada, distribuida y distribuida por niveles. Y finalmente los elementos bsicos de un DW:
sistema origen, data staging rea y el servidor de presentacin.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 26 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

10. BIBLIOGRAFA
Silberschatz, Abraham, Korth, Henry, Sudarshan, S.: Fundamentos de Bases de Datos
Inmon, W.H.: Building the Data Warehouse.
De Miguel y Piattini: Fundamentos y modelos de Bases de datos. RA-MA
Fernndez Medina,E., Piattini,M., Serrano,M.A., (2001). Seguridad en Bases de Datos. Fundacin Dintel.
Mensasalvas Ruiz,E. DataWarehouse. Universidad Politcnica de Madrid.
COHEN K. Daniel "Sistemas de Informacin Para la Toma de Decisiones". Ed. Mc Graw Hill, 1996.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 27 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

11. ESQUEMA RESUMEN


Una Base de Datos (BD) es una coleccin o depsito de datos integrados, almacenados en soporte secundario
(no voltil) y con redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios y
aplicaciones, deben mantenerse independientes de ellos y su definicin (estructura de la BD), nica y
almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha de permitir captar las
interrelaciones y restricciones existentes en el mundo real. Los procedimientos de actualizacin y recuperacin,
comunes y bien determinados, facilitarn la seguridad del conjunto de los datos, De Miguel et. al. (1999).

En los sistemas de base de datos se plantean dos objetivos principales:

Independencia de la base de datos de los programas para su utilizacin.


Proporcionar a los usuarios una visin abstracta de los datos. El sistema esconde los detalles de
almacenamiento fsico (como se almacenan y se mantienen los datos), pero estos deben extraerse
eficientemente. Niveles de abstraccin: externo, conceptual e interno.

Principales componentes de un entorno de base de datos:

Datos: una base de datos no tiene sentido sino est compuesta por datos. Hay que definir la forma en
que estos datos se deben disponer, qu datos se deben almacenar y cmo los debe entender la mquina.
Metadatos: la informacin que el sistema guarda sobre los datos almacenados, es lo que se llaman
metadatos, es decir, datos acerca de los datos. Es ms, estos metadatos se almacenan como otra base
de datos propiamente dicha, y puede ser gestionada y consultada como tal. Estos metadatos suelen
conformar lo que se da en llamar diccionario de datos o Catalogo.
El sistema gestor de base de datos: se puede definir como un conjunto coordinado de programas,
procedimientos, lenguajes, etc. que suministra, tanto a los usuarios finales como a los analistas,
programadores o el administrador, los medios necesarios para describir, recuperar y manipular los datos
almacenados en la base, manteniendo su integridad, confidencialidad y seguridad.
Usuarios de la base de datos: usuarios normales, programadores de aplicaciones, usuarios sofisticados
y especializados y finalmente los administradores de bases de datos.
Elementos de seguridad: se deben tener varios niveles de acceso, clasificados por: acceso a las filas, a
las operaciones sobre las filas y al diccionario de datos.
Lenguajes de bases de datos: Lenguaje de Definicin de Datos (LDD) y Lenguaje de manipulacin de
Datos (LMD)

En cuanto a la utilizacin de las bases de datos en las organizaciones, hablamos de 3 diferentes tipos de
automatizacin de los sistemas de informacin:

Los PED (Procesamiento Electrnico de Datos) o DP (Data Processing) que se caracterizan por tener el
foco de atencin en el nivel operativo de almacenamiento, procesamiento y flujo de los datos, as como
procesar eficientemente las transacciones y realizar informes resmenes para los dirigentes.
Los SIG (Sistemas de Informacin de Gestin) o MIS (Management Information Systems) que se
caracterizan porque su foco de atencin est en la informacin orientada a mandos intermedios, por la
integracin de las tareas de PED, por sus funciones en los negocios y por la generacin de informes.
Los STD (Sistema de Apoyo a la Toma de Decisiones) o DSS (Decision Support Systems) que estn ms
centrados en la decisin y orientados hacia altos ejecutivos.

En los sistemas transaccionales basados en BD, una transaccin es una secuencia de operaciones llevadas a
cabo como una unidad lgica de trabajo simple. Para asegurar la integridad de los datos se necesita que el
sistema de base de datos mantenga las siguientes propiedades de las transacciones: Atomicidad, Consistencia,
Aislamiento y Durabilidad. Son conocidas como propiedades ACID.

Dos definiciones de un Sistema de Informacin de Gestin:

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 28 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

Un Sistema de Informacin de Gestin (MIS) puede definirse como un conjunto de medios para reunir los
datos necesarios para la gestin y difundir la informacin obtenida con el tratamiento de estos datos.
Definimos Sistema de Informacin de Gestin como el proceso por el cual los datos que son importantes
para la empresa son identificados, analizados, recolectados y puestos a disposicin de la empresa.

Se pueden definir los Sistemas de Soporte a la Decisin (DSS) como programas informticos interactivos que
utilizan mtodos analticos, tales como anlisis de decisin, algoritmos de optimizacin, programas de
planificacin de rutinas, etc., para el desarrollo de modelos ayudando a los creadores de decisin a formular
alternativas, analizar sus impactos, e interpretar y seleccionar opciones apropiadas para la implementacin.

Una manera til de pensar en las partes de los componentes de un DSS y las relaciones entre las partes est en
utilizar el dilogo, los datos, y el modelo (DDM). En esta conceptualizacin, hay un dilogo (D) entre el usuario y
el sistema, los datos (D) que soporta el sistema, y los modelos (M) que suministra el anlisis de las capacidades.

Los DSS abarcan diversos campos como: procesamiento analtico en lnea (Online Analytical Processing, OLAP),
anlisis estadstico, minera de datos y almacenes de datos.

Se define un DW como un repositorio lgico central (aunque los componentes fsicos pueden estar distribuidos),
que almacena los datos de la organizacin a diferentes niveles (desde el ms bajo del dato puro hasta los niveles
ms altos que contienen agregados o resmenes de los datos de niveles inferiores), que solo contiene datos
relevantes para la toma de decisiones y que est optimizado para permitir el anlisis y la recuperacin de
informacin corporativa.

Los almacenes de datos presentan las siguientes caractersticas: es orientado a materias, integrado, no voltil,
sirve de soporte a consultas de ayuda a la decisin y es dependiente del tiempo. Adems el DW busca los
objetivos siguientes:

Debe conseguir que la informacin sea fcilmente accesible para una organizacin.
Debe presentar a la organizacin informacin consistente y creble.
Debe adaptarse a los cambios y al crecimiento.
Debe proteger la informacin relevante, sensible y confidencial de una organizacin.
Debe ser la base para tomar decisiones dentro de las organizaciones.

Componentes que forman parte de un DW:

Modelo de datos corporativo: La creacin del modelo de datos corporativo es la etapa del diseo del
DW, que identifica y estructura los requisitos de informacin que va a tener que satisfacer el almacn.
Limpieza y carga de datos operativos: Este proceso est compuesto de las siguientes etapas:
Identificacin de las fuentes de datos.
Limpieza de los datos operativos.
Documentacin de los formatos.
Transformacin y carga.
El almacn de datos: se obtiene como resultado un almacn que contiene unos datos tratados,
documentados y listos para ser utilizados como materia prima de las herramientas de extraccin de
informacin.
Extraccin y recuperacin de los datos: En este proceso hay que tener presente los puntos siguientes:
Acceso y Recuperacin de los datos.
Complejidad de las consultas.
Anlisis multidimensional

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 29 de 30
www.haztefuncionario.com Material registrado. Prohibida su reproduccin.

Copia exclusiva de Jos Ignacio Mndez Yanes. Av de los Poblados 133, 7 - 3 - 28025 - Madrid - Tel. 917464968

La estructura lgica de un almacn se encuentra dividida en cuatro niveles ms uno adicional de metadatos que
est por encima de ellos. Los cuatro niveles son:

Datos detallados actuales


Datos detallados histricos
Datos ligeramente resumidos
Datos muy resumidos

La estructura fsica del almacn puede presentar cualquiera de las siguientes arquitecturas:

Arquitectura centralizada: Consiste en utilizar un nico servidor para guardar todo el almacn de datos.
Arquitectura distribuida: Esta segunda opcin se basa en la existencia de varios servidores entre los
que se reparten los datos del almacn. Dado que una de las caractersticas del almacn es que est
organizado en torno a temas, resulta lgico que la distribucin fsica de los datos refleje esta propiedad,
asignando as cada servidor a uno o varios temas lgicos.
Arquitectura distribuida por niveles: Esta arquitectura refleja la estructura lgica del almacn, ya que
asigna los servidores en funcin del nivel de agregacin de los datos que contienen. De esta manera se
tendr un servidor para los datos de detalle, otro para los resumidos y otro para los muy resumidos.

TEMARIO-TICB-feb04 B1G1T04
Actualizado en febrero de 2004 Pgina 30 de 30

You might also like