You are on page 1of 24

SistemasdeInformacinGerencial

AdministracindelaEmpresaDigital
KennethC.LaudonyJaneP.LaudonXEdicin
6.1ORGANIZACINDEDATOSENUNENTORNOTRADICIONALDEARCHIVO
Unsistemaefectivodeinformacindaalosusuariosinformacinexacta,oportunayrelevante.Lainformacin
exactaestlibre deerrores. Lainformacin es oportuna cuando est disponible en elmomento quela requierenlos
encargadosdelatomadedecisiones.Lainformacinesrelevantecuandoestilyadecuadaparalostiposdetrabajoy
decisionesquelanecesitan.
Se sorprendera de saber que muchas empresas no cuentan con informacin oportuna, exacta o relevante
porquelosdatosdesussistemasdeinformacinestnmalorganizadosyconunmantenimientodeficiente.Aestose
debe que la administracin de datos sea tan importante. Para entender el problema veamos la manera en que los
sistemasdeinformacinorganizanlosdatosenarchivosdecomputadoraylosmtodostradicionalesdeadministracin
dearchivos.

CONCEPTOSDEORGANIZACINDEARCHIVOS
Unsistemadecmputoorganizalosdatosenunajerarquaqueempiezaconbitsybytesyavanzaacampos,
registros,archivosybasesdedatos(vealafigura61).Unbitrepresentalaunidadmspequeadedatosquepuede
manejarunacomputadora.Ungrupodebits,llamadounbyte,representauncarcter,elcualpuedeserunaletra,un
nmero u otro smbolo. Una agrupacin de caracteres en una palabra, un grupo de palabras o un nmero completo
(comoelnombreolaedaddeunapersona)sellamacampo.Ungrupodecamposrelacionados,comoelnombredeun
estudiante,elcursoquetoma,lafechayelgrado,conformaunregistro;ungrupoderegistrosdelmismotiposellama
archivo.
Porejemplo,losregistrosdelafigura61podranconstituirelarchivodeuncursodeunestudiante.Ungrupode
archivos relacionados forma una base de datos. El archivo de curso del estudiante que se ilustra en la figura 61 se
podraagruparconarchivossobrelosantecedentespersonalesyfinancierosdelosestudiantesparacrearunabasede
datosdeestudiantes.
Unregistrodescribeunaentidad.Unaentidadesunapersona,lugar,cosaoeventosobreelcualsealmacenay
conserva informacin. Cada caracterstica o cualidad que describe a una entidad en particular se llama atributo. Por
ejemplo,ID_Estudiante,Curso,FechayGrado sonatributosdelaentidadCURSO.Losvaloresespecficosque pueden
tenerestosatributosseencuentranenloscamposdelregistroquedescribenlaentidadCURSO.

Pgina1

Unsistemadecmputoorganizalosdatosenunajerarquaqueempiezaconelbit,elcualrepresentayaseaun0oun1.
Losbitssepuedenagruparparaformarunbytepararepresentaruncarcter,nmeroosmbolo.Losbytessepueden
agrupar para formar un campo y los campos relacionados se pueden agrupar para formar un registro. Los registros
relacionadossepuedenconjuntarparaformarunarchivoylosarchivosrelacionadossepuedenorganizarenunabasede
datos.

Pgina2

PROBLEMASCONELENTORNOTRADICIONALDEARCHIVOS
En lamayoradelasorganizaciones,los archivosdedatosylossistemasmarcabanunatendenciaacrecerde
maneraindependientesinajustarseaunplananiveldetodalaempresa.Contabilidad,finanzas,manufactura,recursos
humanosyventasymarketing,desarrollabansuspropiossistemasyarchivosdedatos.Lafigura62ilustraelenfoque
tradicionaldelprocesamientodelainformacin.
Desdeluego,paraoperar,cadaaplicacinrequerasuspropiosarchivosysupropioprogramadecmputo.Por
ejemplo, el departamento de recursos humanos poda contar con un archivo maestro de personal, un archivo de
nmina, un archivo de seguros mdicos, .un archivo de pensiones, un archivo de listas de correo y as hasta que se
creabandecenas,talvezcientos,dearchivosyprogramas.Eldepartamentodefinanzastambinpodacontarconun
archivodenmina,unarchivodepensionesyunalistamaestradeempleadosparaoperarlanmina.Alconsiderarala
compaaen su conjunto,este proceso conduca amltiples archivos maestros creados, conservados y operados por
divisionesodepartamentosseparados.Alcabode5o10aos,laorganizacinseencuentraconunacargadecientosde
programas y aplicaciones muy difciles de mantener y manejar. Los problemas resultantes son redundancia e
inconsistenciadedatos,dependenciaentrelosprogramasylosdatos,inflexibilidad,unaescasaseguridaddedatosyla
incapacidaddecompartirdatosentreaplicaciones.

Elusodeunmtodotradicionalparaprocesararchivosalientaacadareafuncionaldeunacorporacinadesarrollar
aplicacionesespecializadasyarchivos.Cadaaplicacinrequiereunarchivodedatosnicoqueprobablementeserun
subconjunto delarchivomaestro.Estossubconjuntosdelarchivomaestroconducenaredundanciaeinconsistenciade
datos,inflexibilidadenelprocesamientoyrecursosdealmacenamientodesperdiciados.

Pgina3

Redundanciaeinconsistenciadedatos
Laredundanciadedatoseslapresenciadedatosduplicadosenmltiplesarchivosdedatos,detalmaneraque
losmismosdatosestnalmacenadosenmsdeunlugar.Laredundanciadedatosocurrecuandodiferentesgruposde
unaorganizacincapturandemaneraindependientelamismapiezadeinformacinylaalmacenantambindemanera
independiente de los dems grupos. La redundancia de datos desperdicia recursos de almacenamiento y tambin
conducealainconsistenciadedatos,enlacualelmismoatributopodratenervaloresdiferentes.Porejemplo,enlas
instanciasdelaentidadCURSOqueseilustraenlafigura61,laFechapodraactualizarseenalgunossistemasperono
enlosdems.ElatributoID_Estudiantepodratenerdiferentesnombresenlosdiferentessistemasdelaorganizacin.
Porejemplo,algunossistemaspodranutilizarID_Estudianteyotros,sloID.
Al utilizar diferentes sistemas de codificacin para representar los valores de un atributo se podra generar
confusinadicional.Porejemplo,lossistemasdeventas,inventarioymanufacturadeundetallistaderopapodranusar
cdigosdiferentespararepresentareltamaodeunaprenda.Unsistemapodrarepresentareltamaodelaprenda
como "extra grande", en tanto que otro utilizara el cdigo "XL" con el mismo propsito. La confusin resultante
dificultaraquelascompaascrearansistemasdeadministracindelasrelacionesconelcliente,deadministracinde
lacadenadesuministrooempresariales,queintegraranlosdatosdesdefuentesdiferentes.

Dependenciaentrelosprogramasylosdatos
Ladependenciaentrelosprogramasylosdatosserefierealaestrecharelacinentrelosdatosalmacenadosen
archivosylosprogramasespecficosqueserequierenparaactualizarymanteneresosarchivos,detalmaneraquelos
cambiosenlosprogramasrequierencambiosalosdatos.Todoprogramatradicionaldecmputotienequedescribirla
ubicacin y naturaleza de los datos con que trabaja. En un entorno tradicional de archivos, cualquier cambio en un
programadesoftwarepodrarequeriruncambioenlosdatosaqueaccedeeseprograma.Porejemplo,unprogramase
podramodificarparaaceptaruncdigopostaldenuevedgitosenlugardecincodgitos.Siloscdigospostalesdecinco
dgitossecambiaronanuevedgitosenelarchivooriginaldedatos,entoncesotrosprogramasquerequierenelcdigo
postaldecincodgitosnofuncionaranadecuadamente.Implementartalescambiosdemaneraapropiadapodracostar
millonesdedlares.

Carenciadeflexibilidad
Unsistematradicionaldearchivospuedeenviarinformesprogramadosderutinadespusdeextensosesfuerzos
de programacin, pero no puede transmitir informes con fines especficos o responder de manera oportuna a
requerimientosimprevistos deinformacin. La informacin requerida porlas solicitudes con fines especficosesten
algn lugar del sistema pero podra ser demasiado costoso recuperarla. Varios programadores tendran que trabajar
durantesemanasparareunirenunnuevoarchivoloselementosdedatosrequeridos.

Seguridadescasa
Dadoquehaypococontroloadministracindedatos,elaccesoyladifusindelainformacinpodransalirsede
control. Es posible que la administracin no tenga forma de saber quin est teniendo acceso a los datos de la
organizacin,oinclusomodificndolos.

Carenciadecomparticinydisponibilidaddelosdatos
Debidoaquelainformacinestfragmentadaendiferentesarchivosyendistintaspartesdelaorganizacinno
se pueden relacionar entre s, es prcticamente imposible que la informacin se comparta o se acceda de manera

Pgina4

oportuna.Lainformacinnopuedefluirlibrementeatravsdelasdiferentesreasfuncionalesodistintaspartesdela
organizacin.Silosusuariosencuentrandiferentesvaloresdelamismapiezadeinformacinendossistemasdistintos,
talveznodeseenutilizarestossistemasporquenopuedenconfiarenlaexactituddesusdatos.

6.2ENFOQUEDELASBASESDEDATOSPARALAADMINISTRACINDEDATOS
Latecnologadebasesdedatospuedereducirmuchosdelosproblemasqueoriginalaorganizacintradicional
de archivos. Una definicin ms rigurosa de una base de datos es un conjunto de datos organizados para servir
eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia. En vez de que los datos se
almacenen en archivos separados para cada aplicacin, se guardan fsicamente para que se presenten a los usuarios
como si estuvieran almacenados en un solo lugar. Una sola base de datos da servicio a mltiples aplicaciones. Por
ejemplo,envezdequeunacorporacinalmacenelosdatosdesusempleadosensistemasdeinformacinseparadosy
endiferentesarchivos parapersonal,nminayprestaciones,podracrearunasola basededatoscomnderecursos
humanos.

SISTEMASDEADMINISTRACINDEBASESDEDATOS
Un sistema de administracin de bases de datos (DBMS) es el software que permite a una organizacin
centralizarlosdatos,administrarloseficientementeyproporcionar,mediantelosprogramasdeaplicacin,elaccesoa
losdatosalmacenados. ElDBMSactacomo unainterfaz entrelosprogramasdeaplicacin3ylosarchivosde datos
fsicos.Cuandoelprogramadeaplicacinsolicitaunelementodedatos,comoelsueldobruto,elDBMSencuentraeste
elementoenlabasededatosylopresentaalprogramadeaplicacin.Siutilizaralosarchivosdedatostradicionales,el
programador tendra que especificar el tamao y el formato de cada elemento de datos utilizado en el programa e
indicarlacomputadoraenqueselocalizaran.
Alsepararlasvistaslgicayfsicadelosdatos,elDBMSliberaalprogramadoroalusuariofinaldelatareade
comprender dnde y cmo se almacenan realmente los datos. La vista lgica presenta los datos como los deberan
percibir los usuarios finales o los especialistas de la empresa, en tanto que la vista fsica muestra cmo estn
organizadosyestructuradosrealmentelosdatosenunmediodealmacenamientofsico.
Elsoftwaredeadministracindebasesdedatoshacedisponibleslasdiferentesvistaslgicasdelabasededatos
fsicarequeridasporlosusuarios.Porejemplo,paralabasededatosderecursoshumanosilustradaenlafigura63,un
especialistaenprestacionespodrarequerirunavistaconsistentedelnombre,nmerodelsegurosocialycoberturadel
seguro mdico del empleado. Un miembro del departamento de nmina podra necesitar datos como el nombre,
nmerodelsegurosocial,sueldobrutoysueldonetodelempleado.Losdatosparatodasestasvistassealmacenanen
unasolabasededatos,dondelaorganizacinlospuedemanejardeunamaneramssencilla.

CmoresuelveunDBMSlosproblemasdelentornodearchivostradicional
UnDBMSreducelaredundanciaylainconsistenciadedatosalminimizarlacantidaddearchivosaisladosenlos
cualesserepitenlosmismosdatos.QuizelDBMSnopermitaalaorganizacineliminarporcompletolaredundanciade
datos,pero puede ayudarleacontrolarla.Auncuandolaorganizacinconservealgunosdatosredundantes,unDBMS
eliminalainconsistenciadelosdatosporquepuedeayudaralaorganizacinaasegurarsedequetodaslasocurrencias
delosdatosredundantestenganlosmismosvalores.ElDBMSeliminaladependenciaentrelosprogramasylosdatos,
permitiendoaestosltimosserautosuficientes.Elaccesoyladisponibilidaddelainformacinseincrementarnylos
costosdeldesarrolloyelmantenimientodelosprogramassereducirnporquelosusuariosylosprogramadorespueden

Pgina5

realizarconsultasconfinesespecficosdelainformacinquecontienelabasededatos.ElDMBSdaalaorganizacinla
posibilidaddecentralizarlaadministracindedatos,suusoyseguridad.

Unasolabasededatosderecursoshumanosproporcionamuchasvistasdedatosdiferentes,segnlosrequerimientosde
informacin del usuario. Aqu se ilustran dos posibles vistas, una para un especialista en prestaciones y una para un
miembrodeldepartamentodenminadelaempresa.

DBMSrelacional
LosDBMScontemporneosutilizandiferentesmodelosdebasesdedatosparadarseguimientoalasentidades,
atributosyrelaciones.Actualmente,eltipomspopulardeDBMSparaPCs,ascomoparacomputadorasmsgrandesy
mainframes,eselDBMSrelacional.Lasbasesdedatosrelacinalesrepresentanlosdatoscomotablasbidimensionales
(llamadasrelaciones).Lastablaspodranconsiderarsecomoarchivos.Cadatablacontienedatosacercadeunaentidady
susatributos.MicrosoftAccessesunDBMSrelacionalparasistemasdeescritorio,entantoqueDB2,OracleDatabasey
MicrosoftSQLServersonDBMSrelacinalesparamainframesycomputadorasderangomedio.MySQLesunpopular
DBMSdecdigoabierto,yOracleDatabaseLiteesunDBMSparapequeosdispositivosdecmputoporttiles.
Veamoscmo una base de datos relacional organiza los datos de proveedores y partes (veala figura 64). La
basededatostieneunatablaindependienteparalaentidadPROVEEDORyotraparalaentidadPARTE.Ambastablas
constan de una cuadrcula de columnas y filas de datos. Los elementos de datos individuales para cada entidad se
almacenancomocamposindependientes,ycadacamporepresentaunatributoparaesaentidad.Loscamposdeuna
base de datos relacional tambin se denominan columnas. Para la entidad PROVEEDOR, el nmero, nombre, calle,
ciudad,estadoycdigopostaldelproveedorsealmacenancomocamposseparadosdentrodelatablaPROVEEDORy
cadacamporepresentaunatributoparalaentidadPROVEEDOR.

Pgina6

Lainformacinrealsobreunsoloproveedorqueseencuentraenunatablasedenominafila.Porlogeneral,a
lasfilasselesllamaregistros,oentrminosmuytcnicos,tuplas.LosdatosdelaentidadPARTEtienensupropiatabla
separada.
El campo para el Numero_Proveedor de la tabla PROVEEDOR identifica de manera nica cada registro con la
finalidaddequesepuedarecuperar,actualizaroclasificar,ysedenominacampoclave.Cadatabladeunabasededatos
relacional tiene un campo designado como clave principal. Este campo clave es el identificador nico para toda la
informacin en cualquier fila de la tabla y su clave principal no se puede duplicar. Numero_Proveedor es la clave
principal para la tabla PROVEEDOR y Numero_Parte es la clave principal para la tabla PARTE. Observe que Nume
ro_Proveedor aparece tanto en la tabla PROVEEDOR como en la tabla PARTE. En la tabla PROVEEDOR,
Numero_Proveedoreslaclaveprincipal.CuandoelcampoNumero_ProveedorapareceenlatablaPARTEsedenomina
claveexternayenesenciaesuncampoparabuscardatossobreelproveedordeunaparteespecfica.

Unabasededatosrelacionalorganizalosdatosenformadetablasbidimensionales.Aquseilustranlastablasparalas
entidadesPROVEEDORyPARTEquemuestrancmorepresentanacadaentidadysusatributos.Numero_Proveedores
unaclaveprincipalparalatablaPROVEEDORyunaclaveexternaparalatablaPARTE.

OperacionesdeunDBMSrelacional
Lastablasdeunabasededatosrelacionalsepuedencombinarfcilmenteparaentregarlosdatosrequeridos
por los usuarios, siempre y cuando dos tablas compartan un elemento de datos comn. Suponga que necesitamos
encontrarenestabasededatoslosnombresydireccionesdeproveedoresquepuedansuministrarnoslapartenmero

Pgina7

137olanmero150.Necesitaramosinformacindedostablas:PROVEEDORyPARTE.Observequeestosdosarchivos
tienenunelementodedatoscompartido:Numero_Proveedor.
En una base de datos relacional se utilizan tres operaciones bsicas, como se muestra en la figura 65, para
generar conjuntos de datos tiles: seleccionar, proyectar y unir. La operacin seleccionar crea un subconjunto que
consta de todos los registros (filas) de la tabla que cumplen los criterios establecidos. En nuestro ejemplo queremos
seleccionarregistros(filas)delatablaPARTEdondeelnmerodelaparteseaa137o150.Laoperacinunircombina
tablasrelacinalesparadaralusuariomsinformacindelaqueestdisponibleenlastablasindividuales.Ennuestro
ejemplodeseamosunirlatablaPARTEahoraabreviada(slosepresentarnlaspartes137o150)ylatablaPROVEEDOR
paraformarunasolatablanueva.
La operacin proyectar crea un subconjunto que consiste en las columnas de una tabla, lo cual permite al
usuariocrearnuevastablasquecontengansolamentelainformacinqueserequiere.Ennuestroejemplo,necesitamos
extraer de la nueva tabla solamente las siguientes columnas: Numero_Parte, Nombre_Parte, Numero_Proveedor y
Nombre_Proveedor.

Pgina8

Pgina9

DBMSjerrquicoydered
UstedpodraencontrarseconviejossistemasqueutilicenunDBMSjerrquicoounodered.UnDBMSjerrquico
modelarelacionesunoamuchos,entantoqueunoderedmodelarelacionesmuchosamuchos.LosDBMSjerrquicosy
losderedyanoseutilizanparaconstruirnuevasaplicacionesparabasesdedatos.Sonmuchomenosflexiblesquelos
DBMSrelacionalesynosoportanconsultasconfinesespecficos,comolasconsultasdeinformacinenlenguajenatural.
En el mdulo de seguimiento del aprendizaje de este captulo, localizado en el sitio Web del libro, encontrar ms
detallessobrelamaneraenquefuncionanestosDBMS.
LosDBMSrelacinalestienenmuchomsflexibilidadparaproporcionardatosenconsultasconfinesespecficos,
combinar informacin de diferentes fuentes, y agregar nuevos datos y registros sin alterar los programas y las
aplicacionesexistentes.Sinembargo,estossistemassevuelvenlentossirequierenaccederunagrancantidaddevecesa
los datos almacenados en el disco para ejecutar los comandos seleccionar, unir y proyectar. Desde luego, es posible
afinarlabasededatosparaacelerarconsultaspredeterminadas.

DBMSorientadosaobjetos
Lagranmayorade aplicacionesactualesrequierenbasesde datosque tenganlacapacidad paraalmacenary
recuperar registros que no slo contengan nmeros y caracteres, sino tambin dibujos, imgenes, fotografas, voz y
video.LosDBMSdiseadosparaorganizardatosestructuradosenfilasycolumnasnosonmuyadecuadosparamanejar
aplicacionesdegrficosomultimedia.Lasbasesdedatosorientadasaobjetossonmsadecuadasparaestepropsito.
Por ejemplo, una empresa arquitectnica maneja principalmente objetos y dibujos ms que registros de texto
estructurados.
Un DBMS orientado a objetos almacena los datos y los procedimientos que realizan operaciones sobre estos
datos como objetos que se pueden recuperar y compartir de manera automtica. Los sistemas de administracin de
bases de datos orientadas a objetos (OODBMS) se estn popularizando porque se pueden emplear para manejar los
diversoscomponentes multimediaosubprogramasdeJavaqueseutilizanenlas aplicaciones paralaWeb,lascuales
comnmenteintegranlainformacinfragmentadadediversasfuentes.
Aunquelasbasesdedatosorientadasaobjetospuedenalmacenartiposdeinformacinmscomplejosquelos
DBMSrelacionales,sonrelativamentelentascomparadasconlosDBMSrelacionalesparaprocesargrandescantidades
detransacciones.YaestndisponibleslossistemashbridosDBMSrelacionalorientadoaobjetos,paraproporcionar
capacidadesdeDBMSorientadoaobjetosyrelacional.

CAPACIDADESDELOSSISTEMASDEADMINISTRACINDEBASESDEDATOS
UnDBMSincluyecapacidadesyherramientasparaorganizar,manejaryaccederalainformacindeunabasede
datos. Las ms importantes son su capacidad de definicin de datos, su diccionario de datos y su lenguaje de
manipulacindedatos.
UnDBMStieneunacapacidaddedefinicindedatosparaespecificarlaestructuradelcontenidodelabasede
datos. Esta capacidad se podra utilizar para crear tablas de bases de datos y para definir las caractersticas de los
camposdecadatabla.Estainformacinacercadelabasededatospodradocumentarseenundiccionariodedatos.Un
diccionario de datos es un archivo automatizado o manual que almacena definiciones de elementos de datos y sus
caractersticas.
Microsoft Access integra una caracterstica rudimentaria de diccionario de datos que despliega informacin
sobrenombre,descripcin,tamao,tipo,formatoyotraspropiedadesdecadacampodeunatablacuandosetrabajaen

Pgina10

la vista Diseo o cuando se emplea el Documentador. Los diccionarios de datos para grandes bases de datos
corporativaspodrancaptarinformacinadicional,comolapropiedad(quinesresponsablededarmantenimientoalos
datos enla organizacin),autorizacin, seguridad,ylos individuos, funciones de negocios, programas e informes que
utilizacadaelementodedatos(vealafigura66).

Elaboracindeconsultaseinformes
UnDBMSincluyeherramientasparaaccederymanipularlainformacindeunabasededatos.Lamayoradelos
DBMS tiene un lenguaje especializado llamado lenguaje de manipulacin de datos, el cual se utiliza para agregar,
cambiar,eliminaryrecuperarlainformacindelabasededatos.Estelenguajecontienecomandosquepermitenque
los usuarios finales y los especialistas en programacin extraigan datos de la base de datos para satisfacer
requerimientosdeinformacinydesarrollaraplicaciones.Ellenguajeactualdemanipulacindedatosmssobresaliente
es el Lenguaje de Consultas Estructurado, o SQL. La figura 67 ilustra la consulta SQL que producira la nueva tabla
resultantedelafigura65.Enlosmdulosdeseguimientodeaprendizajedeestecaptulopuedeaveriguarmssobre
cmorealizarconsultasSQL.
FIGURA66MUESTRADEUNINFORMEDEUNDICCIONARIODEDATOS
NOMBRE:SALARIO

DESCRIPCIN:salarioanualdelempleado
TAMAO:9bytes
TIPO:N(numrico)
FECHADEMODIFICACIN:1/1/05
PROPIETARIO:Compensaciones
ACTUALIZARSEGURIDAD:
Personaldelsitio
SEGURIDADDEACCESO:
Gerente,PlaneacindeCompensaciones
Gerente,PlaneacindeRecursosHumanos
Gerente,AsuntosdeIgualdaddeOportunidades
Gerente,DepartamentodePrestaciones
FUNCIONESDENEGOCIOSUTILIZADASPOR: Compensaciones
PlaneacindeRecursosHumanos
Empleo
Seguros
Pensionesydeclaraciones401K
PROGRAMASQUELOUTILIZAN:
PI01000
PI02000
P103000
INFORMESQUELOUTILIZAN:Informedeseguimientodeincrementossalariales
Listadoderevisionessalariales
Listadodereferenciadepensiones
Lamuestradelinformedeldiccionariodedatosparaunabasededatosderecursoshumanosproporcionainformacin
til,comoeltamaodelelementodedatos,quprogramaseinformesloutilizanyculgrupodelaorganizacinesel
propietarioresponsabledesumantenimiento.

Pgina11

FIGURA67EJEMPLODEUNACONSULTASQL
SELECTPARTE.Numero_Parte,PARTE.Nombre_Parte,PROVEEDOR.
Numero_Proveedor,PROVEEDOR.Nombre_Proveedor
FROMPARTE,PROVEEDOR
WHEREPARTE.Numero_Proveedor=PROVEEDOR.Numero_Proveedor
ANDNumero_Parte=137ORNumero_Parte=150;

AquseilustranlasinstruccionesdeSQLparaunaconsultaqueseleccionalosproveedoresdelaspartes137o150.Estas
instruccionesproducenunalistaconlosmismosresultadosquesemuestranenlafigura65.
Los usuarios de un DBMS para computadoras grandes o de rango medio, como DB2, Oracle o SQL Server,
podranutilizarSQLpararecuperarlainformacinquenecesitarandelabasededatos.MicrosoftAccesstambinutiliza
SQL,peroofrecesupropioconjuntodeherramientasamigablesparaelusuariopararealizarconsultasalabasededatos
yparaorganizarlainformacindeunabasededatoseninformesmselaborados.
MicrosoftAccesscontienelascaractersticasAsistenteparaconsultasyVistaDiseodeconsultasquepermitena
los usuarios crear consultas identificando las tablas y los campos que desean, as como los resultados, y luego
seleccionando las filas de la base de datos que cumplen criterios especficos. A su vez, estas acciones se traducen a
instrucciones de SQL. La figura 68 ilustra la manera en que se puede construir la misma consulta de SQL para
seleccionarpartesyproveedores,peroutilizandolaVistaDiseodeconsultas.

Aqu se ilustra la manera en que se podra construir la consulta de la figura 67 por medio de las herramientas de
elaboracin de consultas de la Vista Diseo de consultas de Access. Se muestran las tablas, campos y los criterios de
seleccinutilizadosenlaconsulta.
MicrosoftAccessyotrosDBMSincluyencaractersticasparagenerarinformesquepermitandesplegarlosdatos
deintersenunformatomsestructuradoyrefinadodelqueseraposibleconlasolaconsulta.CrystalReportsesun
popular generador de informes para grandes DBMS corporativos, aunque tambin se puede utilizar con Access. Este

Pgina12

ltimotambincuentaconcaractersticasparadesarrollaraplicacionesparasistemasdeescritorio.Incluyeherramientas
paracrearpantallasdecapturadedatos,informesyparadesarrollarlalgicaparaelprocesamientodetransacciones.

DISEODEBASESDEDATOS
Para crear una base de datos usted debe entender las relaciones entre los datos, el tipo de datos que se
conservarnenlabasededatos,cmoseutilizarnycmotendrquecambiarlaorganizacinparamanejarlosdatos
desde una perspectiva delaempresa como un todo. La base de datos requiere tanto un diseo conceptual como un
diseofsico.Eldiseoconceptual,olgico,deunabasededatosesunmodeloabstractodelabasededatosdesdeuna
perspectivadenegocios,entantoqueeldiseofsicomuestralamanerarealenquelabasededatosestorganizadaen
dispositivosdealmacenamientodeaccesodirecto.

Normalizacinydiagramasentidadrelacin
Eldiseoconceptualdelabasededatosdescribelamaneraenqueseagruparnloselementosenlabasede
datos. El proceso de diseo identifica las relaciones entre los elementos de datos y la manera ms eficiente de
agruparlos para que cumplan los requerimientos de informacin de la empresa. El proceso tambin identifica los
elementos de datos redundantes y las agrupaciones de elementos de datos requeridos por programas de aplicacin
especficos. Los grupos de datos se organizan, refinan y simplifican hasta que surge una vista lgica general de las
relacionesentretodosloselementosdedatosenlabasededatos.
Parautilizardemaneraefectivaunmodelodebasededatosrelacional,esnecesariosimplificarlasagrupaciones
complejas de datos para minimizar elementos de datos redundantes y complicadas relaciones muchos a muchos. El
procesoparacrearestructurasdedatospequeas,estables,aunqueflexiblesyadaptablesapartirdegruposcomplejos
dedatossedenominanormalizacin.Lasfiguras69y610ilustranesteproceso.
Enelnegocioespecficoquesemodelaaqu,unpedidopuedecontenermsdeunaparte,perocadapartela
surte solamente un proveedor. Si construyramos una relacin llamadaPEDIDOcon todos los camposincluidos aqu,
tendramosquerepetirelnombreyladireccindelproveedordecadapartedelpedido,auncuandoelpedidocontenga
partes deunproveedor individual. Esta relacincontieneloquesellamagruposdedatos repetitivosporqueunsolo
pedido puede contener una gran cantidad de partes de un proveedor en particular. Una manera ms eficiente de
ordenarlosdatosesdividirPEDIDOenrelacionesmspequeas,cadaunadelascualesdescribeaunasolaentidad.Si
vamospasoapasoynormalizamoslarelacinPEDIDO,elresultadosonlasrelacionesqueseilustranenlafigura610.
En el primermdulo de seguimiento del aprendizaje de este captulo encontrar ms acerca dela normalizacin, los
diagramasentidadrelacinyeldiseodebasesdedatos.

Unarelacinsinnormalizarcontienegruposrepetidos.Porejemplo,puedehabermuchaspartesyproveedoresparacada
pedido.ExisteslounacorrespondenciaunoaunoentreNumero_PedidoyFecha_Pedido.
Los diseadores de bases de datos documentan sus modelos de datos con un diagrama entidadrelacin, el cual se
ilustra en la figura 611. Este diagrama muestra la relacin entre las entidades PEDIDO, ARTICULO_LINEA, PARTE y

Pgina13

PROVEEDOR.Loscuadrosrepresentanentidades.Laslneasqueconectanloscuadrosrepresentanrelaciones.Unalnea
queconectadosentidadesyterminacondosmarcascortasdesignaunarelacinunoauno.Unalneaqueconectados
entidadesyterminaconunapatadecuervoyunamarcacortaindicaunarelacinunoamuchos.Lafigura611muestra
queunPEDIDOpuedecontenermuchosARTICULO_LINEA.(UnaPARTEsepuedeordenarmuchasvecesyapareceruna
grancantidad,devecescomoartculodelneaenunsolopedido.)CadaPARTEpuedetenerslounPROVEEDOR,pero
elmismoPROVEEDORpuedesuministrarunagranvariedaddePARTES.

Despus de la normalizacin, la relacin original PEDIDO ha sido dividida en cuatro relaciones ms pequeas. La
relacinPEDIDOquedaconslodosatributosylarelacinARTICULO_LINEAtieneunaclavecombinada,oconcatenada,
conformadaporNumero_PedidoyNumero_Parte.

Noestdemsrecalcarlo:silaempresanoimplementasumodelodedatoscorrecto,elsistemaserincapazde
servirbienalaempresa.Lossistemasdelacompaanoserntanefectivoscomodebieranporquetendrnquetrabajar
con datos que podran ser inexactos, incompletos o difciles de recuperar. Tal vez la leccin ms importante que se
puede aprender de este curso es la comprensin de los datos de la organizacin y de la manera como se deben
representarenunabasededatos.

DistribucindeBasesdedatos
El diseo de bases de datos tambin abarca la manera en que se distribuyen los datos. Se pueden disear
sistemas deinformacin con una base de datos centralizada que sea utilizada por un procesador central nico o por
mltiplesprocesadoresenunaredcliente/servidor.Alternativamente,labasededatospuedeserdistribuida.Unabase
dedatosdistribuidaesaquellaquesealmacenaenmsdeunlugarfsico.

EstediagramamuestraasrelacionesentrelasentidadesPEDIDO,ARTICULO_LINEA,PARTEyPROVEEDORquepodran
utilizarseparamodelarlabasededatosdelafigura610.

Pgina14

Hay dos formas principales de distribuir una base de datos (vea la figura 612). En una base de datos
particionada, unas partes de la base de datos se almacenan y mantienen fsicamente en un lugar y otras partes se
almacenanymantienenenotroslugares(vealafigura612a)demaneraquecadaprocesadorremototengalosdatos
necesariosparaabastecersurealocal.Loscambiosenlosarchivoslocales se puedenjustificarconlabasededatos
centralapartirdelotes,confrecuenciaporlanoche.Otraestrategiaesreplicar(esdecir,duplicarporcompleto)labase
dedatoscentral(vealafigura612b)en todaslasubicacionesremotas. Porejemplo,LufthansaAirlinesreemplazsu
basededatosdemainframecentralizadaconunabasededatosreplicadaparaquelainformacinestuvieradisponible
demaneramsinmediataparalosdespachadoresdevuelos.CualquiercambioquesehagaalDBMSdeLufthansaen
Frankfort se replica automticamente en Nueva York y en Hong Kong. Esta estrategia tambin requiere que la
actualizacindelabasededatoscentralsehagaenhorasdemenoscarga.

Existenformasalternativasparadistribuirunabasededatos.Labasede datoscentral se puedeparticionar(a) detal


maneraquecadaprocesadorremototengalosdatosnecesariosparasatisfacersuspropiasnecesidadeslocales.Labase
dedatoscentraltambinsepuedereplicar(b)entodaslasubicacionesremotas.
Lossistemasdistribuidosreducenlavulnerabilidaddeunsolositiocentralmasivo.Incrementanelservicioyel
nivelderespuestaparalosusuarioslocalesyconfrecuenciapuedencorrerencomputadorasmspequeasymenos
caras.Sinembargo,lasbasesdedatoslocalesenocasionespuedendesviarsedelosestndaresydefinicionescentrales
dedatosyplantearproblemasdeseguridadporlaampliadistribucindelaccesoadatosdelicados.Losdiseadoresde
basesdedatosnecesitanponderarestosfactoresensusdecisiones.

6.3USODEBASESDEDATOSPARAMEJORARELDESEMPEOEMPRESARIALYLATOMADE
DECISIONES
Las empresas utilizan sus bases de datos para dar seguimiento a las transacciones bsicas, como el pago a
proveedores, el procesamiento de pedidos, el seguimiento de los clientes y el pago a los empleados. Pero tambin
necesitanlasbasesdedatosparasuministrarinformacinqueayudaralaempresaamanejarlosnegociosdemanera

Pgina15

mseficiente,yqueayudaralosgerentesyalosempleadosatomarmejoresdecisiones.Siunaempresadeseasaber
culproductoeselmspopularoquinessuclientemsrentable,puedeencontrarlarespuestaenlosdatos.
Por ejemplo, al analizar los datos de compras de sus clientes con tarjeta de crdito, Louise's Trattoria, una
cadenaderestaurantesdeLosngeles,sediocuentadequelacalidaderamsimportantequeelprecioparalamayora
desusclientes,quienestenaneducacinuniversitariaylesgustabaelbuenvino.Enrespuestaaestainformacin,la
cadenaintrodujoplatosvegetarianos,msvariedaddemariscosyvinosmscaros,elevandosusventasenmsde10
porciento.
Enunaempresagrande,conrobustasbasesdedatosoenormessistemasparacadafuncin,comomanufactura,
ventasycontabilidad,serequierencapacidadesyherramientasespecialesparaanalizarextensascantidadesdedatosy
para acceder datos desde mltiples sistemas. Estas capacidades incluyen el almacenamiento de datos, la minera de
datosyherramientasparaaccederbasesdedatosinternasatravsdelaWeb.

ALMACENESDEDATOS
Supongaquerequiereinformacinconcisayconfiableacercadelasoperacionesactuales,lastendenciasylos
cambios a travs de toda la empresa. Si usted trabajara en una empresa grande, podra dificultrsele obtener esta
informacin porque con frecuencia los datos se conservan en sistemas separados, como ventas, manufactura o
contabilidad.Algunosdelosdatosqueustednecesitarapodranestarenelsistemadeventas,yotrosfragmentosenel
sistemademanufactura.Muchosdeestossistemassonantiguosyheredados,queutilizantecnologasdeadministracin
dedatosobsoletasosistemasdearchivosenloscualesesdifcilparalosusuariosaccederalainformacin.
Ustedpodrapasarcantidadesdetiempoexcesivaslocalizandoyrecopilandolosdatosquenecesitara,opodra
verseobligadoatomarsusdecisionesconbaseenconocimientoincompleto.Sirequirierainformacinsobretendencias,
tambinpodratenerproblemasparaencontrarlosdatosacercadesucesospasadosporquelamayoradelasempresas
sloponenadisposicininmediatasusdatosactuales.Elalmacenamientodedatosresuelveesosproblemas.

Quesunalmacndedatos?
Unalmacndedatosesunabasededatosquealmacenadatosactualesehistricosdepotencialintersparalos
encargadosdelatomadedecisionesdetodalaempresa.Losdatosseoriginanenmuchossistemasdetransacciones
operativasesenciales,comolossistemasdeventas,cuentasdeclientesymanufactura,ypodranincluirdatosderivados
detransaccionesensitiosWeb.Elalmacndedatosconsolidayestandarizainformacindediferentesbasesdedatos
operativasconelpropsitodequelainformacinsepuedautilizaratravsdelaempresaparaelanlisisylatomade
decisionesporpartedelaadministracin.
La figura 613 ilustra la manera en que funciona un almacn de datos. El almacn de datos pone los datos a
disposicindequienlosnecesite,peronosepuedenmodificar.Unsistemadealmacndedatostambinproporciona
una variedad de herramientas de consultas con fines especficos y estandarizadas, herramientas analticas y
caractersticasgrficas paralaelaboracindeinformes.Muchasempresasutilizanportalesdeintranetsparaponerla
informacindelosalmacenesdedatosadisposicindetodalaempresa.

Mercadosdedatos
Con frecuencia, las compaas construyen almacenes de datos a nivel general de la empresa, en los que un
almacndedatoscentralabasteceatodalaorganizacin,ocreanalmacenesdescentralizadosmspequeosllamados
mercadosdedatos.Unmercadodedatosesunsubconjuntodeunalmacndedatosenelqueunaparteresumidao
altamente enfocada de los datos de la organizacin se coloca en una base de datos separada para una poblacin

Pgina16

especfica de usuarios. Por ejemplo, una compaa puede desarrollar mercados de datos de marketing y ventas para
manejarlainformacindelosclientes.Porlocomn,unmercadodedatosseenfocaenunasolareaobjetivoolnea
denegocios,porloqueusualmentesepuedeconstruirmsrpidoyauncostomsbajoqueunalmacndedatosa
niveldetodalaempresa.

Elalmacndedatosextraedatosactualesehistricosdemltiplessistemasoperativosdentrodelaorganizacin.Estos
datossecombinancondatosdefuentesexternasysereorganizanenunabasededatoscentraldiseadaparaelaborar
informesyanlisisparalaadministracin.Eldirectoriodeinformacinsuministrainformacinalosusuariosacercade
losdatosdisponiblesenelalmacndedatos.

INTELIGENCIA DE NEGOCIOS, ANLISIS DE DATOS MULTIDIMENSIONALES Y MINERA DE


DATOS
Unavezquesehancapturadoyorganizadolosdatosenalmacenesdedatosyenmercadosdedatos,estna
disposicin para anlisis ms profundos. Una serie de herramientas permite a los usuarios analizar estos datos para
descubrir nuevos patrones, relaciones y conocimientos profundos para orientar la toma de decisiones. Estas
herramientasparaconsolidar,analizarydaraccesoaextensascantidadesdedatosparaayudaralosusuariosatomar
mejoresdecisionesdenegociosconfrecuenciasedenominaninteligenciadenegocios(BI).Lasprincipalesherramientas
para la inteligencia de negocios incluyen software para consultas e informes de bases de datos, herramientas para
anlisisdedatosmultidimensionales(procesamientoanalticoenlnea)ymineradedatos.
Cuandopensamosenlainteligenciacomoseaplicaaloshumanos,porlogeneral,pensamosenlacapacidadde
lagenteparacombinarelconocimientoaprendidoconnuevainformacinycambiarcomportamientosconlaideade

Pgina17

alcanzarelxitoensuactividadoadaptarseaunanuevasituacin.Demanerasimilar,lainteligenciadenegociosdaa
las empresas la capacidad de acumular informacin; desarrollar conocimiento sobre clientes, competidores y
operacionesinternas,ycambiarlamaneradetomardecisionesparalograrunarentabilidadmsaltayotrasmetasde
negocios.
Por ejemplo Harrah's Entertainment, la segunda empresa de apuestas ms grande en su industria, analiza
continuamentelosdatossobresusclientesrecopiladoscuandolagentejuegaensusmquinastragamonedasocuando
acudeasuscasinosyhoteles.EldepartamentodemarketingdeHarrah'sutilizaestainformacinparaconstruirunperfil
de apuestas detallado, con base en el valor continuo de un cliente en particular para la empresa. Esta informacin
orienta las decisiones de la administracin sobre la manera de cultivar a los clientes ms rentables, animar a esos
clientesagastarmsyatraermsclientesconunpotencialaltodegeneracindeingresos.Lainteligenciadenegocios
hamejoradotantolasutilidadesdeHarrah'squesehaconvertidoenlapiezacentraldelaestrategiadenegociosdela
empresa.

Una serie de herramientas analticas trabajan con la informacin almacenada en las bases de datos para encontrar
patrones y conocimientos profundos para ayudar a los gerentes y empleados a tomar mejores decisiones para una
mejoraeneldesempeodelaorganizacin.
Lafigura614ilustralamaneraenquefuncionalainteligenciadenegocios.Lasbasesdedatosoperativasdela
empresadanseguimientoalastransaccionesquesegeneranporelmanejodelnegocio.Estasbasesdedatosalimentan
informacin al almacn de datos. Los gerentes utilizan las herramientas de inteligencia de negocios para encontrar
patronesysignificadosenlosdatos.Acontinuacin,losgerentesaprovechanloquehanaprendidodelanlisisdelos
datostomandodecisionesdeinteligenciadenegociosmsinformadas.
Esta seccin le presentar las tecnologas y herramientas de inteligencia de negocios ms importantes. En el
captulo12leproporcionaremosmsdetallesacercadelasaplicacionesdeinteligenciadenegocios.

Procesamientoanalticoenlnea(OLAP)
Suponga que su empresa vende cuatro diferentes productos tuercas, pernos, arandelas y tornillos en las
regiones Este, Oeste y Central. Si usted quisiera hacer una pregunta bastantedirecta, como la cantidad de arandelas
vendidasduranteeltrimestrepasado,podraencontrarfcilmentelarespuestaconsultandosubasededatosdeventas.

Pgina18

Peroqupasarasiquisierasaberlacantidaddearandelasvendidasencadaunadesusregionesdeventasycomparar
losresultadosrealesconlasventasproyectadas?
Paraobtenerlarespuesta,ustednecesitaraelprocesamientoanalticoenlnea(OLAP).OLAPsoportaelanlisis
de datos multidimensionales, el cual permite a los usuarios ver los mismos datos en diferentes formas utilizando
mltiples dimensiones. Cada aspecto de lainformacin producto, precio, costo, regin o periodo representa una
dimensin diferente. As, un gerente de producto podra utilizar una herramienta de anlisis de datos
multidimensionalesparasabercuntasarandelassevendierondurantejunioenelEste,cmosecomparaestoconel
mesanterioryconelmismomesdelaopasado,ycmosecomparaconelpronsticodeventas.OLAPpermitealos
usuarios obtener respuestas en lnea a preguntas especficas como las anteriores en un lapso de tiempo sumamente
rpido,auncuandolosdatosestnalmacenadosenbasesdedatosbastantegrandes,comolascifrasdeventasdevarios
aos.

Lafigura615muestraunmodelomultidimensionalquepodracrearsepararepresentarproductos,regiones,
ventasrealesyventasproyectadas.Unamatrizdeventasrealessepodraapilarsobreunamatrizdeventasproyectadas
para formar un cubo con seis caras. Si gira 90 grados el cubo en una sola direccin, la cara que se muestra ser el
productocontralasventasrealesylasproyectadas.Sigira90gradoselcubodenuevacuenta,verlaregincontralas
ventas reales y las proyectadas. Si lo gira 180 grados a partir de la vista original, ver las ventas proyectadas y el
productocontralaregin.Loscubossepuedenanidardentrodecubosparaconstruirvistasdedatoscomplejas.Una
empresapodrautilizarunabasededatosmultidimensionalespecializadaounaherramientaquegenerevistasdedatos
multidimensionalesenbasesdedatosrelacionales.

Lavistaquesemuestraesproductocontraregin.Siustedgira90gradoselcubo,lacaraquesemostraresproducto
contraventasrealesyproyectadas.Silovuelveagirar,tendrunavistadelaregincontraventasrealesyproyectadas.
Sepuedentenerotrasvistas.

Mineradedatos
Las consultas de bases de datos tradicionales responden preguntas como "Cuntas unidades del producto
nmero403seembarcaronenfebrerode2007?"OLAP,oanlisismultidimensional,soportasolicitudesdeinformacin
muchomscomplejas,como"Compararlasventasdelproducto403respectodeloplaneado,portrimestreyreginde

Pgina19

ventas,delosdosaosanteriores".ConOLAPyelanlisisdedatosorientadoaconsultas,losusuariosnecesitantener
unabuenaideasobrelainformacinqueestnbuscando.
La minera de datos est ms orientada al descubrimiento de informacin. La minera de datos proporciona
conocimientosacercadelosdatoscorporativosquenosepodranobtenerconOLAP,alencontrarpatronesyrelaciones
ocultas en robustas bases de datos e infiriendo reglas a partir de ellos para predecir el comportamiento futuro. Los
patronesylasreglasseutilizanparaorientarlatomadedecisionesypredecirelefectodetalesdecisiones.Lostiposde
informacin que se pueden obtener a partir delaminera de datos incluyen asociaciones,secuencias, clasificaciones,
agrupacionesypronsticos.

Las asociaciones son ocurrencias enlazadas a un solo evento. Por ejemplo, un estudio de los patrones de
comprasdeunsupermercadopodrarevelarquecuandosecompranhojuelasdemaztambinsecompra,en
un65porcientodelasveces,unabebidadecola,perocuandohayalgunapromocinsecompraunabebidade
colaen85porcientodelasveces.Estainformacinayudaalosgerentesatomarmejoresdecisionesporquese
handadocuentadelarentabilidaddelaspromociones.
Enlassecuencias,loseventosseenlazanconelpasodeltiempo.Porejemplo,podramosencontrarquesise
compra una casa,65 porciento delas veces se comprar un nuevo refrigerador dentro de las siguientes dos
semanas,yquealmesdelacompradelacasahabrun45porcientodevecesenquesecomprarunhorno.
Laclasificacinreconocepatronesquedescribenelgrupoalcualperteneceunelementopormediodelanlisis
deloselementosexistentesquesehanclasificadoypormediodelainferenciadeunconjuntodereglas.Por
ejemplo, las empresas de tarjetas de crdito o las telefnicas se preocupan por la prdida de clientes
permanentes.Laclasificacinayudaadescubrirlascaractersticasdelosclientesquesepodranperderypuede
aportarunmodeloparaayudaralosgerentesapredecirquinessonestosclienteseidearcampaasespeciales
pararetenerlos
Elagrupamientofuncionade unamanera semejantealaclasificacincuandoannosehandefinidogrupos.
Una herramienta de minera de datos puede descubrir diferentes agrupamientos dentro de los datos, como
encontrargruposdeafinidadparatarjetasbancariasoparticionarunabasededatosengruposdeclientespor
suscaractersticasdemogrficasyeltipodesusinversionespersonales.
Aunque estas aplicaciones incluyen predicciones,lageneracin de pronsticos utilizalas predicciones de una
maneradistinta.Empleaunaseriedevaloresexistentesparapronosticarquotrosvaloreshabr.Porejemplo,
laelaboracin de pronsticos podra encontrar patrones en los datos para ayudar a los gerentes a estimar el
valorfuturodevariablescontinuas,comocifrasdeventas.

Estos sistemas realizan anlisis de alto nivelsobre patrones o tendencias, pero tambin pueden profundizar para
ofrecermsdetallescuandoseanecesario.Existenaplicacionesdemineradedatosparatodaslasreasfuncionalesde
unaempresa,aligualqueparaelgobiernoyeltrabajocientfico.Unodelosusospopularesdelamineradedatoses
ofreceranlisisdetalladosdepatronesexistentesenlosdatosdeclientespararealizarcampaasdemarketingopara
identificarclientesrentables.
Porejemplo,VirginMobileAustraliautilizaunalmacndedatosymineradedatosparaincrementarlalealtaddel
clienteypresentarnuevosservicios.Elalmacndedatosconsolidaenunaenormebasededatoslainformacindesu
sistemaempresarial,susistemadeadministracindelasrelacionesconelclienteylossistemasdefacturacinalcliente.
Lamineradedatoshapermitidoalaadministracindeterminarelperfildemogrficodenuevosclientesyrelacionarlo
conlosequiposquehayancomprado.Tambinhaayudadoalaadministracinaevaluareldesempeodecadatienday
de las campaas en el punto de venta, las reacciones del consumidor a nuevos productos y servicios, los ndices de
desercindeclientesylosingresosgeneradosporcadacliente.

Pgina20

Elanlisispredictivoutilizatcnicasdemineradedatos,datoshistricosysuposicionessobrecondicionesfuturas
parapredecir resultadosdeeventos,comolaprobabilidaddeque uncliente responder a unaofertao comprar un
producto especfico. Por ejemplo, la divisin estadounidense de The Body Shop International pie utiliz anlisis
predictivoconsubasededatosdeclientesdecatlogo,laWebydelastiendasparaidentificarclientesquetuvieran
msprobabilidadderealizarcomprasporcatlogo.Esainformacinayudalaempresaaconstruirunalistadecorreos
msprecisaydirigidaparasuscatlogos,conlocualmejorlatasaderespuestaaloscorreosconofertasdecatlogosy
alosingresosporventasdecatlogo.
La minera de datos es una herramienta poderosa y rentable, pero plantea riesgos para la proteccin de la
privacidadindividual.Latecnologademineradedatospuedecombinarinformacindemuchasfuentesdiversaspara
crearuna"imagendedatos"detalladasobrecadaunodenosotrosnuestrosingresos,nuestroshbitosdeconducir,
nuestrasaficiones,nuestrasfamiliasynuestrosinteresespolticos.Enelcaptulo4seanalizalacuestinsobresisedebe
permitir a las empresas recopilar esta informacin detallada acerca de los individuos. La Sesin Interactiva sobre
OrganizacionesexploraeldebateacercadesilasgrandesbasesdedatosquealmacenanperfilesdeADNutilizadosenla
luchacontraelcrimenrepresentanunaamenazaalaprivacidadyalbienestarsocial.

BASESDEDATOSYLAWEB
Alguna vez ha intentado utilizar la Web para colocar un pedido o ver un catlogo de productos? Si es; as,
probablementeestuvoempleandounsitioWebenlazadoaunabasededatosinternadealgunacorporacin.Muchas
empresasutilizanahoralaWebparaponerpartedelainformacindesusbasesdedatosinternasadisposicindesus
clientesysociosdenegocios.
Porejemplo,supongaqueunclienteconunnavegadorWebdeseabuscarinformacindepreciosenlabasede
datos de un detallista en lnea.La figura 616 ilustra lamaneraen que ese cliente podra accedera la base de datos
internadeldetallistaatravsdelaWeb.ElusuarioaccedealsitioWebdeldetallistapormediodeInternet,utilizandoun
navegador Web instalado en su PC del cliente. El navegador Web del usuario solicita datos a la base de datos de la
organizacin,utilizandocomandosdeHTMLparacomunicarseconelservidorWeb.
Puestoquemuchasbasesdedatos"derespaldo"nopuedeninterpretarcomandosescritosenHTML,elservidor
WebpasalassolicitudesdedatosasoftwarequetraduceloscomandosHTMLenSQLparaquelospuedaprocesarel
DBMSquetrabajaconlabasededatos.Enunentornocliente/servidor,elDBMSresideenunacomputadoradedicada
denominada servidor de base de datos. El DBMS recibe las solicitudes de SQL y suministra los datos requeridos. El
middlewaretransfiereinformacindesdelabasededatosinternadelaorganizacinderegresoalservidorWebpara
queseentregueenformadepginaWebalusuario.
Lafigura616muestraqueelmiddlewarequefuncionaentreelservidorWebyelDBMSpodraserunservidor
de aplicaciones ejecutndose en su propia computadora dedicada (vea el captulo 5). El software servidor de
aplicacionesmanejatodaslasoperacionesdelasaplicaciones,incluyendoelprocesamientodetransaccionesyelacceso
adatos,entrelascomputadorasconnavegadoresylasaplicacionesdenegociosolasbasesdedatosderespaldodeuna
empresa. El servidor de aplicaciones toma solicitudes del servidor Web, ejecuta la lgica de negocios para procesar
transaccionesconbaseendichassolicitudes,yproporcionalaconectividadalossistemasobasesdedatosderespaldo
de la organizacin. De manera alternativa, el software para manejar estas operaciones podra ser un programa
personalizado o un script de CGI. Un script de CGI es un programa compacto que utiliza la especificacin Interfaz de
CompuertadeEnlace(CGI)paraprocesarlosdatosenunservidorWeb.

Pgina21


LosusuariosaccedenalabasededatosinternadeunaorganizacinatravsdelaWeb,utilizandosusPCsdeescritorioy
unnavegador.
ExistenvariasventajasalutilizarlaWebparaaccederalasbasesdedatosinternasdeunaorganizacin.Primero,
unnavegadorWebesmssencillodeutilizarquelasherramientasdeconsultapropietarias.Segundo,lainterfazWeb
requiere pocos cambios o ninguno a la base de datos interna. Cuesta mucho menos agregar una interfaz Web a un
sistemaheredadoqueredisearyvolveraconstruirelsistemaparamejorarelaccesodelosusuarios.
El acceso a bases de datos corporativas a travs de la Web est creando nuevas eficiencias, oportunidades y
modelosdenegocios.ThomasNet.comproporcionaundirectorioenlneaactualizadodemsde650,000proveedores
de productos industriales, como qumicos, metales, plsticos, hule y equipo automotriz. Con el nombre anterior de
ThomasRegister,laempresaacostumbrabaenviarenormescatlogosimpresosconestainformacin.iGo.comesuna
empresaenInternetquevendebaterasyaccesoriosparatelfonoscelularesydispositivosdecmputo.SusitioWeb
enlaza a una base de datos relacional de gran tamao que contiene informacin de productos como bateras y
perifricosparacasitodaslasmarcasymodelosdetelfonoscelularesydispositivoselectrnicosporttiles.

ElsitioWebdeInternetMovieDatabaseseenlazaaunaenormebasededatosqueincluyeresmenes,informacinde
repartosybiografasdeactoresdecasitodaslaspelculasquesehanfilmado.

Pgina22

6.4ADMINISTRACINDELOSRECURSOSDEDATOS
Laimplementacindeunabasededatosessloelcomienzo.Paraasegurarsedequelosdatosdesunegocio
permanecernexactos,confiablesydisponiblesconfacilidadparaquieneslosrequieran,suempresanecesitarpolticas
yprocedimientosespecialesparalaadministracindedatos.

ESTABLECIMIENTODEUNAPOLTICADEINFORMACIN
Todaslasempresas,grandesypequeas,necesitanunapolticadeinformacin.Losdatosdesuempresasonun
recursoimportante,yaustednoleagradarquelosdemshaganconellosloqueselesantoje.Ustednecesitarcontar
con reglas sobrela manera en que se organizarn y mantendrnlos datos,yquin tendr autorizacinpara verlos o
modificarlos.
Una poltica de informacin especfica las reglas de la organizacin para compartir, distribuir, adquirir,
estandarizar, clasificar e inventariar la informacin. Una poltica de informacin establece procedimientos y
responsabilidades especficos, que identifican cules usuarios y unidades de la organizacin pueden compartir
informacin,dndesepuededistribuirlainformacinyquinesresponsabledeactualizarymantenerlainformacin.
Por ejemplo, una poltica de informacin tpica podra especificar que slo miembros seleccionados de los
departamentosdenminayderecursoshumanospodrantenerautorizacinparamodificaryverdatosdelicadossobre
empleados, como sus salarios o sus nmeros de seguro social, y que estos departamentos son responsables de
garantizarquetalesdatosseanexactos.
Si usted est en una empresa pequea, tal vez los propietarios o los gerentes establezcan la poltica de
informacin.Enunaorganizacingrande,elmanejoylaplaneacindelainformacincomounrecursocorporativocon
frecuenciarequiereunafuncin formaldeadministracindedatos.Laadministracin dedatosesresponsabledelas
polticas y procedimientos especficos por medio de los cuales se pueden manejar los datos como un recurso
organizacional.Estasresponsabilidadesincluyendesarrollarlapolticadeinformacin,planificarlosdatos,supervisarel
diseolgicodelabasededatosyeldesarrollodeldiccionariodedatos,yvigilarlamaneraenquelosespecialistasen
sistemasdeinformacinylosgruposdeusuariosfinalesutilizanlosdatos.
Tal vez haya escuchado el trmino gobierno de la informacin utilizado para describir muchas de estas
actividades.Promovidopor IBM,elgobiernodelainformacinseencargadelas polticasy procesosparamanejarla
disponibilidad, usabilidad,integridadyseguridad delosdatosempleados enunaempresa,conunnfasisespecialen
promoverlaprivacidad,laseguridad,lacalidaddelosdatosyelcumplimientodelasregulacionesgubernamentales.
Unaorganizacingrandetambintendrungrupodediseoyadministracindebasesdedatosdentrodela
divisindesistemasdeinformacincorporativa,responsablededefiniryorganizarlaestructuraycontenidodelabase
dedatos,ascomodesumantenimiento.Enestrechacooperacinconlosusuarios,elgrupodediseoestablecelabase
dedatosfsica,lasrelacioneslgicasentreloselementos,ylasreglasdeaccesoylosprocedimientosdeseguridad.Las
funcionesquedesempeaseconocencomoadministracindelabasededatos.

ASEGURAMIENTODELACALIDADDEDATOS
Unabasededatosyunapolticadeinformacinbiendiseadascontribuirnagarantizarquelaempresatenga
lainformacinquenecesita.Noobstante,sedebenemprenderaccionesadicionalesparaasegurarquelainformacinde
lasbasesdedatosdelaorganizacinseaexactayconfiable.

Qu pasara si el nmero telefnico o el saldo de la cuenta de un cliente fueran incorrectos? Cul sera el
impacto si la base de datos tuviera un precio errneo para el producto que usted vendi? Los datos imprecisos, a

Pgina23

destiempo o inconsistentes en relacin con otras fuentes de informacin conducen a tomar decisiones incorrectas,
devolucindeproductoseinclusoprdidasfinancieras.
De acuerdo con Forrester Research, 20 por ciento del correo y de las entregas de paquetes comerciales en
Estados Unidos fueron devueltos debido a nombres o direcciones incorrectos. Los consultores de Gartner Group
reportaronquemsde25porcientodelainformacincrticadelasbasesdedatosdegrandesempresasdeFortune
1000esimprecisaoestincompleta,incluyendo cdigosydescripcionesde productosequivocados,descripciones de
inventario deficientes, datos financieros errneos, informacin incorrecta de proveedores y datos incorrectos de
empleados.Gartnercreequelosdatosdeclientespierdencalidadaunritmode2porcientomensual,locualhaceque
la calidad de datos deficiente sea uno de los principales obstculos para administrar con xito las relaciones con el
cliente(GageyMcCormick,2005;Klau,2003).
Pienseentodaslasocasionesenqueharecibidovariaspiezasdelamismapublicidadporcorreodirectodurante
elmismoda.Muyprobablementesteseaelresultadodequesunombreestvariasvecesenunabasededatos.Su
nombre podra haber sido mal escrito o quiz utiliz su segundo nombre en una ocasin y no en otra, o tal vez la
informacinseintrodujoinicialmenteenunformularioenpapelynosedigitalizdemaneraadecuadaenelsistema.
Debidoaestasinconsistencias,labasededatoslotrataraaustedcomosifuerandiferentespersonas!Confrecuencia
recibimoscorreorepetitivodirigidoaLaudon,Lavdon,LaudenoLandon.
Siunabasededatosestdebidamentediseadaysehanestablecidoestndaresdedatosparatodalaempresa,
loselementosdedatosduplicadosoinconsistentesdebernsermnimos.Sinembargo,lamayoradelosproblemasde
calidad de datos, como nombres mal escritos, nmeros traspuestos o cdigos incorrectos o faltantes, se derivan de
erroresdurantelacapturadedatos.Laincidenciadetaleserroresseestincrementandoamedidaquelasempresas
desplazan sus negocios a la Web y permiten a los clientes y proveedores introducir datos en sus sitios Web que
actualizandirectamentesussistemasinternos.
Antes de que una nueva base de datos entre en funcionamiento, las organizaciones tienen que identificar y
corregir los datos errneos y establecer mejores rutinas para editar datos una vez que sus bases de datos estn
operando.Elanlisisdelacalidaddedatossueleempezarconunaauditoradelacalidaddelosdatos,queesunsondeo
estructuradodelaexactitudyniveldecompletituddelosdatosquehayenunsistemadeinformacin.Lasauditorasde
lacalidaddelosdatossepuedenrealizarsondeandoarchivosdedatoscompletos,sondeandomuestrasdelosarchivos
dedatososondeandoalosusuariosfinalesacercadesupercepcindelacalidaddedatos.
La depuracin de datos, tambin conocida como limpieza de datos, consiste en actividades para detectar y
corregir datos de una base de datos que sean incorrectos o incompletos, tengan un formato inadecuado o sean
redundantes.Ladepuracindedatosnoslocorrigeerroressinoquetambinimponelaconsistenciaentrediferentes
conjuntos de datos originados en sistemas de informacin separados. NASCAR, descrita en el caso con que inicia el
captulo,necesitabautilizarladepuracindedatosparaeliminarinconsistenciasyerroresenlosdatosprovenientesde
mltiples fuentes cuando gener su amplia base de datos de aficionados. Existe software de depuracin de datos
especializadoparasondearautomticamentearchivosdedatos,corregirerroresenlosdatoseintegrarlosdatosenun
formatoconsistenteparatodalaempresa.
LaSesinInteractivasobreAdministracindescribealgunasempresasquepadecieronproblemasdecalidadde
datos y la manera en que trataron de solucionarlos. Estos problemas eran multifacticos. A medida que lea el caso,
busque los factores administrativos, organizacionales y tecnolgicos que produjeron estos problemas de calidad de
datosylamaneraenquelosenfrentaron.

Pgina24

You might also like