You are on page 1of 9

Archivos y bases de datos

Nunca hasta el presente, ha estado la informacin en tal cantidad y riqueza a disposicin de las personas. La computacin, las redes y el Internet se han convertido en medios por excelencia para acceder a la informacin de manera fcil y rpida. La informacin oportuna y confiable hace la diferencia en cualquier tipo de actividad que las personas desempeen. Por esto, es importante saber cmo encontrar de manera eficaz la informacin de inters. El propsito del almacenamiento secundario es acopiar informacin. Gracias a la tecnologa y los recursos existentes, provistos por campos como la informtica y la electrnica, las bases de datos y sus diversos modelos, presentan en la actualidad un rango de soluciones a la cuestin del almacenamiento de datos. Los usos ms comunes de las bases de datos, se encuentran en las operaciones de empresas e instituciones pblicas, as como tambin en entornos cientficos, educativos y de investigacin. En lo que sigue, se muestra como se organiza la informacin mediante archivos y bases de datos; de que manera se puede tener acceso a los datos as guardados y a la informacin suministrada por otras fuentes, mediante las telecomunicaciones y las redes, que permiten ampliar el alcance de las computadoras ms all del escritorio. Organizacin de datos en el almacenamiento secundario Para que las computadoras puedan almacenar y procesar los datos, estos se organizan regularmente en ciertos elementos. Cada uno de estos elementos se agrupa con sus similares, para formar otro elemento ms complejo: Carcter: Es una letra, un nmero, signo de puntuacin o signo especial. Campo: Contiene un grupo de caracteres que agrupados conforman un dato o atributo de informacin. Cuando se llena un formato de solicitud de ingreso en una Universidad, el nombre de la persona por ejemplo, representa un campo; su direccin, domicilio, y otros, representan a su vez otros campos. Registro: Est conformado por la agrupacin de campos relacionados entre s. Toda la informacin de inscripcin de un estudiante constituye un registro. Archivo: Es un conjunto de registros relacionados. Todas las inscripciones de los estudiantes una universidad podran conformar un archivo.

de

Base de datos: Est conformada por un conjunto de archivos interrelacionados. Los archivos de inscripcin, adems de los archivos de notas, de profesores y de materias conjuntamente pueden constituir una base de datos de una universidad.

Organizacin de los datos

Campo clave: Es un campo particular dentro del registro, que permite la identificacin exclusiva y unvoca de cada registro. La clave debe ser un valor que no se repita, como por ejemplo, el nmero de cdula de identidad, nmero de identificacin, el nmero de carnet en una universidad o el nmero de seguro social. Procesamiento de Datos. Existen dos maneras tradicionales para procesar datos. El procesamiento por lotes y el procesamiento en tiempo real. Procesamiento por lotes: En este procesamiento, los datos se renen por un periodo de tiempo (horas, das o hasta semanas) al final del cual, se procesan en una sola operacin o lote. Procesamiento en tiempo real: Este ocurre cuando los datos se procesan en el mismo momento en que son generados. Al principio, tan slo se dispona de almacenamiento en cintas magnticas que nicamente permiten almacenamiento secuencial. Esto obligaba a realizar todo el procesamiento por lotes. Con la aparicin de los dispositivos de acceso directo (discos duros), fue posible el almacenamiento de acceso directo, que permite localizar velozmente el registro de inters. Esto posibilit el procesamiento en tiempo real, que es muy apreciado en operaciones, como las de empresas comerciales. El procesamiento en tiempo real permite, por ejemplo, saber al instante cuntos productos han sido vendidos y con cuntos se cuenta en inventario, en tanto se van haciendo las ventas. An cuando el procesamiento por lotes precedi al procesamiento en tiempo real, motivado a factores como la disponibilidad de la tecnologa, no es correcto pensar en el procesamiento por lotes como algo caduco. Existen procesos que por su naturaleza deben hacerse por lotes, como por

ejemplo el clculo de la nmina de una compaa cada mes. Archivos maestros y archivos de transacciones. Se tratan ahora dos tipos de archivos que son utilizados cuando se desea actualizar los datos. Elarchivo maestro, mantiene la totalidad de registros en una versin actualizada. Por ejemplo, un archivo usado para la elaboracin de los estados de cuenta bancarios. El archivo de transacciones,contiene los cambios ms recientes a los registros, que permitirn actualizar el archivo maestro. Una muestra sera un archivo con los datos temporales de movimientos bancarios a lo largo de un mes. Organizacin de los archivos. La organizacin de los registros en los archivos se puede hacer de tres maneras diferentes, y para hacer la comparacin por ventajas y desventajas, ver tabla 1: 1. Organizacin secuencial: En esta organizacin los registros se almacenan uno tras otro en un orden predeterminado. El orden lo determina su campo clave. Los registros deben ser ordenados de una forma especfica para su almacenamiento, lo cual tiene su costo en tiempo. Tiene ventajas cuando se necesita acceso a la totalidad o una gran porcin de registros, pero si se trata de ubicar un registro particular puede ser sumamente lento. Con este tipo de organizacin, para llegar al registro 6510, deben recorrerse uno a uno, los primeros 6509 registros anteriores empezando por el 0001. 2. Organizacin directa: Para esta organizacin, los registros no se almacenan uno tras otro, sino que se ubican en una direccin particular que est determinada por su campo clave. La direccin es establecida mediante programas que usan una tcnica denominada clculo de clave, que convierten el valor numrico del campo clave, en una direccin de almacenamiento particular. Los programas son usados tambin para la localizacin posterior de tales registros. Al usar organizacin directa de archivos pueden localizarse velozmente registros especficos. Por ejemplo, si se desean los datos de un carro particular en un archivo con los carros de una ciudad, puede obtenerse casi instantneamente simplemente suministrando su placa. Sin embargo esta organizacin tiene como desventaja que requiere mayor espacio de almacenamiento en disco. Adems, no es tan apta como la organizacin secuencial de archivos para llevar a cabo un gran nmero de actualizaciones o listar un gran nmero de registros. 3. Organizacin secuencial de ndice: Es una combinacin de las dos organizaciones presentadas, que busca aprovechar las ventajas de ambas. Los registros se van almacenando en orden secuencial, pero este archivo cuenta con un ndice. El archivo ndice enlista las claves de cada grupo de registros almacenados y sus direcciones de disco correspondientes. Cuando se desea buscar un registro particular, la computadora inicia la bsqueda secuencialmente, identificando el principio del grupo de registros. Esta organizacin es ms rpida que la secuencial, pero no lo es tanto como el acceso directo. Es especialmente til cuado se requiere actualizar ocasionalmente grandes lotes de transacciones y se necesita disponer de acceso rpido y frecuente a los datos. Tabla 1.- Ventajas y desventajas de los tipos de organizacin de archivos

Organizacin de Archivos Tipo Secuencial Ventajas Acceso eficiente a todos o gran parte de los datos. Menor uso de espacio de almacenamiento. Acceso rpido a registros especficos. Desventajas Acceso lento a registros especficos. Ineficiente acceso a la totalidad o gran parte de los registros. Mayor uso de espacio de almacenamiento. Menos eficiente que la secuencial, menos rpida que la directa.

Directa

Secuencial de Ms veloz que la secuencial, ms ndice eficiente que la directa.

Ventajas de las bases de datos. Era comn en todas las organizaciones, contar con diferentes archivos sobre una misma persona, evento u objeto. Una empresa comercial por ejemplo, con varios departamentos, como el de ventas, cobranza y crdito, puede contar en cada uno con un archivo donde aparece un registro con los datos de un mismo cliente. Si este cliente cambiase uno de sus datos (su direccin, por ejemplo) se requiere actualizar este dato en los archivos de cada departamento. Si por error se omitiese uno de ellos, causara divergencias que podran causar graves problemas. Tampoco es prctico tener los datos dispersos. Considrese como ejemplo, que uno de los departamentos requiera los datos que maneja otro departamento. Las bases de datos permiten poner a disposicin informacin en su totalidad y actualizada a todos los componentes de la organizacin. Las bases de datos ofrecen mltiples beneficios tanto a las organizaciones como a los individuos: Uniformidad: Si se tienen diversos archivos con la informacin relacionada dentro de la organizacin, es probable que cada uno tenga un formato diferente, lo cual dificulta su comparacin. El uso de bases de datos permite informacin en un formato comn. Seguridad: Los usuarios de la informacin tienen niveles de acceso a los archivos y al tipo de informacin que deban manejar, gestionado mediante el uso de contraseas que establecen sus derechos de usuario. Evitar la inconsistencia y redundancia de datos: Una base de datos permite el uso de archivos compartidos accedidos mediante la red, evitando que cada usuario tenga su propia copia de datos. De este modo se evita la duplicacin de la informacin, es decir, que se almacene en ms de un dispositivo de almacenamiento. Esto disminuye los costos de almacenamiento y evita la inconsistencia de los datos, es decir, diversas copias de un mismo dato que no concuerdan entre si. Integridad de datos: Los valores de los datos almacenados deben satisfacer ciertas restricciones de consistencia. Las restricciones son evaluadas mediante programas que determinan si un campo es adecuado; por ejemplo, evitar que en una fecha se coloque el nombre de una ciudad.

Sistema de administracin de bases de datos. Un sistema de administracin de bases de datos (database management system, DBMS por sus siglas en ingls) es el software que permite la creacin, modificacin y acceso de mltiples usuarios a una base de datos. La principal funcin de un sistema para la administracin de base de datos es recopilar grandes volmenes de datos y procesarlos para obtener informacin til de inters. Una de las ventajas de un Sistema de administracin de bases de datos es su capacidad para el rpido acceso y recuperacin en bases de datos grandes. Dado que el contenido de la base de datos se hace bastante grande, la recuperacin de datos no es cuestin sencilla. Sin embargo, estos sistemas con el apoyo de un hardware adecuado, proporcionan un medio para encontrar en instantes informacin requerida de una base de datos enorme.

El DBMS permite la recuperacin rpida de informacin en grandes bases de datos

Hay una gran cantidad de tareas que puede realizar un sistema de administracin de base de datos, entre las que se encuentran, la creacin y diseo de la base de datos. Pero las tareas de administracin pueden agruparse en una de estas tres categoras: 1. Agregar datos: Se suele contar con formularios que facilitan la entrada de los datos. 2. Clasificar datos: Es posible ordenar datos e incluso realizar algunos clculos sobre los mismos. 3. Obtener subconjuntos de datos: Permiten la consulta de un registro particular o un grupo de registros que cumplan con ciertos criterios. El resultado de una consulta puede tener una salida impresa. Es importante puntualizar que en el mercado existen diferentes categoras de productos (o programas) caracterizados por su capacidad para el manejo de bases de datos, dependiendo de las exigencias y necesidades que se presenten, que van desde programas para uso personal en microcomputadoras, hasta programas para bases de datos muy grandes, como las de las grandes empresas, que se ejecutan en computadoras de gran potencia. Organizacin de sistema de gestin de bases de datos. Una base de datos puede considerarse como un conjunto de datos sobre elementos o hechos que estn lgicamente relacionados entre s y estn organizados bajo una estructura especfica. Losmodelos ms comunes de organizacin de bases de datos son el jerrquico, en red, relacional y orientado a objetos. Base de datos jerrquica: Estructura los campos en nodos en una estructura jerrquica. Los nodos son puntos conectados entre s formando una especie de rbol invertido. Cada entrada tiene un nodo padre, que puede tener varios nodos hijos; esto suele denominarse relacin uno a muchos. Los nodos inferiores se subordinan a los que se hallan a su nivel inmediato superior. Un nodo que no tiene padre es llamado raz, en tanto que los que no tienen

hijos son conocidos como hojas. Cuando se desea hallar un campo en particular, se empieza por el tope, con un nodo padre, descendiendo por el rbol en direccin a un nodo hijo. Un sistema de reservaciones de una lnea area nacional puede ser representado mediante una organizacin jerrquica. El nodo padre es la ciudad de salida (Caracas), este nodo puede tener nodos hijos representando las ciudades destino. Uno de estos nodos hijos, Maracay por ejemplo, tiene a su vez nodos hijos, que son el nmero de vuelo. El nmero de vuelo tendr tambin nodos hijos, que son los pasajeros. Entre las limitaciones de este tipo de base de datos se tiene que al borrar un nodo padre, desaparecen tambin sus nodos subordinados. Slo podr aadirse un nodo hijo, si existe el nodo padre. Pero lo ms significativo es la rigidez de su estructura: slo un padre por hijo y ausencia de relaciones entre los nodos hijos.

Base de datos jerrquica

Base de datos en red: Se trata tambin de una organizacin jerrquica de nodos, pero un nodo hijo puede tener ms de un solo nodo padre (relacin muchos a muchos). Existen los punteros, que son conexiones adicionales entre nodos padres y nodos hijos, que permiten acceder a un nodo por vas distintas accediendo al mismo en direccin descendente por las diversas ramas. Representa una mejora al modelo jerrquico. Los vendedores destacados para distribuir determinados productos en algunas ciudades puede ilustrar este modelo. Cada producto puede ser distribuido por ms de un vendedor, as mismo cada vendedor puede encargarse de diferentes ciudades.

Base de datos en red

Base de datos relacional: Esta organizacin ofrece la mayor flexibilidad ya que los datos se almacenan en tablas diferentes, conformadas as mismo por filas y columnas. Una tabla se denomina relacin. En una tabla las filas contienen los registros. Las columnas representan los campos. Las tablas relacionadas poseen un campo comn, el campo clave, mediante el cual la informacin almacenada en una tabla puede enlazarse con la informacin almacenada en otra. El acceso a los datos se realiza mediante consultas escritas en SQL. La organizacin de bases de datos relacional es la ms difundida en la actualidad motivada a su sencillez para realizar operaciones de adicin, eliminacin y modificacin en contraste con la mayor rigidez de las organizaciones jerrquicas y de red. Por ejemplo en un modelo relacional para un pequeo

negocio, se puede contar con una tabla de clientes y otra de rdenes. Las rdenes que pertenecen a un determinado cliente son identificadas colocando el campo de identificacin del cliente en la orden (campo clave de la tabla de clientes), lo cual permite enlazar las dos tablas.

Base de datos relacional

Bases de datos orientadas a objetos: Es una estructura relativamente nueva que ha suscitado gran inters. El modelo de datos orientado a objetos, es una adaptacin para los sistemas de bases de datos del paradigma de la programacin orientada a objetos. Se basa en el concepto de encapsular elementos de datos, sus caractersticas, atributos y el cdigo que opera sobre ellos en elementos complejos llamados objetos. Los objetos estructurados se agrupan en clases. El conjunto de las clases se estructura en subclases y superclases. Dado que los valores de los elementos de datos tambin son objetos, es posible representar los continentes de objetos, lo que da lugar a objetos compuestos.

El modelo de datos orientado a objetos usa los conceptos de la programacin orientada a objetos

Tipos de bases de datos. Existen algunas caractersticas que permiten tipificar las bases de datos, ya que estas pueden ser pequeas o grandes, o su acceso puede ser limitado o amplio. As pues, es posible establecer cuatro tipos: individuales, compartidas, distribuidas y propietarias. 1. Base de datos individual: Es una base de datos utilizada bsicamente por una persona. El sistema administrador de la base de datos y los datos son controlados por el mismo usuario.

Puede estar almacenada en la unidad de disco duro del usuario o en el servidor de archivos de una red de rea local. Por ejemplo, un gerente de ventas podra contar con una base de datos para el control de sus vendedores y su desempeo. 2. Base de datos compartida: Son bases de datos con mltiples usuarios y que muy probablemente pertenezcan a la misma organizacin, como la base de datos de una compaa. Se encuentra almacenada en una computadora potente y bajo el cuidado de un profesional en el rea, el administrador de la base de datos. Los usuarios tienen acceso a la base de datos mediante una red de rea local o una red de rea extensa. 3. Base de datos distribuida: Segn la naturaleza de la organizacin es probable que los datos no se almacenen en un nico punto, sino que se siten en un lugar o lugares diferentes a donde se encuentran los usuarios. Una base de datos distribuida es la unin de las bases de datos mediante redes. Los usuarios se vinculan a los servidores de bases de datos distantes mediante una amplia variedad de redes de comunicacin. Puede imaginarse una compaa con diferentes oficinas regionales, donde se encuentra distribuida la base de datos. Sin embargo, los ejecutivos pueden tener acceso a la informacin de todas las oficinas regionales. 4. Base de datos propietarias o bancos de datos: Se trata en general de bases de datos de gran tamao, desarrollada por una organizacin y que contiene temas especializados o de carcter particular. El pblico general puede tener acceso a esta base a veces de forma gratuita y otras mediante el pago de una cuota. Pueden ofrecer informacin que va desde negocios, economa, inversin, tcnica y cientfica hasta servicios de entretenimiento. Permiten encontrar en minutos lo que tardara horas ojeando revistas.

Usos y aspectos de las bases de datos. Las bases de datos son de gran utilidad para todos los profesionales, bien si se trata de bases de datos personales, de la empresa o de los bancos de datos que permitan consultas especiales relacionadas con sus campos de trabajo. En todo caso la informacin representa una herramientaque permite realizar el trabajo con diligencia y efectividad, pues admite almacenar y recuperar los datos de manera organizada para contar con ellos en forma oportuna, veloz y confiable.

Las bases de datos son tiles para todos los profesionales

La seguridad de las bases de datos es un asunto vital para las organizaciones que las poseen, motivado al valor e importancia que stas les representan. Un aspecto sobre la seguridad se refiere al uso de la informacin personal y privada sobre los individuos con malos propsitos, como por ejemplo usar expedientes mdicos privados de una persona indebidamente para decisiones de contratacin. Otro aspecto de seguridad es impedir el acceso a usuarios no autorizados a la base

de datos, para evitar la consulta, modificacin o deterioro de los datos, bien sea por impericia o por intenciones maliciosas. La seguridad se intenta implementar utilizando mtodos que van desde limitar el acceso fsico a los servidores de datos, hasta el uso de acceso con contraseas a los sistemas informticos que permiten la identificacin del usuario y definen sus derechos y nivel de acceso a los datos y las operaciones que puede realizar. Las organizaciones de cierta envergadura requieren de los servicios de un administrador de base de datos que es un profesional que se encarga de determinar la estructura de la base de datos compartida, conceder el nivel de acceso y determinar cual seccin de los datos puede consultar, modificar, borrar, agregar y procesar un usuario determinado, que es lo que se denomina asignarderechos de usuario. Otro aspecto del cual es responsable es de mantener la seguridad y privacidad de la base de datos. El almacenamiento y la consulta de datos para obtener informacin de inters se van transformando en la medida que avanza el tiempo en actividades cada vez ms sofisticadas. Las bases de datos cada vez ms apoyan aspectos laborales, de investigacin, educacionales y de entretenimiento. Existen por ejemplo, proyectos de origen privado y pblico en diferentes pases donde se rene informacin de inters turstico sobre ciudades enteras. Esto hace ms cmodo a los turistas su estada determinando hoteles, restaurantes, medios de transporte, adems de informacin de sitios de inters. Desde su aparicin en la dcada de los 50, las aplicaciones de bases de datos se han hecho imprescindibles para las sociedades tecnificadas. Desde entonces, su evolucin ha continuado a la par de la seguida por el software. Puede observarse la tendencia actual y a futuro, de unrefinamiento de herramientas que permiten extraer, de las montaas de datos almacenados en las bases de datos, lo que realmente los usuarios desean, hacindose ms flexibles y personalizables. Estos productos desarrollan tecnologa para el filtrado y exploracin de datos definibles por las condiciones especificas del usuario.

You might also like