You are on page 1of 7

Lenguaje De Programación

INTELIGENCIA DE
NEGOCIOS
OLAP, PENTAHO

ARLEN PARRALES
INTELIGENCIA DE NEGOCIOS:

OLAP:
(OnLine Analytical Processing o procesamiento Analítico En Línea)

Es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se


realiza en un vector multidimensional.
Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de
una hoja de cálculo.
En un sistema OLAP puede haber más de tres dimensiones, por lo que a los cubos OLAP
también reciben el nombre de hipercubos. Las herramientas comerciales OLAP tienen
diferentes métodos de creación y vinculación de estos cubos o hipercubos.

Los cubos son elementos claves en OLAP, una tecnología que provee rápido acceso a datos
en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar
datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de
datos en el cubo o la complejidad del procedimiento de búsqueda.

Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado


dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de
negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de
respuesta de las complejas consultas.

OBJETIVO.

Análisis multidimensional intuitivo.

Divide información en dimensiones y las organiza en jerarquías.

Se puede analizar el negocio desde distintas perspectivas.


CONCEPTOS BÁSICOS:

Jerarquía:

Estructura que organiza la información desde el nivel más detallado al nivel más general.

Niveles de detalle:

Las bases de datos OLAP organizan los datos por nivel de detalle, utilizando las mismas
categorías que se utilizan para analizar los datos. Por ejemplo, una base de datos de ventas
puede tener campos correspondientes al país, la región, la ciudad y el lugar de cada venta.
Esta información puede organizarse desde el menor al mayor nivel de detalle.

Las bases de datos OLAP se denominan cubos porque combinan varias dimensiones, como
tiempo, geografía y líneas de productos, con datos resumidos, como ventas o cifras de
inventario.

Dimensiones:

El conjunto de niveles que abarca un aspecto de los datos, como las áreas geográficas, se
denomina dimensión. De forma similar, la información del momento en que se hicieron las
ventas podría organizarse en una dimensión temporal con niveles para año, trimestre, mes y
día.

Medidas:
 
Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Algunas
medidas comunes son Ventas en unidades, ventasen pesos, costo de ventas, gastos, conteo
de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de
los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los
usuarios.

SEGURIDAD

Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services,
usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios
pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que
ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a
la base de datos y al cubo incluyendo a los cubos virtuales.
 
La seguridad es manejada vía los derechos de control de acceso que son manejados por los
Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de
usuarios con los mismos controles de acceso.
MODOS DE ALMACENAJE
 
Hay tres formas de almacenar la información de los cubos:

1.- MOLAP - Multidimensional OLAP.


2.- ROLAP - Relacional OLAP.
3.- HOLAP - OLAP híbrido.
 
MOLAP
 
Los datos fuente del cubo son almacenados junto con sus agregaciones (sumarizaciones) en
una estructura multidimensional de alto rendimiento. El almacenaje de MOLAP, provee
excelente rendimiento y compresión de datos. Como se dice, todo va en el cubo. En general
este método, es muy apropiado para cubos con uso frecuente por su rápida respuesta.

ROLAP
 
Toda la información del cubo, sus datos, su agregación, sumas etc., son almacenados en
una base de datos relacional. ROLAP no almacena copia de la base de datos, accesa las
tablas originales cuando necesita responder a preguntas, es generalmente, mucho más lenta
que las otras dos estrategias de almacenaje.
 
Típicamente ROLAP se usa, para largos conjuntos de datos que no son frecuentemente
buscados, tales como datos históricos de de los años mas recientes.

HOLAP
 
HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es almacenada en
una estructura multidimensional usada por MOLAP, y la base de datos fuentes, en una base
de datos relacional. Para procedimientos de búsqueda que accesan datos sumarizados,
HOLAP es equivalente a MOLAP, por el contrario si estos procesos accesaran datos
fuentes como los drill down, estos deben de buscar los datos en la base de datos relacional y
esto no es tan rápido comparado a si los datos estuvieran almacenados en una estructura
MOLAP.
 
  HOLAP es generalmente usado para cubos que requieren rápida respuesta, para
sumarizaciones basadas en una gran cantidad de datos.
Pentaho Open Source Business Intelligence
PENTAHO  es una plataforma de BI “orientada a la solución” y “centrada en procesos”.
Pentaho consiste en una Suite Completa de Inteligencia de negocio que incluye todos los
principales componentes requeridos para implementar soluciones de BI, tales como:

 Informes   
 Dashboards
 Cubos OLAP 
 Procesos ETL 
 Data integration 
 Subscripciones
 Data Mining      
 Alertas

La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades
de Análisis de los Datos y de los Informes empresariales. Las soluciones de Pentaho están
escritas en Java y tienen un ambiente de implementación también basado en Java. Eso hace
que Pentaho es una solución muy flexible para cubrir una amplia gama de necesidades
empresariales.
Los módulos de la plataforma Pentaho BI son:
 Reporting –

Un modulo de los informes ofrece la solución adecuada a las necesidades de los usuarios.
Pentaho Reporting es una solución basada en el proyecto JFreeReport y permite generar
informes ágil y de gran capacidad. Pentaho Reporting permite la distribución de los
resultados del análisis en múltiples formatos - todos los informes incluyen la opción de
imprimir o exportar a formato PDF, XLS, HTML y texto. Los reportes Pentaho permiten
también programación de tareas y ejecución automática de informes con una determinada
periodicidad.

 Análisis –

Pentaho Análisis suministra a los usuarios un sistema avanzado de análisis de información.


Ayuda a operar con  máxima efectividad para ganar perspicacia y entender lo necesario
para tomar optimas decisiones.
Las características generales son:

 Vista dimensional de datos (por ventas, por periodo)

 Navegar y explorar

o Análisis Ad Hoc

o Drill-down
o Seleccionar un especifico miembro para el análisis

 Interactuar con alto rendimiento

o Tecnología optimizada para rápida respuesta interactiva.

 Dashboards –

Provee inmediata perspicacia en un rendimiento individual, departamental o empresarial.


Para deliberar key metrics en una atractiva e intuitiva interfaz visual, Pentaho Dashboards a
los usuarios de los negocios información critica que necesitan para entender y mejorar el
rendimiento organizacional.

 Identificación de unas Métricas Clave (KPI’s, Key Performance Indicators)

o Monitoreo/Métricas

 Investiga detalles subyacentes

o Drill a reportes de soporte

 Seguimiento de excepciones

o Alertas basadas en reglas del negocio

 Data Mining –

Análisis en Pentaho se realiza con una herramienta WeKa.


Es el proceso de correr datos en algoritmos completamente sofisticados, relevando
significantes patrones  y correlaciones que pueden estar escondidos. Esto puede ser usado
para ayudar a entender lo mejor para el negocio y explotar el rendimiento de este en un
futuro prediciendo completamente en el análisis.

 Integración de Datos –
Pentaho Data Integration abre, limpia e integra esta valiosa información y la pone en manos
del usuario.
Se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite
implementar los procesos ETL. (Extracción, Transformación y Carga).
El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente difícil de
mantener y de desplegar.

You might also like