Professional Documents
Culture Documents
INTELIGENCIA DE
NEGOCIOS
OLAP, PENTAHO
ARLEN PARRALES
INTELIGENCIA DE NEGOCIOS:
OLAP:
(OnLine Analytical Processing o procesamiento Analítico En Línea)
Los cubos son elementos claves en OLAP, una tecnología que provee rápido acceso a datos
en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar
datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de
datos en el cubo o la complejidad del procedimiento de búsqueda.
OBJETIVO.
Jerarquía:
Estructura que organiza la información desde el nivel más detallado al nivel más general.
Niveles de detalle:
Las bases de datos OLAP organizan los datos por nivel de detalle, utilizando las mismas
categorías que se utilizan para analizar los datos. Por ejemplo, una base de datos de ventas
puede tener campos correspondientes al país, la región, la ciudad y el lugar de cada venta.
Esta información puede organizarse desde el menor al mayor nivel de detalle.
Las bases de datos OLAP se denominan cubos porque combinan varias dimensiones, como
tiempo, geografía y líneas de productos, con datos resumidos, como ventas o cifras de
inventario.
Dimensiones:
El conjunto de niveles que abarca un aspecto de los datos, como las áreas geográficas, se
denomina dimensión. De forma similar, la información del momento en que se hicieron las
ventas podría organizarse en una dimensión temporal con niveles para año, trimestre, mes y
día.
Medidas:
Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Algunas
medidas comunes son Ventas en unidades, ventasen pesos, costo de ventas, gastos, conteo
de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de
los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los
usuarios.
SEGURIDAD
Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services,
usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios
pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que
ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a
la base de datos y al cubo incluyendo a los cubos virtuales.
La seguridad es manejada vía los derechos de control de acceso que son manejados por los
Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de
usuarios con los mismos controles de acceso.
MODOS DE ALMACENAJE
Hay tres formas de almacenar la información de los cubos:
ROLAP
Toda la información del cubo, sus datos, su agregación, sumas etc., son almacenados en
una base de datos relacional. ROLAP no almacena copia de la base de datos, accesa las
tablas originales cuando necesita responder a preguntas, es generalmente, mucho más lenta
que las otras dos estrategias de almacenaje.
Típicamente ROLAP se usa, para largos conjuntos de datos que no son frecuentemente
buscados, tales como datos históricos de de los años mas recientes.
HOLAP
HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es almacenada en
una estructura multidimensional usada por MOLAP, y la base de datos fuentes, en una base
de datos relacional. Para procedimientos de búsqueda que accesan datos sumarizados,
HOLAP es equivalente a MOLAP, por el contrario si estos procesos accesaran datos
fuentes como los drill down, estos deben de buscar los datos en la base de datos relacional y
esto no es tan rápido comparado a si los datos estuvieran almacenados en una estructura
MOLAP.
HOLAP es generalmente usado para cubos que requieren rápida respuesta, para
sumarizaciones basadas en una gran cantidad de datos.
Pentaho Open Source Business Intelligence
PENTAHO es una plataforma de BI “orientada a la solución” y “centrada en procesos”.
Pentaho consiste en una Suite Completa de Inteligencia de negocio que incluye todos los
principales componentes requeridos para implementar soluciones de BI, tales como:
Informes
Dashboards
Cubos OLAP
Procesos ETL
Data integration
Subscripciones
Data Mining
Alertas
La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades
de Análisis de los Datos y de los Informes empresariales. Las soluciones de Pentaho están
escritas en Java y tienen un ambiente de implementación también basado en Java. Eso hace
que Pentaho es una solución muy flexible para cubrir una amplia gama de necesidades
empresariales.
Los módulos de la plataforma Pentaho BI son:
Reporting –
Un modulo de los informes ofrece la solución adecuada a las necesidades de los usuarios.
Pentaho Reporting es una solución basada en el proyecto JFreeReport y permite generar
informes ágil y de gran capacidad. Pentaho Reporting permite la distribución de los
resultados del análisis en múltiples formatos - todos los informes incluyen la opción de
imprimir o exportar a formato PDF, XLS, HTML y texto. Los reportes Pentaho permiten
también programación de tareas y ejecución automática de informes con una determinada
periodicidad.
Análisis –
Navegar y explorar
o Análisis Ad Hoc
o Drill-down
o Seleccionar un especifico miembro para el análisis
Dashboards –
o Monitoreo/Métricas
Seguimiento de excepciones
Data Mining –
Integración de Datos –
Pentaho Data Integration abre, limpia e integra esta valiosa información y la pone en manos
del usuario.
Se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite
implementar los procesos ETL. (Extracción, Transformación y Carga).
El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente difícil de
mantener y de desplegar.