Professional Documents
Culture Documents
Integrantes:
Medrano Gomez Jefferson David
Rivera Enrquez Jenny Cecilia
Tandazo Jimenez Karla Cecibel
Zambrano Tello Carlos Alberto
1. Objetivo General
1. Objetivos especficos.
1. PENTAHO
Pentaho se encuentra en el cuadrante de Garner en los Visionarios, este ao fue
calificado como visionario por ser un jugador ms en el espacio de Big Data y el IoT
(Internet of things, que es un concepto que se refiere a la interconexin digital de
objetos cotidianos con internet). Sus prioridades se enfocan en grandes proyectos de
datos y el IoT, sin dejar de tener una fuerte presencia en el OEM (fabricante de
equipamiento original) y el mercado de BI
1. DESARROLLO
PROYECTO
1.
DEL
Modelo Dimensional
Ventajas
Entorno grfico de desarrollo
Uso de tecnologas estndar: Java, XML, JavaScript
Fcil de instalar y configurar
Multiplataforma: windows, macintosh, linux
Basado en dos tipos de objetos: Transformaciones (coleccin de pasos en un proceso
ETL) y trabajos (coleccin de transformaciones)
Incluye cuatro herramientas:
Spoon:para disear transformaciones ETTL usando el entorno grfico
PAN:para ejecutar transformaciones diseadas con spoon
CHEF:para crear trabajos
Kitchen:para ejecutar trabajos
Descubrir patrones ocultos y correlacinales en los datos
Prevenir eventos futuros basados en patrones histricos
Contar con la tecnologa de:
Poderoso motor de Data Mining
Ventajas
Contar con la tecnologa de:
Poderoso motor de Data Mining
Herramientas de Diseo Grafico
Seguridad y conformidad
Servicios Web, Repositorios y definiciones basadas en XML
Rendimiento y escalabilidad
Potente motor de ETL
Trabajo con variedad de fuentes de datos
Las capacidades de la plataforma abarcan desde la integracin de datos con PDI hasta
la analtica avanzada con Weka y la integracin con. R.
El acceso a los datos y la integracin es la principal razn para la adopcin de
Pentaho.
Costo de la licencia y la funcionalidad son otras dos razones para adoptar Pentaho.
Desventajas
En experiencia de cliente, Pentaho esta por debajo de la media del proveedor en
cuanto a beneficios alcanzados del negocio, acceso y habilitacin de usuarios y
disponibilidad de recursos especializados en el mercado.
Componentes Pentaho
Table Input
Este ejecuta la sentencia SQL, la cual trae los datos de la base origen los cuales sern usados para
la carga del Data Mart
Con esta herramienta se puede obtener algunos datos del sistema que servirn para la tabla de
auditora.
Dimension lookup/update
Indicadores
El paso Grid de datos permite introducir una lista esttica de filas en una cuadrcula aqu
ponemos los indicadores que nosotros definimos.
Insert/Update
Gererar Fecha
Generamos 10 mil veces un valor del tipo fecha, con el valor 20050101, que corresponde a la
fecha inicial que queremos procesar. Esta fecha es el punto de partida de la generacin de toda la
secuencia de fechas has
Aadir 1 dia:
con un paso del tipoAdd Secuencegeneramos un valor nmerico, que empieza por 1, y
que se va incrementando en cada ejecucin
Ordena Valores:
con el pasoSelect / Rename values, seleccionamos los campos que queremos pasar al
siguiente paso, y el orden
Calculo de Textos:
con un paso del tipoFormula, calculamos algunos campos ms, como el identificador de la
semana y su descripcin, el mes, el dia de la semana,
CONCLUSIONES
Kimball proporciona un conjunto de conocimientos que aseguran y modelan una
serie de acciones para el desarrollo ptimo de un Data warehouse por versatilidad,
enfoque ascendente y renovador, gracias a su mantenimiento constante e
intercambio de informacin con los usuarios finales por medio de las herramientas
de BI y todos los documentos que se manejan en el anlisis final de datos.
Un buen diseo del Data Warehouse puede optimizar las consultas reflejadas en
tiempos de respuesta obteniendo datos relevantes para el anlisis del negocio. En
un Data Warehouse a diferencia de una base de datos Transaccional no es posible
realizar un CRUD. El proceso de extraccin, transformacin y carga es ejecutado
mediante un proceso ETL