Professional Documents
Culture Documents
“DATA MINING”
ORANGE
OBJETIVO
01/03/16
COLOMBIA-MEDELLÍN
2016
Introducción:
Contextualización
Orange es una suite de software para minería de base de datos y aprendizaje automático
basado en componentes que cuenta con un fácil y potente, rápido y versátil front-end de
programación visual para el análisis exploratorio de datos y visualización, y librerías para
Python y secuencias de comando. Contiene un completo juego de componentes para pre
procesamiento de datos, característica de puntuación y filtrado, modelado, evaluación del
modelo, y técnicas de exploración. Está escrito en C++ y Python, y su interfaz gráfica de
usuario se basa en la plataforma cruzada del framework Qt.
Cada base de datos se compone de una o más tablas que guarda un conjunto de
datos. Cada tabla tiene una o más columnas y filas. Las columnas guardan una
parte de la información sobre cada elemento que queramos guardar en la tabla,
cada fila de la tabla conforma un registro.
Adicional
Orange consiste en una interfaz de lienzo sobre el cual el usuario coloca los
widgets y crea un flujo de trabajo de análisis de datos. Widgets ofrecen
funcionalidades básicas como la lectura de los datos, mostrando una tabla de
datos, selección de características, predictores de entrenamiento, comparando
algoritmos de aprendizaje, visualización de elementos de datos, etc.. El usuario
puede explorar visualizaciones interactivamente o alimentación del subconjunto
seleccionado en otros widgets. Widget de árbol de clasificación en naranja 3.0
lona: gráfica front-end para el análisis de datos Widgets: datos: widgets para
entrada de datos, filtrado de datos, muestreo, imputación, cuentan con
manipulación y ofrecen selección visualiza: widgets para visualización (diagrama
de caja, histogramas, diagrama de dispersión) y multivariante visualización
(pantalla de mosaico, diagrama de tamiz). Clasificar: un conjunto de
supervisión algoritmos de aprendizaje de máquina para la clasificación regresión:
supervisado de un conjunto de algoritmos de aprendizaje de máquina para evaluar
la regresión: procedimientos de validación cruzada, basada en el muestreo,
estimación de la fiabilidad y puntuación de métodos de predicción de supervisión:
•sin aprender algoritmos de clustering (k-means, clustering jerárquico) y técnicas
de proyección de datos (escalamiento multidimensional, análisis de componentes
principales, análisis de correspondencias). Complementos: Bioinformática:
widgets para gene establecer análisis, enriquecimiento y acceso a la fusión de
datos de bibliotecas vía: widgets para diferentes conjuntos de datos, factorización
de la matriz colectiva y exploración de la minería de texto factores latentes de
fusión: widgets para tareas básicas de la red de minería de texto: widgets para el
análisis gráfico y red asociada: widgets para la minería frecuentan aprendizaje
regla itemsets y Asociación