Professional Documents
Culture Documents
EN EL MEDIO NATURAL
Técnicas de obtención y análisis de datos
3.- Minería y análisis de datos con WEKA.
Juan Navas Ureña
Departamento de Matemáticas
Universidad de Jaén
http:/matema.ujaen.es/jnavas
TEMA 1
Modelos matemáticos discretos en biología de campo
1.- Modelos basados en ecuaciones en diferencias
• La sucesión de Fibonacci.
• Ecuaciones en diferencias.
• Sistemas dinámicos discretos
• Puntos de equilibrio.
• Análisis geométrico. Diagramas de Cobweb
• Modelos nolineales. La ruta hacia el caos
• La geometría fractal
2.- Modelos basados en sistemas de ecuaciones en diferencias
• Modelos matriciales de Leslie y Markov.
• Análisis de datos a través de las tablas de vida y los modelos
matriciales.
• Desarrollo, análisis e interpretación de los modelos matriciales
demográficos matriciales para biología de campo.
FICHEROS .arff
• WEKA trabaja con un formato denominado arff , acrónimo de Attribute-
Relation File Format. Este formato está compuesto por una estructura
claramente diferenciada en tres partes:
Comentario
Nombre archivo
Cabecera
Declaraciones de atributos
Sección de datos
WEKA
Para generar
gráficos con los
datos del ejemplo,
se seleccionará la
pestaña Visualize.
Por defecto, se
muestran gráficos
para todas las
combinaciones de
atributos tomadas
dos a dos, de
modo que se
pueda estudiar la
relación entre dos
atributos
cualesquiera
ALGORITMOS DE CLASIFICACIÓN
EL ALGORITMO J48
• La poda de árboles
• La especificación de factores de confianza para la poda
• La especificación de un mínimo de instancias en las hojas
• La poda de árboles con error reducido
• La especificación del número de datos en podas con error reducido
• El uso de particiones binarias en atributos nominales
Se seleccionará la
pestaña Classify y se
elegirá un clasificador
pulsando el botón
Choose. Aparecerá
una estructura de
directorios en la que
se seleccionará el
directorio trees y
dentro del él el
algoritmo J48. Se
mantendrán las
opciones por defecto
del clasificador
El resto de
opciones para el
experimento
también se
mantendrán en los
valores por
defecto: activa la
opción de test
‘cross validation’ e
inactivas las
restantes. Para
generar el árbol se
pulsará Start.
También es posible
visualizar el árbol de
decisión de una forma más
legible. Para ello se debe
hacer clic con el botón
derecho en la ventana de
resultados, sobre el
resultado de la generación
del árbol. Aparecerá un
menú desplegable: Y dentro
de ese menú se deberá
seleccionar la opción
‘Visualize tree’.
• Crear un fichero para WEKA con datos sobre la posibilidad de fallo de una
máquina en función de ciertos atributos medidos: vibraciones,
temperatura, tiempo desde la última revisión y horas de funcionamiento.
• Crear un fichero para WEKA con datos sobre la posibilidad de fallo de una
máquina en función de ciertos atributos medidos: vibraciones,
temperatura, tiempo desde la última revisión y horas de funcionamiento.