You are on page 1of 6

DATOS GENERALES ASIGNATURA

Denominacin: Minera de datos

Carcter:

Departamento: Ciencia de la Computacin e Int. Artific.

Obligatorio

Crditos: 6

Optativo

Curso: tercero

Unidad Temporal

Anual
Cuatrimestral

Periodo
Primer Cuatrimestre

Rama: Ingeniera y arquitectura

Castellano
Ingls

Euskera

Francs

ndice de experimentalidad

Breve descripcin de contenidos:


Esta asignatura se centra en el campo conocido como data mining o machine
learning en sus trminos anglosajones (minera de datos o aprendizaje
automtico en su terminologa espaola), y que engloba un conjunto de tcnicas
que, inspiradas en la inteligencia artificial y la estadstica clsica, han tenido un
fuerte auge en la ltima dcada para la resolucin de problemas de grandes
volmenes de datos para los cuales la matemtica, estadstica o investigacin
operativa clsicas no ofrecen soluciones eficaces ni eficientes. Sus aplicaciones van
desde campos tan dispares como la bioinformtica o las finanzas, pasando por el
lenguaje natural. La minera de datos es actualmente una de las disciplinas ms en
boga dentro de la inteligencia artificial, y grupos de investigacin y empresas de
todo el mundo trabajan en ella.
El alumno estudiar las principales tcnicas de la minera de datos, as como
adquirir destreza en el uso de paquetes de software libre que implementan dichas
tcnicas. Todo ello ir enlazado con el estudio de aplicaciones reales de dichas
tcnicas. El uso de textos escritos en ingls para la adquisicin del vocabulario
internacional bsico de la minera de datos, ser una constante en la formacin del
alumno.

Segundo Cuatrimestre

Mdulo al que pertenece: Compuitacin

Materia Bsica

Idiomas de imparticin

Plan Director
euskera

Asignaturas slo tericas, sin prctica


Asignaturas que requieren la utilizacin ocasional de ordenadores y/o medios
audiovisuales
Asignaturas que precisan la utilizacin intensiva de ordenadores y/o medios
audiovisuales
Asignaturas en las que se utiliza material fungible y de laboratorio de coste
intermedio

Asignaturas que requieren la utilizacin intensiva de laboratorios y material


fungible de alto coste

Modalidad
Presencial
Semipresencial
Virtual

Especialidades

Denominacin:
Cdigos Unesco:
1203.04, 1209.03

COMPETENCIAS QUE ADQUIERE EL ESTUDIANTE EN LA ASIGNATURA


Competencias de la asignatura

1
2
3
4
5
6
7
8
9
10

Capacidad para conocer y desarrollar tcnicas de minera de datos y aprendizaje computacional y disear
e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extraccin automtica
de informacin y conocimiento a partir de grandes volmenes de datos
Capacidad para comprender un problema real y formalizarlo para su resolucin mediante tcnicas de
anlisis de datos. Capacidad para evaluar la complejidad computacional de un problema, conocer
estrategias algortmicas de anlisis de datos que puedan conducir a su resolucin y recomendar,
desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos
establecidos
Capacitacin en el uso de paquetes de software especializados en anlisis y minera de datos
Adquisicin del vocabulario bsico en ingls de la minera de datos. Capacitacin en la lectura de textos
cientficos bsicos en ingls en el mbito de la minera de datos

Competencias de Mdulo con la(s) que se asocia

C7
C3, C7
C7
C7

DOCENCIA
Tipos de Docencia
M

Magistral

Seminario

PA

Prcticas de Aula

PL

Prcticas de Laboratorio

PO

Prcticas de Ordenador
Horas Totales

Horas
Presenciales

Horas
No Presenciales

Horas
Totales

Competencias de asignatura que se trabajan

40

60

100

1,2,4

20

30

50

1,3,4

60

90

150

SISTEMA DE EVALUACIN
Evaluacin continuada del trabajo del estudiante y las competencias trabajadas (individual y en grupo, presencial y no presencial)
Exmenes
Informes de laboratorio
Tareas dirigidas (Trabajos de mayor complejidad bajo la direccin del profesorado)
Entregables (cuestiones, problemas, trabajos...)
Portafolio
Otros (especificar)

X
X
X
X

TEMARIO
Denominacin:
Tema 1

Introduccin a la minera de datos

Tema 2

El clasificador del vecino ms prximo (k-nearest neighbour)

Tema 3

Tcnicas de evaluacin y validacin de clasificadores

Tema 4

rboles de clasificacin y reglas de decisin

Tema 5

Clasificadores basados en redes Bayesianas

Tema 6

Combinacin de clasificadores

Tema 7

Tcnicas de seleccin de variables

Tema 8

Introduccin a los heursticos de bsqueda y los algoritmos genticos

Tema 9

Clasificacin no-supervisada (clustering)

Descripcin:
Una introduccin a la minera de datos, centrndola en las aplicaciones y casos
de xito, ms que en los algoritmos y tcnicas concretas. Todo ello
relacionando a la minera de datos como una disciplina dentro de la
inteligencia artificial
La intuitiva mecnica de este clsico mtodo de la minera de datos lo hace
apropiado para ser la primera tcnica de clasificacin supervisada que se le
presente al alumno. Se estudiar su funcionamiento bsico, as como sus
principales variantes y parmetros de uso
Estudio de las principales tcnicas de evaluacin de clasificadores, haciendo
especial hincapi en los mtodos de clasificacin supervisada y la estimacin
de la tasa de acierto. Introduccin a los tests estadsticos principales para la
comparacin entre distintos clasificadores
Estudio de estos dos clsicos algoritmos de anlisis de datos, inspirados en la
filosofa del divide y vencers. Se har hincapi en la transparencia y
simplicidad de sus modelos finales, y las posibilidades que esto abre para la
interaccin con expertos de otros campos. Se detallarn distintas posibilidades
de desarrollo (grow) y poda (pruning)
Estudio de la teora bsica subyacente al Teorema de Bayes, relacionndolo
con las posibilidades que ello ha abierto para proponer distintos clasificadores
supervisados basados en redes Bayesianas. Se detallarn modelos de
clasificacin de distinta complejidad
Estudio de las distintas tcnicas para la combinacin de clasificadores. Se har
hincapi en las bondades del consensuado de clasificadores, en
contraposicin al uso de un clasificador nico
Estudio de los conceptos y tcnicas bsicas de seleccin de variables, tanto
desde el punto de vista univariado como multivariado
Se realizar una introduccin a otra disciplina clave de la inteligencia artificial
como los heursticos de bsqueda. Estudio de la tcnica de bsqueda ms
conocida, los algoritmos genticos. Se estudiarn su utilidad para la resolucin
de problemas de seleccin de variables
Estudio de las principales tcnicas de clasificacin no-supervisada. Se har
hincapi en las especiales caractersticas de este tipo de problemas,
diferencindolos de los problemas supervisados

BIBLIOGRAFA
Materiales de uso
obligatorio
-

Bibliografa Bsica

Bibliografa de
Profundizacin

Revistas

I. H. Witten, E. Frank (2005). Data Mining. Practical Machine Learning Tools and Techniques with Java Implementations. Morgan
Kaufmann. (Second edition)
B. Sierra (ed.) (2006). Aprendizaje Automtico: conceptos bsicos y avanzados. Prentice Hall.
E. Alpaydin (2004). Introduction to Machine Learning. MIT Press.
T. Mitchell (1997). Machine Learning. McGraw Hill.
J. Han, M. Kamber (2006). Data Mining: concept and techniques. Morgan Kaufmann. (Second edition)

O. Pourret, P. Nam, B. Marcot (2008). Bayesian networks: a practical guide to applications. Wiley.
L.I. Kuncheva (2004). Combining Pattern Classifiers. Wiley.
H. Liu, H. Motoda (ed.) (2008). Computational Methods of Feature Selection. Chapman & Hall/CRC.
C.M. Bishop (2006). Pattern Recognition and Machine Learning. Springer.
S. Brunak, P. Baldi (2001). Bioinformatics: the machine learning approach. MIT Press. (Second edition).
B. Liu (2006). Web Data Mining: exploring hyperlink, contents and usage data. Springer.

Machine Learning Journal. Springer.


Journal of Machine Learning Research. Electronic publication.
Data Mining and Knowledge Discovery. Springer.
Bioinformatics. Oxford University Press.

Direcciones de inters en
Internet

La asignatura dispondr de pgina web propia mantenida y actualizada por el profesor.


Portal del software de libre distribucin para la minera de datos WEKA: http://www.cs.waikato.ac.nz/ml/weka/
Portal del software de libre distribucin de anlisis estadstico R: http://www.r-project.org/
Portal ms popular acerca de la actualidad en la minera de datos: http://www.kdnuggets.com/
Benchmark de problemas de minera de datos, repositorio UCI (University of California Irvine): http://archive.ics.uci.edu/ml/
El YouTube de los datos en Internet: http://www.swivel.com
Pgina web con aplicaciones intuitivas y de sencilla lectura de la minera de datos:
http://www.sc.ehu.es/ccwbayes/members/inaki/DM-applications.htm
Portal para la realizacin de tests estadsticos on-line: http://faculty.vassar.edu/lowry/VassarStats.html
Portal del software de libre distribucin sobre heursticos de bsqueda LiO: http://www.dsi.uclm.es/simd/SOFTWARE/LIO/
Entrada de Wikipedia al trmino Minera de datos: http://es.wikipedia.org/wiki/Data_Mining
Portales web de las conferencias internacionales anuales en Machine Learning y Data Mining

You might also like