You are on page 1of 2

PROCEDIMIENTO

Se inicializa un nuevo script en Matlab, se limpia el registro y procede a hacer


efectiva la regresión logística, lo primero que se hace es cargar la base de datos en
el programa principal el cual se llamará main.m usando el comando:
data=load('wdbc.data').
El paso a seguir es normalizar la base de datos para que el esquema existente se
modifique y al ejecutar el programa la base de datos se encuentre entre ceros y
unos para ello se utiliza la función llamada normalizar.m a la que se le va a indicar
lo anteriormente descrito así: data_n= normalizar(data) para hacer esto hay que
aplicar la siguiente formula:
𝑉𝑁=𝑉𝑆𝑁−𝑉𝑚𝑖𝑛𝑉𝑚𝑎𝑥−𝑉𝑚𝑖𝑛

Luego de esto creamos una función llamada Cross_val.m para hacer un proceso de
validación cruzada, que nos servirá para saber qué tan bueno es el algoritmo,
nombrándola en el programa principal así:
[Xtrain,Xval,Ytrain,Yval]=Cross_val(X,Y);
Con esto se consigue que de la base de datos el 70% serán las muestras para
entrenar y el 30% restante serán las muestras para validar.

Seguidamente se seleccionan las variables X y Y que son las muestras que se van
a entrenar y a validar, para la variable Y se tienen en cuenta los resultados ya
entregados en la base de datos sobre si el tumor encontrado en los pacientes es
benigno o maligno, y para la variable X se tienen en cuenta todos los atributos
entregados en la base de datos.
---------------CREO QUE FALTA MENCIONAR MÁS SOBRE ESTO-------

Se realiza gradiente descendente (Clasificación) para encontrar nuevos w que


harán óptima la función de costo usando la función grad_des.m y la ecuación:
FALTA PONER LA ECUACION DE GRADIENTE
Seguidamente se ejecuta nuevamente la función de costo pero lógicamente con los
w que hacen optimo el resultado encontrando así el resultado el óptimo global.

Ahora bien para llevar a cabo la predicción se hace uso de una propiedad de la
hipótesis conocida como barrera de decisión (Decisión Boundary)
COMPROBAR QUE SI SEA LA ECUACION
hw(x)=G(w0+w1x1+w2x2)
La cual dice que si este resultado es ‘uno’ entonces la barrera de decisión va a ser
mayor o igual a 0.05 como es propuesto en la función pred.m; esto con el fin de
encontrar valores de y=0 y y=1 ya que en la predicción se analiza que es 1 si el
tumor es maligno y es 0 si es benigno.

Finalmente se procede a calcular la exactitud, sensibilidad y especificidad. Donde:


Exactitud: NO ENCONTRE UNA DEFINICION PRECISA ASI QUE NO SÉ QUE
PONER
Sensibilidad: Probabilidad que tiene un algoritmo de clasificar correctamente a las
personas que padecen cáncer de seno, se realiza utilizando la ecuación:
Sensibilidad=VP(VP+FN)

Especificidad: Probabilidad que tiene un algoritmo de clasificar correctamente a las


personas sanas, se realiza utilizando la ecuación:
Especificidad=VP(VN+FP)

You might also like