Professional Documents
Culture Documents
Por
Ket-ziquel Hernández Guadarrama
Asesor
Dr. Jesús A. González Bernal
Coordinación de Ciencias Computacionales
INAOE
Coasesor
MIA. Oscar Edgardo Romero Arredondo
Facultad de Ciencias de la Computación
BUAP
Resumen.
Tareas como análisis de sangre, análisis de tejidos, análisis de sustancias entre otras,
están relacionadas con el uso e interpretación de imágenes que contienen partículas, estas
tareas son realizadas por expertos humanos. Cuando las imágenes presentan condiciones de
iluminación, tinsión, ópticas diferentes, o se tiene la tarea de estudiar un gran número, el trabajo
de analizarlas se vuelve tedioso, monótono y propenso a errores. Para poder automatizar las
tareas relacionadas con el uso de imágenes con partículas, resulta necesario desarrollar
algoritmos de análisis de imágenes que sirvan como herramientas para el analista humano.
Las aplicaciones de análisis de imágenes que hacen uso de la segmentación, se sabe que
este es un proceso fundamental, ya que esto equivale a realizar funciones preceptúales
parecidas a las del ser humano, en donde se distinguen los diferentes objetos que forman a una
imagen, esto supone la capacidad de extraer a los objetos interesantes.
En éste trabajo se presenta un algoritmo de segmentación por agrupamiento, aplicado a la
caracterización de glóbulos blancos, a pesar de las condiciones tan diferentes entre las muestras
(tipo de iluminación, características de la partícula, ausencia o presencia de ruido, tipo de
tinción), este algoritmo es capaz de extraer correctamente a los glóbulos blancos para
posteriormente, realizar sobre ellos la extracción y el análisis de sus características.
El algoritmo aquí propuesto esta estructurado en tres etapas:
1 Mejora de imágen
2 Segmentación por K-means
3 Segmentación por umbralización
Para la primera parte se hace una mejora a la imágen original, esta mejora consiste en
eliminar píxeles de la imagen que no cumplan con características establecidas y que son
explicadas en el capitulo 3, el resultado de esta mejora es una imagen que en su histograma
presenta tres picos relevantes los cuales son de gran utilidad en la siguiente etapa.
La segunda etapa esta basada en el algoritmo de segmentación K-means, la idea en esta
parte es adaptar este algoritmo para el dominio de imágenes de medula ósea.
La tercera parte esta basada en la segmentación por umbralización, esta etapa solo será
usada en caso de que la imágen de salida de la etapa dos no sea segmentada correctamente, es
decir, que se tengan células distintas a los glóbulos blancos, la idea es hacer a este nuevo
algoritmo más robusto a los cambios de tinción en las imágenes.
Para evaluar el rendimiento del algoritmo propuesto se abordaron varios tipos de tinciones
(azulaceas, rosadas, rojas, violetas, moradas), todos con condiciones totalmente diferentes entre
sí, aunque existen características que prevalecen en todos los casos, como la presencia de
regiones de interés (glóbulos blancos), un fondo y glóbulos rojos.
Los resultados obtenidos y presentados en esta tesis se obtuvieron haciendo un análisis
visual de las regiones segmentadas, también se hace una comparación visual entre la
segmentación realizada por la herramienta de procesamiento de imágenes ImageJ y la
segmentación realizada por el algoritmo aquí propuesto, finalmente se presentan porcentajes de
error en la segmentación. En todos los casos de evaluación los resultados obtenidos
demostraron que el algoritmo segmenta de manera eficaz las regiones de interés (glóbulos
blancos).
III
Abstract.
Tasks like analysis of blood, weave analysis, analysis of substances among others, are
related to the use and interpretation of images that contain particles, these tasks are made by
human experts. When the images present different conditions of illumination, coloration, optical,
or the task is had of studying a great number, the work to analyze them becomes tedious,
singsong and prone to errors. In order to be able to automate the tasks related to the use of
images with particles, it is necessary to develop algorithms of analysis of images that serve like
tools for the human analyst.
In applications of analysis of images that make use of the segmentation, one knows that
this it is a fundamental process, since this is equivalent to make preceptúales functions similar to
those of the human being, in where the different objects are distinguished which they form to an
image, this supposes the capacity to extract the interesting objects.
This work presents an algorithm of segmentation by group, applied to the white globule
characterization appears, in spite of the so different conditions between the samples (type of
illumination, characteristics of the particle, absence or presence of noise, type of tinción), this
algorithm is able to extract correctly to white globules for later, to make on them the extraction
and the analysis of its characteristics.
The algorithm proposed this structured in three stages here:
1 Improvement of image
2 Segmentation by K-means
3 Segmentation by umbralización
For the first part an improvement to the original image becomes, this improvement consists
of eliminating píxeles of the image that does not fulfill established characteristics and that are
explained in capitulate 3, the result of this improvement is an image that in its histogram presents
three excellent tips which are very useful in the following stage.
The second stage this cradle in the algorithm of K-means segmentation, the idea in this
part is to adapt this algorithm for the dominion of images of medula bony.
The third part this cradle in the segmentation by umbralización, this single stage will be
used in case that the image of exit of the stage two is not segmented correctly, that is to say,
which cells different from white globules are had, the idea is to do to this new more robust
algorithm to the changes of coloration in the images.
In order to evaluate the yield of the proposed algorithm several types of colorations were
approached (blue, pink, red, violet, dwelled), all with totally different conditions to each other,
although characteristics exist that prevail in all the cases, as the presence of interest regions
(white globules), a red bottom and globules.
The results obtained and presented in this thesis were obtained making an analysis visual
of the segmented regions, also is made a visual comparison between the segmentation made by
the tool of image processing ImageJ and the segmentation made by the algorithm proposed here,
finally percentage of error in the segmentation appear.
IV
Agradecimientos.
A Dios:
Muchísimas gracias por todas las bendiciones que me has dado, por darme la fuerza
necesaria en todo momento, por guiar mis pasos por el camino correcto, por darme a los padres
que tengo, te agradezco por todo lo que soy y por todo lo que tengo, gracias por permitirme
terminar un proyecto más de mi vida, gracias por estar siempre conmigo.
A mi mamá:
Por quererme mucho, por cuidarme, por enseñarme a ser fuerte, por apoyarme siempre
en todo, por tus consejos, por estar conmigo siempre, en estas hojas no cabria todo lo que tengo
que agradecerte pero lo que si puedo decir es que gracias a ti estoy aquí y que sin tu apoyo esto
no seria posible.
A mi papá:
Por que has sido un ejemplo de nobleza, bondad, paciencia y humildad, por apoyarme
siempre, por tus consejos, por ser cariñoso, y podría seguir escribiendo pero no acabaría, así
que solo te digo GRACIAS papá por todo lo que me has enseñado y por quererme tanto.
A mis hijas:
Por hacerme feliz cada día.
A mi hermana:
Porque se que desde donde estas siempre me ves y si hay un ángel que me cuida y esta
con migo ese eres tu.
A Julio:
Por estar conmigo, por siempre tener disposición en ayudarme y dispersar mis dudas, por
echarme porras, muchas gracias por todo.
A Bere:
Gracias amiga por recorrer esta recta final conmigo, y pronto las dos estaremos en la
meta.
Al M. Oscar Romero:
Por ser el culpable de que me guste todo lo relacionado con el procesamiento de
imágenes digitales ya que un buen maestro siempre logra captar el interés de sus alumnos,
gracias por su enseñanza en las aulas, su orientación y apoyo durante el desarrollo de este
trabajo.
Al Dr. Jesús A. Bernal:
Por su amabilidad, confianza, apoyo, cooperación en todo momento y todas sus
atenciones, por brindarme la oportunidad de desarrollar este trabajo.
Gracias a quienes de una u otra manera me han ayudado y me han transmitido su
conocimiento.
V
Dedicatoria.
A mis padres:
Con cariño y admiración a mis padres; por su cariño, sacrificio, esfuerzo, enseñanzas,
orientación, apoyo y ejemplo, por brindarme un hogar cálido y enseñarme que la perseverancia y
el esfuerzo son el camino para lograr objetivos.
A ambos, por sus cuidados y por creer en mí. No pudiendo expresar todo lo que siento por
ustedes, solo digo GRACIAS, éste trabajo también es de ustedes.
VI
Índice.
Resumen II
Abstract III
Agradecimientos IV
Dedicatoria V
Índice. VI
Capítulo 2
Capítulo 3
Capítulo 4
Capítulo 1. Introducción.
El procesamiento de imágenes en color está motivado por dos factores, en primer lugar,
por una similitud con la visión humana totalmente cromática, y en segundo lugar por que el
análisis de imágenes proporciona información mas detallada que el ojo humano, este campo ha
cobrado mucha atención en los últimos años, en el área de la medicina, fisiología y biología, en
el tratamiento de imágenes digitalizadas correspondientes a muestras bio-médicas como tejidos
musculares, cerebrales y otras, que requieren de la creación de herramientas que ayuden al
usuario (médico, biólogo, fisiólogo, etc.) tanto en el diagnóstico como en el tratamiento clínico.
La visión por computadora estudia los métodos que permiten recibir información,
procesarla y tomar decisiones, produciendo resultados finales que son de utilidad para el
hombre, algunas tareas a las que la visión por computadora da solución son; seguir un objeto en
movimiento, determinar la distancia de un objeto, caracterizar células en imágenes médicas,
caracterizar objetos macrométricos y milimétricos, identificar patrones.
La segmentación consiste en separar una imágen digital en los objetos que la forman, un
adecuado método de segmentación es la clave para el correcto análisis y procesamiento de
imágenes.
El proceso de segmentación de imágenes es uno de los pasos en el procesamiento
automático de imágenes más difícil, ya que encontrar un algoritmo de segmentación universal,
válido para todo tipo de aplicaciones, seria muy difícil, esto se debe a que cualquier problema
que se pueda resolver usando la segmentación tiene necesidades particulares, por ello, no se ha
desarrollado ningún método estándar para el proceso de segmentación. Lo que existe es una
colección de métodos con un cierto grado de popularidad y que funcionan bajo ciertas
condiciones.
Diversas aplicaciones para caracterizar partículas (leucocitos, hepatocitos, astrocitos), han
sido desarrolladas, sobre todo en los últimos años, algunas enfocadas al conteo, medición y
seguimiento de objetos. En todos ellos, el principal problema a resolver es el proceso de
segmentación. Factores como el ruido, cambios en la iluminación, sensor, óptica entre otros
hacen de esta tarea un proceso nada trivial.
Cuando un individuo tiene leucemia, la médula ósea, por razones que aún se desconocen,
comienza a fabricar glóbulos blancos que no maduran correctamente, pero que continúan
reproduciéndose. Las células normales, sanas, únicamente se reproducen cuando hay suficiente
espacio para ellas y el cuerpo puede regular la producción de células al enviar señales para
2
parar dicha producción, cuando se sufre de leucemia, dichas células no responden a las señales
de cesar la reproducción, aunque ya no haya espacio para ellas.
La leucemia puede manifestarse a cualquier edad, aunque es más frecuente en los niños
entre 2 y 6 años de edad. Esta enfermedad se presenta con una frecuencia ligeramente mayor
en los varones que en las mujeres y es más común en niños caucásicos que en niños africano-
americanos o de otras razas [1].
Las células madre maduran como células linfoides o células mieloides. A su vez, las
células linfoides maduran como linfocitos B o linfocitos T. Si la leucemia se presenta en alguna
de estas células, se denomina leucemia mielógena aguda (ALL). Si la leucemia se detecta en
una etapa más avanzada del desarrollo de las células, puede clasificarse tanto como ALL de
células B o ALL de células T. Cuanto más avanzada sea la etapa de maduración de las células
madre, más difícil será el tratamiento [3].
El primer paso para la detección de leucemia es por medio de una biometría hemática.
Una Biometría Hemática, es un estudio que arroja cantidades y porcentajes de los diferentes
tipos de células en la sangre (glóbulos rojos, glóbulos blancos y plaquetas).
Si al realizar este estudio se detecta una anormalidad en los porcentajes de los glóbulos
blancos o existe la presencia de blastos, se procede a un análisis morfológico de las células a
través de la observación de un frotis de sangre por medio de un microscopio óptico, a esta
técnica de analizar las células a través de un microscopio se le llama “Microscopía Óptica”.
Si se determina a partir del análisis morfológico que el paciente padece de una leucemia
linfoblástica o mieloblástica se realiza un examen de inmunofenotipo por citometría de flujo para
confirmar el padecimiento y saber el subtipo de leucemia que afecta al paciente y dependiendo
de este resultado, será el tipo de tratamiento de quimioterapia que se le proporcionará [19].
La fase del análisis morfológico requiere de una detallada observación de los frotis por
parte de expertos, sabemos que la capacidad de observación del ojo humano puede estar
limitada por diversos factores tales como el cansancio, estrés, condiciones en el entorno etc.,
que obstaculizan la identificación de detalles importantes que no favorezcan a la detección de
leucemia, por lo que este estudio resultaría ser vulnerable a errores y por lo tanto llegar a un
diagnostico no tan certero.
Por otra parte para tener un buen control médico sobre leucemia, es necesario que los
pacientes sean sometidos a análisis moleculares que determinan la expresión normal o anormal
de la enfermedad, criterio bajo el cual se define el seguimiento o modificación del esquema del
tratamiento, estos estudios son muy costosos y deben repetirse por lo menos cada tres o cuatro
meses a lo largo del año en que se detecto la este trastorno, lo que significa una erogación
importante para las instituciones de salud y para el enfermo.
Por lo anterior surge la necesidad de contar con herramientas que ayuden al quehacer de
los médicos y químicos para el análisis morfológico de los frotis que permitan determinar si el
paciente padece de un tipo de leucemia. Una alternativa para el desarrollo de estas herramientas
es el uso de las computadoras, las cuales ofrecen ventajas como velocidad, capacidad de
almacenamiento y un alto nivel de procesamiento.
4
1.1.1 Motivación
La detección de leucemia durante mucho tiempo se ha hecho con métodos manuales, y
requieren de la supervisión de expertos tanto químicos para la preparación de las muestras
como médicos para la evaluación y diagnóstico, en este proceso la observación se lleva a cabo
por el método tradicional de evaluación manual, de este punto se presentan problemas tales
como contratar personal especializado en identificación de esta enfermedad, es un proceso
manual, cansado, tardado y costoso.
Debido a esto, los hospitales que cuentan con un citómetro de flujo en la mayoría de los
casos omiten el análisis morfológico de las células y de la Biometría Hemática y pasan
directamente al análisis por citometría
El problema es que el citómetro de flujo es un equipo con un costo elevado, por lo que
muy pocos hospitales cuentan con el. Por lo anterior, en la gran mayoría de los laboratorios u
hospitales realizan un análisis morfológico de las células como un primer filtro para la detección
de leucemias u otras patologías [19].
En este proyecto existen requerimientos específicos que si bien nos permiten usar
algoritmos o herramientas ya existentes proporcionando un resultado parcialmente bueno, es
decir, que de un conjunto de imágenes no siempre devuelve la región de interés (glóbulos
blancos), por lo que es necesario desarrollar un procedimiento bajo el dominio de imágenes con
leucemia Mieloblástica Aguda y Leucemia Linfoblástica Aguda (glóbulos blancos).
5
1.1.2 Objetivos
El Objetivo General de este trabajo de investigación es:
Elaborar un método para segmentar automáticamente células de leucemia
Mieloblástica Aguda y Leucemia Linfoblástica Aguda en base al algoritmo de
clasificación k-means a partir de imágenes digitales de médula ósea.
1.1.3 Aportaciones
Implementación y adaptación del algoritmo k-means para la segmentación de
imágenes de muestras de medula ósea con leucemia.
La base para el desarrollo de una herramienta de apoyo al diagnóstico médico para
la identificación de leucemia.
lo necesite se hace una segmentación por umbralización, el objetivo es hacer al algoritmo aún
más robusto a los cambios de tinción, iluminación y presencia de ruido en las imágenes.
Después del proceso de segmentación las imágenes resultantes pueden presentar ruido
el cual es considerado basura ya que no aporta información significativa de glóbulos blancos, por
ello es eliminado por medio de operaciones morfológicas.
Se evaluó de manera visual cada una de las etapas del algoritmo, los resultados obtenidos
de cada etapa demuestran que son óptimos para que en conjunto puedan llegar a una
segmentación satisfactoria.
Recientemente se han generado una gran cantidad de trabajos que presentan técnicas,
modelos y algoritmos para la segmentación. Sin embargo se ha desarrollado poca investigación
desde la perspectiva computacional para imágenes de medula ósea obtenidas por medio de un
frotis y un microscopio óptico.
C. Platero Dueñas y Asensio Madrid en su trabajo [6], Difusión no lineal sobre imágenes
de color procedentes de microscopía, se determina el nivel de infección del virus C (hepatitis)
sobre pacientes, se contabilizan los hepatocitos y señales de virus C. Este trabajo nos dice que
el sistema RGB es muy sensible a las condiciones de iluminación de la escena capturada, por lo
que buscaron espacios alternativos al sistema de representación RGB. El objetivo es el proceso
de difusión, isotrópico y anisotrópico, sobre los canales cromáticos y acromáticos de la imágen,
7
de manera que regularice la imágen y hacer una comparación entre el tensor de Di Zenzo sobre
el sistema RGB a la difusión cromática compleja de HSV. En la comparación entre la difusión
cromática y la geometría de Di Zenzo, descubrieron que la difusión no lineal (aplicando la
geometría vectorial de Di Zenzo sobre RGB) preserva los bordes de los objetos de la escena, la
difusión cromática compleja se va a centrar en la expansión de los objetos cromáticos sobre los
acromáticos y prevalecen las características de cromaticidad, las peculiaridades cromáticas de
los hepatocitos y las señales víricas quedan realzadas en la difusión cromática, no así en la
difusión empleando el sistema RGB.
La investigación realizada por Pinzón [7], en la que se identifican glóbulos rojos infectados
por malaria y obtienen características como son el diámetro de las células, densidad (conteo de
células) y forma. En este trabajo utilizan una modificación de la transformada de Hough para
localizar los objetos circulares en la imagen. Para localizar los parásitos dentro de los glóbulos
rojos utilizan filtros morfológicos, los cuales resaltan los objetos obscuros de menor tamaño
(parásitos).
Sin embargo y con base en el estudio del estado del arte, no se han encontrado trabajos
dedicados a la identificación leucemia (glóbulos blancos) empleando técnicas de visión por
computadora y que las imágenes estén bajo diferentes condiciones.
propuesto y se proporcionan los resultados que demuestran la eficacia del algoritmo, también se
muestran los resultados obtenidos para cada etapa de la solución general, así mismo se
presenta una comparación entre los resultados de segmentación que se obtienen del algoritmo
K-means del software ImageJ y el algoritmo desarrollado en este trabajo.
En el capítulo 6, “Trabajo futuro” se define los posibles trabajos futuros que se pueden
realizar tomando como base este trabajo.
2.1.1 Leucemia
Cáncer es el término que se emplea para un grupo de enfermedades que tienen un
denominador común: la transformación de la célula normal en otra que se comporta de forma
muy peligrosa para el cuerpo humano.
La célula es el elemento más simple, dotado de vida propia, que forma los tejidos
organizados. Está compuesta por una masa rodeada de protoplasma que contiene un núcleo.
Una pared celular rodea la célula y la separa de su ambiente. Dentro del núcleo está el ADN, que
contiene la información que programa la vida celular (Fig. 1).
2.1.1.1 Aguda.
La leucemia aguda consiste en el crecimiento descontrolado de células hematopoyéticas
o células madre (formadoras de sangre), incapaces de madurar adecuadamente, que llegan a
invadir la mayor parte o la totalidad de la médula ósea, tras lo cual alcanzan la sangre periférica
y, a veces, se producen focos extrahemáticos, en uno o varios órganos del cuerpo, que se
comportan como tumores [10].
El término agudo no implica solamente una población de blastos pobremente
diferenciados, sino que presenta un síndrome clínico fatal dentro de un término de 30 días a
partir del diagnóstico si el paciente no recibe atención inmediata. Este tipo también se
subclasifica en:
Las causas que provocan este tipo de leucemia se desconocen, pero se le atribuye una
gran importancia a factores genéticos. Algunos factores externos que pueden coadyuvar al
desarrollo de la enfermedad son: radiaciones, radioterapia, medicamentos o disolventes
orgánicos, entre otros. La leucemia aguda en la población general es de 3 a 6 casos por cada
100,000 habitantes por año [10], con ligero predominio en el sexo masculino. Así mismo, las
leucemias agudas constituyen el grupo de neoplasias más frecuentes en la población infantil, con
40 nuevos casos anuales por cada millón de niños (menores de 15 años). De estos, el 80%
corresponde a leucemias agudas linfoblásticas y el 20 % a leucemias agudas mieloblásticas [12].
2.1.1.2 Crónica.
Existen varios tipos de leucemias crónicas según sean las células alteradas. Así, se
tienen los síndromes linfoproliferativos crónicos y los síndromes mieloproliferativos crónicos.
Los síndromes mieloproliferativos crónicos. Son debidos a una alteración de las células
madre o formadoras de sangre, que hace que se aumente el número de las células
precursoras y de las células maduras que derivan de ellas. Dentro de estos
síndromes, se encuentra la leucemia mieloide crónica. Se ha observado que las
células de los pacientes, con esta leucemia, tienen una alteración en sus
cromosomas. La incidencia máxima se da entre los 40 y 50 años, aunque puede
presentarse a cualquier edad y afecta ligeramente más a los varones [10].
Morfológica
En esta técnica, un patólogo (médico que se especializa en el diagnóstico de
enfermedades mediante pruebas de laboratorio) examina cualquier muestra (sangre, médula
ósea, tejido de los ganglios linfáticos o líquido cefalorraquídeo) por medio de un microscopio. Los
médicos verán el tamaño y la forma de las células en las muestras. Según el tamaño, la forma y
la presencia de los glóbulos blancos, los médicos pueden clasificarlos en tipos específicos y así
determinar el tipo de leucemia presente en la muestra: Linfoblástica o Mieloblástica.
Histoquímica
En esta técnica las células de la muestra se exponen a tintes químicos (colorantes) que
reaccionan únicamente con algunos tipos de células leucémicas. Estos tintes causan cambios de
color que se puede observar sólo bajo el microscopio, y estos cambios pueden ayudar al médico
a determinar qué tipos de células están presentes.
Inmunocitoquímica
Durante esta prueba, al igual que en la citometría de flujo, las células de la sangre o de
las muestras de la médula ósea se tratan con anticuerpos especiales. Sin embargo, en vez de
utilizar un láser y la computadora, la muestra se trata de tal forma que ciertos tipos de células
cambian de color. El cambio de color se puede observar únicamente con un microscopio.
Inmunohistoquímica (Inmunofenotipo)
Se basa en la utilización de un anticuerpo específico, previamente marcado mediante un
enlace químico con una sustancia que se puede transformar en visible, sin afectar la capacidad
del anticuerpo para formar un complejo con el antígeno. El complejo antígeno-anticuerpo,
mediante la utilización de alguna de las técnicas específicas (peroxidasa antiperoxidas,
fluoresceína, etc.) permite ser localizado e identificado dentro de la muestra a estudiar.
Citogenética
Es el proceso de analizar y detectar cambios en la forma y número de los cromosomas
de una célula (partes de ADN). Las células humanas normales contienen 23 pares de
cromosomas. Un citogenetista prepara, examina e interpreta el número y la forma de los
cromosomas en las células. En general, las alteraciones cromosómicas asociadas a LMA
corresponden a genes que codifican factores de trascripción de ADN o bien, la regulan,
modificando el “destino” celular. En LLA, 60-75% tienen alteraciones genéticas de estructura,
siendo el factor pronóstico más importante, ya que las características clínicas y de laboratorio de
buen o mal pronóstico se correlacionan con este tipo de alteraciones [19].
por esto la visión por computadora propone varias técnicas que permiten obtener una
representación del mundo a partir del análisis de imágenes, así, la imagen es procesada de tal
forma que el resultado sea el conjunto de características que definen el problema a resolver tales
como las diferentes zonas de color, presencia o no de objetos en movimiento, texturas y forma
de objetos.
I[i][j]
i
Fig. 2) Representación de una imágen digital.
2.2.2 Histograma.
Un histograma es un resumen gráfico de la variación de un conjunto de datos (Fig. 3). La
naturaleza gráfica del histograma nos permite ver comportamientos que son difíciles de observar
en una simple tabla numérica.
Variación
7
6
5
4
3
2
1
0
Datos
Fig. 3) Histograma
14
Sabemos que los valores varían en todo conjunto de datos, esta variación sigue cierto
comportamiento.
El propósito del análisis de un histograma es, por un lado, identificar y clasificar el
comportamiento de variación, y por otro desarrollar una explicación razonable y relevante del
comportamiento. La explicación debe basarse en los conocimientos generales y en la
observación de las situaciones específicas. Las pautas habituales de variación más comunes
son la distribución en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico
aislado, o con un pico en el extremo [13].
El modelo HSB se basa en la percepción humana del color. En este modelo, todos los
colores se describen según tres características fundamentales [15]:
Tonalidad.- Es el color reflejado o transmitido a través de un objeto. Se mide como una posición
en el círculo de colores estándar y se representa como un ángulo cuyos valores posibles van de
0 a 360° (Fig. 5. Tono).
15
Saturación.- Indica la pureza del color, se representa como la distancia al eje de brillo negro-
blanco. Los valores posibles van del 0 al 100%. Cuanto menor sea la saturación de un color,
mayor tonalidad grisácea habrá y más decolorado estará (Fig. 5. Saturación).
Brillo.- Es la luminosidad relativa del color y básicamente informa de si el color es más claro o
más oscuro y representa la altura en el eje blanco-negro. Los valores posibles van del 0 al 100%
(Fig. 5. Brillo).
2.2.4 Filtrado
Los filtros son operaciones que se aplican a los píxeles de una imágen digital para
mejorarla, resaltar cierta información o conseguir un efecto especial.
Filtros no lineales.- Al igual que los filtros lineales también operan sobre entornos.
Sin embargo, su operación se basa directamente en los valores de los píxeles en
el entorno en consideración. La clasificación de los filtros espaciales también
puede hacerse basándose en su finalidad [16].
2.2.5 Segmentación.
La segmentación consiste en dividir una imágen digital en regiones o entidades
significativas, esto es, tomar las partes o segmentos que se pueden considerar como unidades
homogéneas relevantes, con respecto a una o más características.
Sea R la región que incluye la imágen completa, podemos definir la segmentación como
un proceso que divide a R en k subregiones o subconjuntos disjuntos no vacíos R1, R2, R3,..., Rk,
cumpliéndose que [13]:
a) U Ri = R para i = 1, 2, 3,... k,
b) Ri es una región conectada; para i = 1, 2, ..., k
c) Ri ∩ Rj = ∅ para todo i y j, i ≠ j
d) P (Ri) = Verdadero para i = 1, 2,..., n, y
e) P (Ri U Rj) = Falso para i ≠ j,
donde P (Ri) es un predicado lógico sobre los puntos del conjunto Ri.
Umbralización
Detección de bordes
Detección de regiones
Clustering o agrupamiento estadístico de píxeles
Basadas en otras características (textura, movimiento, color, etc.).
o Segmentación de texturas
o Morfología matemática
o Redes neuronales
o Transformada Watershed
o Etiquetado de componentes conexas
o Caracterización de regiones
2.2.6.1 Umbralización
Las técnicas de segmentación basadas en la umbralización consideran únicamente el
atributo intensidad de los píxeles, de acuerdo a esta intensidad, se asocia cada píxel de la
imágen a una determinada clase.
Determinar los rangos que representan a cada clase se puede hacer estableciendo un
valor fijo del umbral U, o determinando el valor U de manera dinámica mediante técnicas
basadas en el análisis del histograma. Este proceso de segmentación es una técnica rápida,
sencilla y fácil de implementar.
La fijación de un umbral se considera una operación que implica pruebas con respecto a
una función U de la forma [19]:
U = U [x, y, p(x, y), f(x, y)]
Donde f(x, y) es la intensidad en el punto (x, y) y p(x, y) es alguna propiedad local del punto.
A partir de la imágen original I (i, j), y el valor U determinado, podemos establecer que la
imágen binaria B (i, j) resultante está definida como [19]:
1, si I(i, j) ≥ U
0, si I(i, j) < U
2.2.6.1.3 Multiumbralización.
Esta técnica de segmentación consiste en la elección de múltiples umbrales. Este método
se basa en extraer los mínimos relevantes del histograma y usarlos como umbrales para
segmentar la imágen. Los umbrales calculados son: 0, todos los mínimos extraídos del
histograma y 255, por lo que, el número de intervalos calculados es igual al número de mínimos
+ 1; esto permite separar diferentes objetos dentro de una imágen, donde los niveles de gris
difieren. Como imágen resultante obtenemos regiones con etiquetas diferentes.
Sea I (i, j) la imágen original e Is (i, j) la imágen segmentada y R1, R2,..., Rn, los n rangos
de nivel de gris usados para la umbralización, tenemos entonces:
Fig. 8) Ejemplo de crecimiento de regiones. a) Las semillas introducidas son los valores 2 y 6 subrayados. (b-e)
Considerar que se emplea el criterio de vecindad 4 y un píxel cumple el criterio de similitud si la diferencia es menor
o igual a 2 para realizar el crecimiento de las regiones.
f) Región resultante.
Fig. 9) Ejemplo de crecimiento de regiones por enlace de centroide. (a) Región original, se establece como semilla
el valor 6, media = 6 y tolerancia = 2. (b),.., (f) El proceso agrega los píxeles que estén dentro del rango de la
tolerancia con respecto a la media, después la media es actualizada. El proceso termina en el momento que no
existen píxeles por agregar. g) Región resultante del proceso [17].
2.2.6.4.1 K-Means
Este algoritmo permite determinar iterativamente el centroide de cada uno de los K
clusters y la partición del espacio de los parámetros en K zonas, una para cada cluster.
Partiendo de una estimación inicial para los centroides, se clasifica los datos según esos
centroides. A partir de los datos clasificados para cada cluster se vuelve a determinar el
centroide para ese cluster. Esto se repite hasta que la posición de los centroides de los clusters y
la clasificación de los datos no cambien apreciablemente. La imágen segmentada viene dada
entonces por las etiquetas correspondientes a la última clasificación [22].
means proviene de la teoría de los conjuntos difuso lo que permite que un mismo objeto
pertenezca a más de un cluster a la vez, con diferentes grados de pertenencia. Es un algoritmo
de segmentación que actúa sobre casos definidos por atributos numéricos. Como primer paso,
Fuzzy C-Means calcula los centros de los clusters difusos para el número elegido de clusters. A
continuación, calcula el grado de pertenencia de cada caso a cada cluster, y para cada variable.
22
A partir de esta información, y mediante una inspección de los valores calculados, se establece
cuales de las variables son de mayor relevancia para cada cluster y cuales tienen ambigüedades
[23].
basa en dos aspectos claramente diferenciados: una primera parte de entrenamiento y otra de
clasificación de un conjunto de test. Cada ejemplo del conjunto de entrenamiento {x1, x2,. . ., xl}
viene descrito por una serie de características, donde xi º Rn son los vectores de características,
y una clase C que indica su clasificación dentro del problema estudiado. Durante el proceso de
entrenamiento, el algoritmo almacena los ejemplos del conjunto de entrenamiento. Con estos
ejemplos almacenados, el proceso de clasificación es muy simple. Para obtener la clase a la que
pertenece un nuevo vector de test xi, se buscan los k ejemplos del conjunto de almacenamiento
que se encuentren mas próximos a el de acuerdo con la métrica empleada por el sistema y, a
continuación, se ponderan las clases a las que pertenecen dichos ejemplos, utilizando
generalmente un criterio de mayorýa. Aunque es posible utilizar distintas medidas de distancia,
en la mayor parte de los casos se opta por emplear la distancia euclideana [24].
01110
01110
00110
00110
00000
1 11 1
1 ·1 1 1 ·1 1 1 ·0 1
1 11 1
Fig. 11) Elementos estructurales típicos
2.2.7.1 Dilatación
La dilatación es una transformación morfológica que combina dos conjuntos usando la
adición de vectores de elementos de un conjunto [28].
AB = {a+b: aA y bB}
O bien, x AB x = a+b, aA, bB
Es decir, el conjunto de todos los posibles vectores suma de pares de elementos, uno
perteneciente a A y el otro a B (Fig. 12).
Ejemplo:
A = {(0,1), (1,1), (2,1), (2,2), (3,0)}
B = {(0,0), (0,1)}
AB = {(0,1), (1,1), (2,1), (2,2), (3,0), (0,2), (1,2), (2,2), (2,3), (3,1)}
A B AB
Fig. 12) Ejemplo de dilatación
2.2.7.2 Erosión
La transformación morfológica de la erosión combina dos conjuntos utilizando la
sustracción de vectores. Es dual de la dilatación [27].
Cada punto d del conjunto X, que para nosotros será la imágen, es comprobado; el
resultado de la erosión está dado por los puntos d para los cuales todos los posibles d+b están
en X. La figura 13 muestra un ejemplo del conjunto de puntos X erosionados por el elemento
estructural B [26]:
A = {(1,0), (1,1), (1,2), (1,3), (1,4), (1,5), (2,1), (3,1), (4,1), (5,1)}
B = {(0,0), (0,1)}
A B = {(1,0), (1,1), (1,2), (1,3), (1,4)}
A B AB
Fig. 13) Ejemplo de erosión
25
Apertura y cierre
En la práctica, la erosión y dilatación se utilizan en pares, la erosión seguida de dilatación
o viceversa. En ambos casos, el resultado de aplicarlos iterativamente es la eliminación de
detalle específico de la imágen menor al tamaño del elemento estructurante, sin una distorsión
geométrica global de las características no suprimidas.
Por ejemplo, efectuar una apertura (erosión-dilatación) por un elemento estructurante con
forma de disco, suaviza el contorno, rompe ligas angostos, elimina pequeñas islas y agudiza
picos.
Realizar una cerradura (dilatación-erosión) por una elemento estructurante con forma de
disco, suaviza el contorno, une roturas angostas y golfos delgados, eliminando pequeños
agujeros, y completa espacios en el contorno.
La propiedad más saliente de estos filtros es que son idempotentes, es decir, la aplicación
consecutiva de una apertura o cerradura no cambia el resultado de la primera aplicación. La
importancia práctica es que constituyen estados completos y cerrados de algoritmos para el
análisis de imágenes porque las formas pueden describirse en términos de los elementos
estructurantes bajo los cuales pueden aplicarse aperturas o cerraduras sin efectuarse cambio
alguno.
El origen del elemento estructurante no afecta el resultado de una apertura o de una
cerradura [28].
26
Inicio
Fin
En el diagrama anterior (Fig. 14) se muestran los pasos que se llevan a cabo para la
extracción de células de leucemia en imágenes de células de médula ósea.
Cada imágen del subconjunto de imágenes es sometida a un análisis en sus canales RGB
(Fig. 14. Análisis de subconjunto de imágenes en RGB), resultado de este análisis se obtiene un
patrón el cual es usado para hacer una mejora a la imágen en proceso (Fig. 14.
Preprocesamiento de imágen), posteriormente se realiza la segmentación de la imagen (Fig. 14.
Segmentación de imagen filtrada), una vez teniendo la información que necesitamos separada
27
de la que no es útil, hacemos una mejora a la información obtenida de la segmentación (Fig. 14.
Eliminación de ruido).
Se observa el frotis con la lente 10x, para obtener una visión de los campos de mayor
interés del mismo. Cabe hacer mención que de un solo frotis es posible obtener varias
imágenes de interés, las cuales serán seleccionadas por los médicos expertos en la
materia.
Una vez seleccionado un campo de interés, primero se digitaliza el mismo con la lente a
10x, usando la resolución nativa de la cámara digitalizadora (800 x 600 píxeles).
Posteriormente, se usa la lente 100x con aceite de inmersión, para ubicar las células de
mayor interés en el campo de observación que se trabaja. Una vez enfocadas, estas se
digitalizan. En este paso se obtienen las imágenes que muestran a mayor detalle las
características de las células.
Este proceso se repite tantas veces como sea necesario, dependiendo de los campos de
interés que contenga el frotis, lo cual va a depender del criterio del médico (experto en el
dominio).
De las 48 de las imágenes con las que se cuenta se separo el 80% que corresponde a 38
imágenes, este 80% de imágenes fueron seleccionadas al azar para el análisis y realización de
pruebas de los procedimientos desarrollados.
Como primer paso la imágen de entrada siempre pasa por una etapa de pre-procesado el
cual consiste en la eliminación de píxeles que no cumplen con ciertas características esto se
hace para mejorar la calidad de la imágen que se quiere analizar y de esta manera hacer mas
eficiente la segmentación.
La imágen que se obtiene después de la mejora será utilizada como entrada en el
algoritmo de clasificación K-means, la imágen que resulta después de aplicar este algoritmo
puede llegar a no ser tan satisfactoria como se desea por lo que se hace un análisis de ella, este
análisis consiste en el calculo de porcentajes de color y fondo, si el porcentaje de color es mayor
al porcentaje del fondo es necesario someter a la imágen a una segmentación por umbralización.
Finalmente la imágen resultado será sometida a una mejora final, con la cual se pretende
eliminar píxeles que no pertenezcan a la información que se desea obtener.
En este trabajo de tesis un problema al que nos enfrentamos fue que no todos los frotis
tienen una tinción uniforme (unos son de mejor calidad que otros) por lo que la coloración de las
células es muy variada (unas azuláceas, otras rosadas, rojas y otras violeta) (Tabla 2), lo que
dificulta su segmentación.
Así mismo, se tienen otras dificultades como que en algunos casos los glóbulos rojos son
más obscuros que los glóbulos blancos (lo cual es incorrecto ya que en realidad los glóbulos
blancos son más obscuros que los glóbulos rojos; (Tabla 2. Fig. b, f, g) y en otros casos los
glóbulos rojos se presentan como manchones dentro de la imágen (Tabla 2. Fig. h). Algunos
ejemplos de estos casos se muestran en las imágenes que se presentan en la (Tabla 2).
29
(a) (b)
(c) (d)
(e) (f)
(g) (h)
Tabla 2) Imágenes con diferentes tinciones
La Tabla 3 solo muestra algunos datos obtenidos del análisis que se hizo a los glóbulos blancos.
Nombre R G B
137 41 115
127 36 115
106 19 90
113 15 98
105 25 98
80 55 113
92 52 114
112 79 132
70 20 189
45 25 94
116 78 103
160 117 137
139 96 115
135 86 108
52 22 50
142 89 109
158 91 100
198 99 128
122 90 95
209 166 129
154 118 130
155 95 156
119 66 144
242 196 207
145 86 152
170 174 222
142 79 228
162 123 240
147 103 238
103 54 206
180 118 285
Tabla 3. Algunos datos obtenidos de análisis hecho a
glóbulos blancos con diferentes tinciones.
Como se puede observar en las imágenes anteriores (Tabla 4), la sentencia R>B, G>B y
(B-G)>30, utilizada para mejorar la imágen antes de ser segmentada, logra eliminar en un solo
paso parte de la información que no es útil, el resultado de esto hace que la segmentación
posterior sea mas fácil y eficiente. Cabe hacer mención que esta mejora deja información que
tendrá que ser eliminada en el proceso de segmentación pero jamás elimina parcial o totalmente
los glóbulos blancos.
Existen algunos casos para los que esta mejora deja casi intacta a la imágen, tales como,
si los glóbulos rojos o el fondo se presentan igual o mas oscuros que los glóbulos blancos (pero
esto es debido a la mala tinción del frotis), (Tabla 5). Sin embargo esto no quiere decir que en
estos casos la segmentación fallará.
32
El efecto que se logra con esta mejora dentro de la imágen es la eliminación de píxeles
que son notoriamente diferentes a los píxeles que forman los glóbulos blancos, con esto no se
obtienen de inmediato únicamente las células de interés ya que en algunas imágenes este
patrón también lo cumplen otras células o el fondo, esta mejora es de gran ayuda ya que
después de esta contamos como máximo con tres colores diferentes sobre la imágen y esto
facilita la segmentación.
Dado que después de la mejora todavía no tenemos únicamente a los glóbulos blancos
fue necesario implementar un algoritmo de segmentación. Así que, una vez finalizado el proceso
de mejora de la imágen, se procede a realizar la segmentación por medio del algoritmo K-means
adaptado y utilizando los canales R (red/rojo), G (green/verde), B (blue/azul).
Para hacer la selección de este algoritmo de clasificación, se utilizó el software ImageJ el
cual cuenta con varios algoritmos de segmentación como Entropy Threshold, Local Threshold,
Otsu Threshold, Maximum Entropy Threshold, Mixture Modeling, Multi Thresholder, K-means y
Coulor Based Thresholding, con los cuales se realizaron varias pruebas y el que presento
mejores resultados sobre el dominio de datos fue K-means. Este algoritmo además de ser
eficiente para nuestro propósito, también tiene la ventaja de ser muy sencillo tanto en concepto
como en implementación (Fig. 15).
33
Inicio
Numero de
cluster k
Centroide
No hay
Movimientos Fin
Distancia del centroide a en los grupos
cada píxel
Agrupar basándose en la
mínima distancia
Inicio
Imágen filtrada
Descomponer la imágen
en RGB
Histograma
Centroides
Descomponer la imágen
en HSB
Si
Distancia del centroide a No hay background>55
cada píxel movimientos en los Segmentar por
% al total de umbralización en HSB
grupos píxeles
Agrupar basándose en la
mínima distancia
B (i,Optimización
j)= de
imágen resultado
Fin
Fig. 16) Diagrama del proceso de segmentación propuesto
determinar correctamente los primeros centroides, es muy importante que los primeros
centroides que se obtengan sean los (píxeles mas representativos de cada grupo) correctos ya
que de estos depende que la segmentación sea satisfactoria (Fig.16. Histograma).
Una vez calculado el histograma de la imágen, se identifican los tres picos más altos, ya
que estos corresponden a los tres colores más representativos de la imagen y por esta razón se
facilita dividir la imagen en tres grupos, los picos identificados serán asignados como los tres
primeros centroides con los que iniciara el algoritmo de segmentación (Fig.16. Centroides).
El motivo por el cual se usan tres centroides para realizar la segmentación es porque
después del filtro de mejora, la imagen tiene como máximo tres colores diferentes, así, el
histograma de la nueva imágen solo presenta tres picos representativos, el primero se presenta
entre 0-5, y los dos picos restantes se presentan dentro del intervalo de 5-250, así que si se
identifica de manera correcta estos dos puntos podemos dividir la imágen satisfactoriamente en
tres grupos, donde el primero de ellos tendrá todo aquello que se elimino con el filtro de mejora,
el segundo grupo tendrá los glóbulos blancos que es la información que nos interesa y el tercer
grupo contendrá al complemento de los dos grupos anteriores.
Para asegurar que el algoritmo haga la identificación de los glóbulos blancos
correctamente, el segundo centroide debe estar entre los valores 10-200, este umbral fue
obtenido de un análisis de glóbulos blancos en imágenes con el filtro de mejora.
Después de calcular los primeros centroides, se calcula la distancia Euclideana entre cada
centroide y cada píxel que forma la imagen (Fig. 16. Distancia del centroide a cada píxel), la
distancia Euclideana se calcula en base a los niveles de gris de los píxeles seleccionados como
centroides y el resto de los píxeles de la imágen, obteniendo con esto tres matrices de
distancias, de estas se generan los grupos en base a las distancias mínimas a cada centroide
(Fig.16. Agrupar en base a la mínima distancia).
Hasta este momento supondríamos que el grupo que contiene a los glóbulos blancos seria
el grupo 2 dado que este se forma con el centroide que es mas cercano al color de los glóbulos
blancos, sin embargo no toda la información esta en este grupo, ya que en ocasiones algunos
píxeles con información de los glóbulos blancos son clasificados en el tercer grupo esto sucede
normalmente con los píxeles que en el histograma pertenecen o están muy cercanos a un valle.
Para corregir este error, en el algoritmo K-means se filtra el grupo 3 de distancias, el
proceso que se realiza es; se identifican las distancias mínimas con respecto a los otros dos
grupos de distancias, las distancias identificadas corresponden a los píxeles que forman el tercer
grupo, de estas distancias se filtran aquellas que sean mayor a 40, el 40 a pesar que fue una
distancia menor y el píxel que le corresponde debería estar en el grupo tres, indica que el valor
de su píxel correspondiente esta muy alejado del centroide tres, por ello este píxel de la imágen
también pertenece al grupo 2, y debe ser marcado como 0 en el grupo 3.
Todo lo descrito anteriormente se hace en la primera iteración, para cada una de las
siguientes iteraciones se vuelven a calcular los tres centroides pero ahora para cada uno de ellos
se calcula el promedio en nivel de gris de los píxeles que corresponden a su grupo formado en la
iteración anterior.
Cuando ya se tienen los nuevos centroides nuevamente se calcula la distancia entre cada
centroide y cada píxel que forma la imágen, esto se hace de la misma manera que en la primera
interacción, con la distancia Euclidiana en nivel de gris de cada píxel, se generan los grupos en
base a las distancias mínimas a cada centroide.
36
tinciones el canal R es mayor que el B pero también en estas imágenes los glóbulos blancos
tienen la característica que el canal B es mayor a 80 por lo que la sentencia (R>B) and ( B<80)
ayuda a eliminar píxeles que para los algoritmos de clasificación seria difícil diferenciar bajo
nuestras condiciones de segmentación, a demás deja en mejores circunstancias a la imágen ya
que minimiza las manchas de ruido y esto ayuda a que la operación morfológica de apertura
elimina la mayor cantidad de ruido posible.
Se planteó usar la operación morfológica de apertura ya que consiste en hacer una
erosión seguida de una dilatación a la imagen, con la erosión se eliminan las pequeñas manchas
que pudiera presentar la imagen y con la dilatación se recuperan los píxeles de los glóbulos
blancos que fueron erosionados.
En el proceso de erosión se empleo una mascara de 3x3 de la cual los nueve puntos de la
mascara deben coincir para que una vecindad no sea erosionada en cualquier otro caso dicha
vecindad será erosionada (Fig. 17 a), con esta operación se elimina la mayor cantidad de ruido y
también se pierden los bordes de los glóbulos blancos, sin embargo estos se recuperan en el
proceso de dilatación posterior. En la dilatación se emplea una mascara de 3x3 de la cual los
nueve puntos de la mascara deben coincidir para que una vecindad sea dilatada en una
vecindad de 8 en cruz (Fig. 15 b), con esta dilatación se recuperan los bordes de los glóbulos
blancos que se perdieron con la erosión.
1 1 1 0 0 0
1 x 1 0 0 0
1 1 1 0 0 0
a) Erosión
1 1 1 1
1 x 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1
1
b) Dilatación
(a) (a’)
(b) (b’)
39
(c) (c’)
(d) (d’)
Tabla 6. Imágenes originales y su correspondiente segmentada
En la tabla anterior (Fig. a’, b’, c’, d’) se muestran algunos resultados de la segmentación
los cuales evaluados de manera visual son bastante buenos ya que no se pierden su citoplasma,
las figuras a’, b’, c’, d’ de la Tabla 6 todas las imágenes pasaron solamente por el algoritmo K-
means, ya que según la evaluación que se hace durante el proceso de segmentación determina
que la cantidad de color que quedo en la imágen de salida corresponde a una imágen que ya
esta segmentada correctamente, por lo que ya no es necesario pasarla al módulo de
segmentación por umbralización.
Como segundo punto se presentan los resultados obtenidos de la segmentación realizada
con el algoritmo propuesto en este trabajo, pero en este caso la imágen pasa por el segundo
módulo de segmentación ya que las imágenes de entrada se consideran de mayor dificultad para
ser segmentadas, esto se debe a que las células que no son glóbulos blancos presentan una
coloración bastante similar a la que tienen los glóbulos blancos o en otros casos que los valores
que componen a cada píxel de esas células que no son glóbulos blancos corresponden al umbral
que contiene los valores que forman a cada píxel de los glóbulos blancos.
Como consecuencia de ello, la división entre estos dos tipos de coloraciones muy
similares resulta ser mas difícil de realizar satisfactoriamente por el primer módulo del algoritmo,
por esto la imágen de salida del primer módulo se pasa al segundo módulo del algoritmo, el cual
realiza una segunda segmentación por umbralización en los canales HSB (Tabla 7).
(a) (a’)
40
(b) (b’)
(c) (c’)
(d) (d’)
Tabla 7. Imágenes originales y su correspondiente segmentada
Como se muestra en las imágenes anteriores (Tabla 7), el que la coloración de los
glóbulos rojos sea muy similar a los glóbulos blancos, no implica que los resultados sean
erróneos, ya que precisamente el segundo módulo del algoritmo se propone para resolver este
tipo de problemática y evaluando los resultados de manera visual estos son bastante buenos.
Existen casos como (Tabla 7. Fig. a’), en el cual la coloración de los glóbulos blancos es
muy similar a la que se presentan los glóbulos rojos, por lo que su división resulta bastante difícil.
También se puede llegar a presentar el caso aunque es poco común, en el cual puede
presentarse poca perdida de información de los glóbulos blancos, debido igualmente a la
similitud en coloración entre glóbulos blancos y rojos como se muestra en la (Tabla 7. Fig. d’), en
(Tabla 7. Fig. b’, c’) se puede ver que se obtienen resultados bastante satisfactorios ya que no
hay perdida de información.
Como tercer punto de evaluación se presentan los resultados obtenidos después de
aplicar la operación morfológica de apertura, esta operación se emplea ya que en ocasiones el
resultado de la segmentación presenta pequeñas manchas dispersas en la imágen, a las cuales
llamaremos ruido.
Para eliminar este ruido se propuso aplicar la operación morfológica de apertura, la cual
como se ve (Tabla 8), elimina el ruido significativamente.
En muchos de los casos elimina por completo el ruido que presenta la imágen (Tabla 8.
Fig. b’), y en otros casos ayuda para disminuir el tamaño de cada mancha (Tabla 8. Fig. a’, c’),
lo cual puede ayudar en trabajos posteriores a esta investigación, por ejemplo a la hora de
41
buscar características, de manera visual se sabe que en el tipo de imágenes que estudiamos, los
glóbulos blancos no son tan pequeños por lo que se pueden desechar aquellas manchitas, de no
ser menor en tamaño este ruido algunas manchas por su tamaño pondrían llegar a ser
confundidas con glóbulos blancos y por ello ocasionar errores y también se tendría que invertir
mas tiempo en poder desechar ese ruido.
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 8. Imágenes binarizadas y su correspondiente con la operación morfológica apertura
Imágen
Original
Imágen
Filtrada
Imágen con
Algoritmo
K-means
Imágen con
umbralización
XXXX
Imágen con
operación
Morfológica
de apertura
Imágen
Resultado
Tabla 9. Proceso al que es sometida una imágen de medula ósea para su extracción de glóbulos blancos
Esta comparación se propuso debido a que la herramienta ImageJ fue utilizada a lo largo
del desarrollo de esta investigación y que desde su inicio se deseaba mejorar los resultados de
su algoritmo K-means, la comparación que se realizó se describe a continuación.
Se realizó una segmentación de un conjunto de imágenes con ImageJ (Tabla 10), el
objetivo de esto es empezar a mostrar resultados, los cuales nos ayudan a comprender el
funcionamiento general del algoritmo K-means, y más adelante nos ayudaran a corroborar que el
algoritmo aquí propuesto tiene una mayor efectividad.
Las siguientes imágenes (Tabla 10) muestran algunos de los resultados obtenidos de la
segmentación de imágenes originales con el algoritmo K-means con tres grupos del software
ImageJ.
Imágen Original Segmentación K-means de
ImageJ
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 10. Segmentación por K-means con tres grupos de ImageJ.
Como vemos en las imágenes anteriores (Tabla 10. Fig. a’, b’, c’) se divide la imágen en
tres grupos según el nivel de gris, vemos que los glóbulos blancos si se diferencian en casi todas
las imágenes excepto en la imágen a’ (Tabla 10. Fig. a’), esto por que el nivel de gris de los
glóbulos blancos y los glóbulos rojos es bastante similar, si bien es cierto que en el resto de las
imágenes se logran diferenciar los glóbulos blancos de los rojos, también es cierto que hay
mucha confusión entre estos dos tipos de células debido a los colores tan similares que
presentan, además de perdida considerable de información de los glóbulos blancos.
44
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 11. Segmentación por K-means con cuatro grupos de ImageJ.
Se ve (Tabla 11. Fig. a’, b’, c’) que presentan mejores resultados, sin embargo no es
completamente satisfactorio ya que no hay una clara separación de los glóbulos rojos y los
blancos además que el hacer 4 grupos no arroja resultados satisfactorios para todo el conjunto
de imágenes con el que se hicieron las pruebas.
Si seguimos aumentando el número de grupos se siguen dividiendo aun más los glóbulos
blancos ya que estos aunque su característica general es que caen en tonalidades moradas, no
tienen un color uniforme.
Como se muestra en la tabla anterior la segmentación por K-means de ImageJ con tres
grupos confunde los glóbulos blancos y rojos en algunas imágenes (Tabla 12. Fig. a’, c’, d’) en
otras logra separar a los glóbulos blancos sin embargo pierde una cantidad de información
considerable de ellos (Tabla 12. Fig. b’) cuando se trata de cuatro grupos en la mayoría de los
casos funciona mejor sin embargo también pierde demasiada información de los glóbulos
blancos (Tabla 12. Fig. a’’,b’’,c’’,d’’) y en algunos casos los pierde por completo (Tabla 12. Fig.
b’’).
Haciendo una comparación entre la segmentación de tres y cuatro grupos con el resultado
de la segmentación del algoritmo propuesto en todos los casos el resultado de este último es
46
visiblemente mucho mejor (Tabla 12. Fig. a’’’, b’’’, c’’’, d’’’). La evaluación de las comparaciones
de los resultados se hizo de manera visual ya que los resultados son notoriamente mejores.
Finalmente para evaluar el resultado de segmentación de manera cuantitativa se
propusieron dos métodos el primero consiste en realizar una evaluación visual con ayuda de
químicos expertos en detección de leucemia, ellos consideran únicamente dos posibilidades,
imagen bien segmentada e imagen mal segmentada.
Se contó con 48 imágenes de las cuales 23 se consideran sencillas de segmentar y 25
consideradas de difícil segmentación, los químicos evaluaron visualmente la segmentación de
las 48 imágenes y de esta evaluación se obtuvo la siguiente tabla (Tabla. 13).
La Tabla 13 muestra los porcentajes obtenidos bajo esta clasificación, esta tabla contiene
4 columnas, la primera titulada “Tipo de imagen” contiene el nombre de cada grupo en que se
clasificaron las 48 imágenes, la segunda columna “Número de imágenes” contiene la cantidad de
imágenes que pertenecen a cada grupo, la tercer columna “Número de imágenes con
segmentación satisfactoria” contiene el número de imágenes consideradas por los expertos con
segmentación correcta y su correspondiente porcentaje, con respecto al numero de imágenes
del grupo al que pertenecen, la cuarta columna “Número de imágenes con segmentación
errónea” contiene el número de imágenes consideradas por los expertos como segmentación
errónea, igualmente contienen su correspondiente porcentaje calculado con respecto al número
de imágenes del grupo al que pertenecen.
El último renglón de la tabla 13, muestra el número total de imágenes que resultaron con
segmentación correcta y errónea así como sus correspondientes porcentajes, con la evaluación
visual realizada por expertos se puede ver que el 90% del total de imágenes son segmentadas
correctamente y que solo el 10% presentan una segmentación errónea.
El segundo método consiste en calcular el porcentaje de error en la segmentación de cada
imagen, para poder realizar esta evaluación y debido a que no se cuentan con imágenes que se
sepa están segmentadas en un 100%, se propuso el siguiente procedimiento.
Restar a cada imagen original su correspondiente segmentada, de esta manera se
elimina la región de interés y queda el fondo con la parte de célula(s), que no fueron
incluidas en la segmentación por el algoritmo propuesto.
Segmentar manualmente la imagen restada por medio de umbralización en HSB y con
ello se obtiene únicamente el complemento de la célula que no fue incluido en el proceso
de segmentación aquí propuesto.
Obtenida la imagen con la región de error, se suma con la imagen de salida del
algoritmo aquí propuesto, sacamos su histograma, se suman todos los valores del
47
histograma excepto los valores con intensidad 0, recordemos que en 0 esta contenido el
fondo, el total de estos valores corresponde al 100% de glóbulos blancos, de la misma
forma se calcula el histograma de la imagen con la región de error y se suman todos los
valores con intensidad diferente de 0.
Finalmente se calcula el porcentaje de los píxeles de error con respecto al 100% de
píxeles obtenidos previamente.
Por ello la Tabla 13 muestra los porcentajes obtenidos bajo esta clasificación, esta tabla
contiene 4 columnas la primer columna titulada “No. de Imagen Sencilla” contiene los números
de las imágenes se clasificaron como imágenes sencillas, se cuenta con 23 imágenes de
muestra bajo estas características, la segunda columna “% de error en imágenes sencillas”
muestra en porcentajes el error en la segmentación, considerando que la totalidad de las células
de esa imagen fueron clasificadas correctamente, la tercer columna es homologa a la primer
columna pero para 25 imágenes clasificadas como difíciles, la cuarta y última columna
corresponde al error obtenido de las imágenes difíciles, bajo las mismas consideraciones que
con las imágenes fáciles.
En la Tabla 15 se muestra el promedio total del error tanto para el conjunto de imágenes
sencillas como para el conjunto de imágenes difíciles, como se ve en estos resultados, la
segmentación de las imágenes sencillas y difíciles muestran un error mínimo, por lo que se
puede decir que los resultados de segmentación obtenidos en este trabajo de tesis son
satisfactorios, en esta misma tabla también se presenta el promedio general del error de las 48
imágenes, el cual también es un porcentaje mínimo.
Sencillas Difíciles
Promedio del
los %’s del error 5 7
Promedio General de
los %’s del error 6
Tabla 15. Resultados de la evaluación por porcentajes del error de segmentación.
.
49
Capitulo 5. Conclusiones
Con el desarrollo de éste trabajo de tesis, se sientan la base principal para el desarrollo de
un sistema que apoyará al diagnóstico médico, dicho sistema esta enfocado a la detección de
leucemias agudas a partir de muestras de imágenes digitales de células de médula ósea. Con
dicho sistema se busca que el área medica enfocada a la leucemia cuente con una herramienta
de bajo costo de adquisición, pero de alta precisión en el diagnóstico, que además de
proporcionar diagnósticos mas confiables ayudará a mejorar la obtención de información de
médula ósea, corroborar diagnósticos y puede ser empleado con fines académicos como el
entrenamiento de nuevos patólogos, por lo que su desarrollo esta plenamente justificado.
El trabajar con los cales HSB tiene ventajas importantes para algunas aplicaciones al igual
que el trabajar con los canales RGB, en este trabajo de tesis se conjugaron las ventajas de
ambas formas de descomponer a la imágen para obtener mejores resultados.
En base a las pruebas realizadas podemos decir que los resultados obtenidos en la
segmentación de imágenes son satisfactorios ya que de las 48 imágenes con las que se contó
para realizar este trabajo, 45 de ellas que corresponden al 94% del total de imágenes tienen una
segmentación correcta de más del 80% (Tabla. 13) y solo 3 de ellas que representan el 6% del
total de imágenes presentan una segmentación de menos del 80%.
Cabe mencionar que la tinción de las imágenes es un proceso manual por lo que no
siempre se conserva características uniformes en las imágenes ya sea por que no se efectuó de
manera correcta el proceso de tinción, o porque la muestra a sido usada varias veces, además
de que el proceso de digitalización también manual y la imagen puede ser capturada con ciertas
variantes como son iluminación en la muestra e iluminación alrededor de la muestra y la óptica
del lente, estos procesos manuales impiden que el sistema obtenga mejores resultados, por
tanto se recomienda que el proceso de digitalización de las imágenes sea estandarizado, usando
características equivalentes en el microscopio digital en cada proceso de digitalización.
51
También se puede mencionar como trabajo futuro el identificar cada glóbulo blanco de la
imágen previamente segmentada y ya sin ruido, para su estudio particular y extracción de
características. Este punto es muy importante y de alta dificultad para su realización ya que si se
tienen a los glóbulos blancos muy pegados con técnicas básicas para separarlas no se podría
lograr su separación. Para esto se requiere una ardua labor de investigación y desarrollo.
52
Anticuerpo: Son glicoproteínas (proteínas unidas a azúcares) secretadas por un tipo particular
de células llamadas plasmocitos. Los plasmocitos son el resultado de la proliferación y
diferenciación de los linfocitos B que han sido activados. Su propósito es reconocer cuerpos
extraños invasores como las bacterias y virus para mantener al organismo libre de ellos.
Blastos: Son glóbulos inmaduros que no funcionan normalmente y mueren en la médula ósea o
brevemente después de que ingresan a la sangre. Esto deja menos espacio para que se formen
glóbulos blancos, glóbulos rojos y plaquetas sanas en la médula ósea.
Ganglios Linfáticos: son unos nódulos pequeños, suaves y en forma de fríjol que no suelen ser
visibles ni son fáciles de sentir al tacto. Están ubicados en racimos en varias partes del cuerpo
como el cuello, las axilas y la ingle. Dichos ganglios producen las células inmunes (como los
linfocitos, monocitos y células plasmáticas); además, filtran el líquido linfático y eliminan el
material extraño, como bacterias y células cancerosas. Cuando las bacterias son reconocidas en
el líquido linfático, los ganglios se agrandan a medida que producen y suministran una cantidad
adicional de glóbulos blancos para ayudar a combatir la infección.
Linfocitos: Los linfocitos son las células responsables de las respuestas inmunitarias (inmune,
del latín, 'estar libre de carga'). Se desarrollan a partir de progenitores linfoides inmaduros y se
dividen en dos grandes grupos, linfocitos B y linfocitos T, según que estos progenitores linfoides
maduren en la médula ósea (B) o en el timo (T), respectivamente.
El sistema hace uso de un cuadro de dialogo para seleccionar la (s) imágenes que se
desea segmentar, el cual solo muestra los directorios existentes, a los que se puede acceder sin
ningún problema y también se muestran únicamente los archivos de imágenes en especifico
JPG, GIF, PNG, esto para facilitar el uso del sistema al usuario y para evitar errores a la hora de
cargar las imágenes, otra característica importante del sistema es que, se pueden seleccionar
múltiples imágenes para ser segmentadas, finalmente este pequeño sistema una vez finalizado
el proceso de segmentación genera la imágen y la etiqueta con el mismo nombre a su original
anteponiendo la palabra KMEANS y la guarda en el mismo directorio donde se ubica la imágen
original.
Para ejecutar el programa solo es necesario dar doble clic en el icono de SegLeukemia y
aparecerá la barra de menú de este sistema solo basta dar clic en el menú Tesis y se desplegará
su submenú, si se desea segmentar una imágen solo basta con dar clic en el menú K-means en
ese momento aparecerá un cuadro de dialogo en el que se puede buscar la (s) imágenes que se
desean segmentar, en el cuadro de dialogo solo se muestran los directorios a los que se puede
acceder sin ningún problema y también se muestran únicamente los archivos de imágenes JPG,
GIF, y PNG, después de seleccionar las imágenes solo hay que esperar a que finalice el proceso
de segmentación de las imágenes. Si se desea salir del sistema SegLeukemia, ir al menú Tesis,
Exit y cerrará el ambiente del sistema.
55
Bibliografía
[2] Periodismo de salud, ciencia y tecnología, 2006, Fecha de consulta 17 de marzo de 2007.
<http://www.invdes.com.mx/forma01.cfm?id=435&publicant=Dic%202003>
[4] Carlos Platero, Jorge Moreno, Miguel Ángel Sánchez, Gabriel Asensio, Miguel Hernando,
Roberto González, 2002-2003, Procesamiento digital de imágenes biomédicas.
[6] C. Platero Dueñas, G. Asensio Madrid, Difusión no lineal sobre imágenes de color
procedentes de microscopía en campo claro, Grupo de Bioingeniería Aplicada, Universidad
Politécnica de Madrid, Congreso Anual de la Sociedad Española de Ingeniería Biomédica.
[9] Mendiola JD, Altamirano L., 2000, Evaluación del grado de alteración en la relación
núcleo citoplasma mediante el uso de análisis de imágenes como apoyo para el
diagnóstico de alteraciones precancerosas cérvico uterinas. CONIELECOMP.
[12] Sans-Sabrafen J; Besses Raebel C; Vives Corrons J. L., 2001 Hematología Clínica.
Harcourt.
[13] Gonzalo Pajares, Jesús M. de la Cruz., 2002 Visión por computador. Imágenes digitales
y aplicaciones. Ed. Ra-Ma.
56
[14] Seminario de Imagen y Sonido Digital, Fecha de consulta, 22 de abril del 2007,
<http://pub.ufasta.edu.ar/SISD/vision/cie.htm>
[17] Luis Enrique Jiménez Copoya., 2003, Algoritmo de Segmentación local dinámica
aplicado a la caracterización de partículas. INAOE.
[18] Arturo de la Escalera, 2001, Visión por computador. Fundamentos y métodos, Ed.
Prentice Hall.
[19] González, Rafael y Woods, Richard, 1992, Tratamiento digital de imágenes, Ed. Addison
Wesley / Diaz de Santos.
[24] Lorena Álvarez Pérez, Enrique Alexander Cortizo, Lucas Cuadra Rodríguez, Roberto Gil
Pita, Francisco López Ferreras, 2006, Discriminación Automática Voz/No-Voz Mediante
Combinación de Clasificadores, Departamento de Teoría de la Señal y Comunicaciones,
Universidad de Alcalá. Escuela Politécnica Superior.
[26] Javier Eduardo Rojas Romero, 2006, Documento de tesis “Medición automática del D-
score en imágenes de muestras de endometrio humano
[27] Gonzalo pajares, Jesús M. de la Cruz, José M. Molina, Juan Cuadrado, Alejandro López,
Imágenes Digitales Procesamiento práctico con JAVA, Ed. Alfaomega Ra-Ma.