Proy Leuzemia

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA
SEGMENTACIÓN DE CÉLULAS DE LEUCEMIA UTILIZANDO

TÉCNICAS DE CLASIFICACIÓN
Por
Ket-ziquel Hernández Guadarrama
Asesor
Dr. Jesús A. González Bernal
Coordinación de Ciencias Computacionales
INAOE
Coasesor
MIA. Oscar Edgardo Romero Arredondo
Facultad de Ciencias de la Computación
BUAP
REQUISITO PARA OBTENER EL TITULO DE

INGENIERO EN CIENCIAS DE LA COMPUTACIÓN EN LA
FACULTAD DE CIENCIAS DE LA COMPUTACIÓN DE LA BUAP
Puebla, Pue.
Mayo 2007
II
Resumen.
Tareas como análisis de sangre, análisis de tejidos, análisis de sustancias entre otras,
están relacionadas con el uso e interpretación de imágenes que contienen partículas, estas
tareas son realizadas por expertos humanos. Cuando las imágenes presentan condiciones de
iluminación, tinsión, ópticas diferentes, o se tiene la tarea de estudiar un gran número, el trabajo
de analizarlas se vuelve tedioso, monótono y propenso a errores. Para poder automatizar las
tareas relacionadas con el uso de imágenes con partículas, resulta necesario desarrollar
algoritmos de análisis de imágenes que sirvan como herramientas para el analista humano.
Las aplicaciones de análisis de imágenes que hacen uso de la segmentación, se sabe que
este es un proceso fundamental, ya que esto equivale a realizar funciones preceptúales
parecidas a las del ser humano, en donde se distinguen los diferentes objetos que forman a una
imagen, esto supone la capacidad de extraer a los objetos interesantes.
En éste trabajo se presenta un algoritmo de segmentación por agrupamiento, aplicado a la
caracterización de glóbulos blancos, a pesar de las condiciones tan diferentes entre las muestras
(tipo de iluminación, características de la partícula, ausencia o presencia de ruido, tipo de
tinción), este algoritmo es capaz de extraer correctamente a los glóbulos blancos para
posteriormente, realizar sobre ellos la extracción y el análisis de sus características.
El algoritmo aquí propuesto esta estructurado en tres etapas:
1 Mejora de imágen
2 Segmentación por K-means
3 Segmentación por umbralización
Para la primera parte se hace una mejora a la imágen original, esta mejora consiste en
eliminar píxeles de la imagen que no cumplan con características establecidas y que son
explicadas en el capitulo 3, el resultado de esta mejora es una imagen que en su histograma
presenta tres picos relevantes los cuales son de gran utilidad en la siguiente etapa.
La segunda etapa esta basada en el algoritmo de segmentación K-means, la idea en esta
parte es adaptar este algoritmo para el dominio de imágenes de medula ósea.
La tercera parte esta basada en la segmentación por umbralización, esta etapa solo será
usada en caso de que la imágen de salida de la etapa dos no sea segmentada correctamente, es
decir, que se tengan células distintas a los glóbulos blancos, la idea es hacer a este nuevo
algoritmo más robusto a los cambios de tinción en las imágenes.
Para evaluar el rendimiento del algoritmo propuesto se abordaron varios tipos de tinciones
(azulaceas, rosadas, rojas, violetas, moradas), todos con condiciones totalmente diferentes entre
sí, aunque existen características que prevalecen en todos los casos, como la presencia de
regiones de interés (glóbulos blancos), un fondo y glóbulos rojos.
Los resultados obtenidos y presentados en esta tesis se obtuvieron haciendo un análisis
visual de las regiones segmentadas, también se hace una comparación visual entre la
segmentación realizada por la herramienta de procesamiento de imágenes ImageJ y la
segmentación realizada por el algoritmo aquí propuesto, finalmente se presentan porcentajes de
error en la segmentación. En todos los casos de evaluación los resultados obtenidos
demostraron que el algoritmo segmenta de manera eficaz las regiones de interés (glóbulos
blancos).
III
Abstract.
Tasks like analysis of blood, weave analysis, analysis of substances among others, are
related to the use and interpretation of images that contain particles, these tasks are made by
human experts. When the images present different conditions of illumination, coloration, optical,
or the task is had of studying a great number, the work to analyze them becomes tedious,
singsong and prone to errors. In order to be able to automate the tasks related to the use of
images with particles, it is necessary to develop algorithms of analysis of images that serve like
tools for the human analyst.
In applications of analysis of images that make use of the segmentation, one knows that
this it is a fundamental process, since this is equivalent to make preceptúales functions similar to
those of the human being, in where the different objects are distinguished which they form to an
image, this supposes the capacity to extract the interesting objects.
This work presents an algorithm of segmentation by group, applied to the white globule
characterization appears, in spite of the so different conditions between the samples (type of
illumination, characteristics of the particle, absence or presence of noise, type of tinción), this
algorithm is able to extract correctly to white globules for later, to make on them the extraction
and the analysis of its characteristics.
The algorithm proposed this structured in three stages here:
1 Improvement of image
2 Segmentation by K-means
3 Segmentation by umbralización
For the first part an improvement to the original image becomes, this improvement consists
of eliminating píxeles of the image that does not fulfill established characteristics and that are
explained in capitulate 3, the result of this improvement is an image that in its histogram presents
three excellent tips which are very useful in the following stage.
The second stage this cradle in the algorithm of K-means segmentation, the idea in this
part is to adapt this algorithm for the dominion of images of medula bony.
The third part this cradle in the segmentation by umbralización, this single stage will be
used in case that the image of exit of the stage two is not segmented correctly, that is to say,
which cells different from white globules are had, the idea is to do to this new more robust
algorithm to the changes of coloration in the images.
In order to evaluate the yield of the proposed algorithm several types of colorations were
approached (blue, pink, red, violet, dwelled), all with totally different conditions to each other,
although characteristics exist that prevail in all the cases, as the presence of interest regions
(white globules), a red bottom and globules.
The results obtained and presented in this thesis were obtained making an analysis visual
of the segmented regions, also is made a visual comparison between the segmentation made by
the tool of image processing ImageJ and the segmentation made by the algorithm proposed here,
finally percentage of error in the segmentation appear.
IV
Agradecimientos.
A Dios:
Muchísimas gracias por todas las bendiciones que me has dado, por darme la fuerza
necesaria en todo momento, por guiar mis pasos por el camino correcto, por darme a los padres
que tengo, te agradezco por todo lo que soy y por todo lo que tengo, gracias por permitirme
terminar un proyecto más de mi vida, gracias por estar siempre conmigo.
A mi mamá:
Por quererme mucho, por cuidarme, por enseñarme a ser fuerte, por apoyarme siempre
en todo, por tus consejos, por estar conmigo siempre, en estas hojas no cabria todo lo que tengo
que agradecerte pero lo que si puedo decir es que gracias a ti estoy aquí y que sin tu apoyo esto
no seria posible.
A mi papá:
Por que has sido un ejemplo de nobleza, bondad, paciencia y humildad, por apoyarme
siempre, por tus consejos, por ser cariñoso, y podría seguir escribiendo pero no acabaría, así
que solo te digo GRACIAS papá por todo lo que me has enseñado y por quererme tanto.
A mis hijas:
Por hacerme feliz cada día.
A mi hermana:
Porque se que desde donde estas siempre me ves y si hay un ángel que me cuida y esta
con migo ese eres tu.
A Julio:
Por estar conmigo, por siempre tener disposición en ayudarme y dispersar mis dudas, por
echarme porras, muchas gracias por todo.
A Bere:
Gracias amiga por recorrer esta recta final conmigo, y pronto las dos estaremos en la
meta.
Al M. Oscar Romero:
Por ser el culpable de que me guste todo lo relacionado con el procesamiento de
imágenes digitales ya que un buen maestro siempre logra captar el interés de sus alumnos,
gracias por su enseñanza en las aulas, su orientación y apoyo durante el desarrollo de este
trabajo.
Al Dr. Jesús A. Bernal:
Por su amabilidad, confianza, apoyo, cooperación en todo momento y todas sus
atenciones, por brindarme la oportunidad de desarrollar este trabajo.
Gracias a quienes de una u otra manera me han ayudado y me han transmitido su
conocimiento.
V
Dedicatoria.
A mis padres:
Con cariño y admiración a mis padres; por su cariño, sacrificio, esfuerzo, enseñanzas,
orientación, apoyo y ejemplo, por brindarme un hogar cálido y enseñarme que la perseverancia y
el esfuerzo son el camino para lograr objetivos.
A ambos, por sus cuidados y por creer en mí. No pudiendo expresar todo lo que siento por
ustedes, solo digo GRACIAS, éste trabajo también es de ustedes.
VI
Índice.
Resumen II
Abstract III
Agradecimientos IV
Dedicatoria V
Índice. VI
Índice de figuras, gráficas y tablas. VIII

Capítulo 1 Introducción. 1
1.1 Descripción del problema. 1
1.1.1 Motivación 4
1.1.2 Objetivos 5
1.1.2 Aportaciones 5
1.2 Solución propuesta. 5
1.3 Estado del arte 6
1.4 Organización de la tesis. 7
Capítulo 2 Conceptos básicos 9
2.1 Conceptos básicos sobre leucemia 9
2.1.1 Leucemia 9
2.1.1.1 Aguda. 10
2.1.1.2 Crónica 11
2.1.2 Técnicas de Clasificación de Leucemias 11
2.2 Visión por Computadora 12
2.2.1 Imágen digital. 13
2.2.2 Histograma. 13
2.2.3 Espacio de color RGB y HSB 14
2.2.4 Filtrado 15
2.2.5 Segmentación 16
2.2.6 Técnicas de segmentación 17
2.2.6.1 Umbralización 17
2.2.6.1.2 Umbralización fija. 17
2.2.6.1.3 Multiumbralización 18
2.2.6.1.4 Umbralización adaptiva. 18
2.2.6.2 Detección de bordes 19
2.2.6.3 Detección de regiones 19
2.2.5.3.1 División y unión de regiones (Split and Merge) 19
2.2.5.3.2 Segmentación por crecimiento de regiones 20
2.2.5.3.3 Crecimiento de regiones por enlace de centroide 20
2.2.6.4 Clustering o agrupamiento estadístico de píxeles 21
2.2.5.4.1 K-Means 21
VII
2.2.6.4.2 Fuzzy C-Means (FCM) 21

2.2.6.4.3 K-Nearest Neighbor (KNN) 22
2.2.6.4.4 Clasificación jerárquica 22
2.2.7 Operaciones Morfológica 22
2.2.7.1 Dilatación 24
2.2.7.2 Erosión 24
2.2.7.3 Apertura y cierre 25
Capitulo 3 Metodología de solución propuesta 26
3.1 Creación de la Base de Imágenes (Recolección de imágenes) 27
3.1.1 Selección del Subconjunto de Imágenes 28
3.2 Procesamiento de la Imágen 28
Capitulo 4 Pruebas y resultados 38
Capitulo 5 Conclusiones 49
Capitulo 6 Trabajo futuro 51
Apéndice A 52
Glosario de términos 52
Apéndice B 54
Descripción del sistema 54
Bibliografía 55
VIII
Índice de figuras y tablas.
Capítulo 2
Fig. 1) Imágen de célula del ser humano 9

Fig. 2) Representación de una imágen digital. 13
Fig. 3) Histograma 13
Fig. 4) Tetraedro de color RGB 14
Fig. 5) Triángulo de color HSB 15
Fig. 6) Secciones Correspondientes a Filtros Espaciales: (a) Filtro Paso Bajo; (b) Filtro 16
Paso Alto; (c) Filtro Paso Banda.
Fig. 7) División y unión de regiones. (a) Imágen original. (b) Subdivisión de la imágen. (c) 20
Región resultante, Unión de regiones adyacentes.
Fig. 8) Ejemplo de crecimiento de regiones. a) Las semillas introducidas son los valores 2 20
y 6 subrayados. (b-e) Considerar que se emplea el criterio de vecindad 4 y un
píxel cumple el criterio de similitud si la diferencia es menor o igual a 2 para
realizar el crecimiento de las regiones. f) Región resultante.
Fig. 9) Ejemplo de crecimiento de regiones por enlace de centroide. (a) Región original, 21
se establece como semilla el valor 6, media = 6 y tolerancia = 2. (b),.., (f) El
proceso agrega los píxeles que estén dentro del rango de la tolerancia con
respecto a la media, después la media es actualizada. El proceso termina en el
momento que no existen píxeles por agregar. g) Región resultante del proceso
Fig. 10) Representación de una imágen 23
Fig. 11) Elementos estructurales típicos 23
Fig. 12) Ejemplo de dilatación 24
Fig. 13) Ejemplo de erosión 24
Capítulo 3
Fig. 14) Diagrama a bloques del algoritmo 26

Tabla 1) Etapas a las que es sometida una imágen para su segmentación. 28
Tabla 2) Imágenes con diferentes tinciones 29
Tabla 3) Algunos datos obtenidos de análisis hecho a glóbulos blancos con diferentes 30
tinciones.
Tabla 4) Resultado de preprocesamiento a imágenes 31
Tabla 5) Ejemplos donde el preprocesado no es tan óptimo 32
Fig. 15) Diagrama de flujo del algoritmo K-means 33
Fig. 16) Diagrama del proceso de segmentación propuesto 34
Fig. 17) Elementos estructurantes empleados para operación morfológica apertura 37
IX
Capítulo 4
Tabla 6. Imágenes originales y su correspondiente segmentada 38

Tabla 7. Imágenes originales y su correspondiente segmentada 39
Tabla 8. Imágenes binarizadas y su correspondiente con la operación morfológica apertura 41
Tabla 9. Proceso al que es sometida una imágen de medula ósea para su extracción de 42
glóbulos blancos
Tabla 10. Segmentación por K-means con tres grupos de ImageJ. 43
Tabla 11. Segmentación por K-means con cuatro grupos de ImageJ. 44
Tabla 12. Se muestran los resultados de segmentar imágenes preprocesadas con el filtro 45
propuesto en este trabajo y segmentadas con las herramientas para
procesamiento de imágenes ImageJ.
Tabla 13. Resultados de evaluación visual de segmentación 46
Tabla 14. Porcentajes del error de segmentación 47
Tabla 15. Resultados de la evaluación por porcentajes del error de segmentación. 48
1
Capítulo 1. Introducción.
El procesamiento de imágenes en color está motivado por dos factores, en primer lugar,
por una similitud con la visión humana totalmente cromática, y en segundo lugar por que el
análisis de imágenes proporciona información mas detallada que el ojo humano, este campo ha
cobrado mucha atención en los últimos años, en el área de la medicina, fisiología y biología, en
el tratamiento de imágenes digitalizadas correspondientes a muestras bio-médicas como tejidos
musculares, cerebrales y otras, que requieren de la creación de herramientas que ayuden al
usuario (médico, biólogo, fisiólogo, etc.) tanto en el diagnóstico como en el tratamiento clínico.
La visión por computadora estudia los métodos que permiten recibir información,
procesarla y tomar decisiones, produciendo resultados finales que son de utilidad para el
hombre, algunas tareas a las que la visión por computadora da solución son; seguir un objeto en
movimiento, determinar la distancia de un objeto, caracterizar células en imágenes médicas,
caracterizar objetos macrométricos y milimétricos, identificar patrones.
La segmentación consiste en separar una imágen digital en los objetos que la forman, un
adecuado método de segmentación es la clave para el correcto análisis y procesamiento de
imágenes.
El proceso de segmentación de imágenes es uno de los pasos en el procesamiento
automático de imágenes más difícil, ya que encontrar un algoritmo de segmentación universal,
válido para todo tipo de aplicaciones, seria muy difícil, esto se debe a que cualquier problema
que se pueda resolver usando la segmentación tiene necesidades particulares, por ello, no se ha
desarrollado ningún método estándar para el proceso de segmentación. Lo que existe es una
colección de métodos con un cierto grado de popularidad y que funcionan bajo ciertas
condiciones.
Diversas aplicaciones para caracterizar partículas (leucocitos, hepatocitos, astrocitos), han
sido desarrolladas, sobre todo en los últimos años, algunas enfocadas al conteo, medición y
seguimiento de objetos. En todos ellos, el principal problema a resolver es el proceso de
segmentación. Factores como el ruido, cambios en la iluminación, sensor, óptica entre otros
hacen de esta tarea un proceso nada trivial.
1.1 Descripción del Problema
La leucemia es el cáncer de la sangre que se desarrolla en la médula del hueso, la médula

ósea es el centro esponjoso y suave que tienen los huesos largos, y que producen las tres
células principales de la sangre: Los glóbulos blancos, que luchan contra la infección, los
glóbulos rojos, que transportan el oxígeno, y las plaquetas que ayudan con la coagulación de la
sangre y detienen los sangrados.
Cuando un individuo tiene leucemia, la médula ósea, por razones que aún se desconocen,
comienza a fabricar glóbulos blancos que no maduran correctamente, pero que continúan
reproduciéndose. Las células normales, sanas, únicamente se reproducen cuando hay suficiente
espacio para ellas y el cuerpo puede regular la producción de células al enviar señales para
2
parar dicha producción, cuando se sufre de leucemia, dichas células no responden a las señales
de cesar la reproducción, aunque ya no haya espacio para ellas.
Las células anormales se reproducen muy rápidamente y no funcionan como glóbulos

blancos sanos, cuya tarea es combatir las infecciones. Cuando los glóbulos blancos son
inmaduros se consideran como no sanos y son llamados blastos, los cuales comienzan a
desplazar a las células sanas de la médula ósea y es entonces cuando el individuo experimenta
los síntomas como infecciones, anemia, sangrado, que son clásicos en personas con leucemia.
En México, estudios realizados por el Laboratorio Clínico del Instituto Nacional de

Cancerología de la Secretaría de Salud, reportaron que el trastorno de leucemia afecta a 1.5
personas por cada 10 mil habitantes. Actualmente 80 mil mexicanos padecen de leucemia y
cada año se suman 2 mil casos más [1]. En el caso de los infantes actualmente se registran 64
casos por cada millón de niños, una de las tasas más altas a nivel mundial [2]. En el mundo se
detectan entre 500 y 600 mil casos cada año.
La leucemia puede manifestarse a cualquier edad, aunque es más frecuente en los niños
entre 2 y 6 años de edad. Esta enfermedad se presenta con una frecuencia ligeramente mayor
en los varones que en las mujeres y es más común en niños caucásicos que en niños africano-
americanos o de otras razas [1].
Existen tres tipos principales de leucemia según la bibliografía citada [3]:
 Leucemia linfocítica aguda (acute lymphocytic leukemia, ALL): también llamada

linfoblástica o linfoide, representa el 75 por ciento de los casos de leucemias infantiles.
En este tipo de trastorno, la afección se encuentra en los linfocitos, que son los que
combaten a las infecciones, lo que sucede es que en la médula ósea produce un exceso
de linfocitos que no maduran correctamente, y estas desplaza a las demás células
sanguíneas, ocasionando que no realicen adecuadamente su trabajo de combatir las
infecciones.
 Leucemia mielógena aguda (acute myelogenous leukemia, AML): también llamada
granulocítica, mielocítica, mieloide o mieloblástica, representa alrededor del 19 por
ciento de los casos de leucemias infantiles. La AML en médula ósea produce un exceso
de granulositos, un tipo de glóbulo blanco que normalmente combate las infecciones. En
este tipo la médula ósea produce un exceso de granulositos que no maduran
correctamente y que desplazan a las demás células sanguíneas, ocasionando que no
realicen adecuadamente su trabajo de combatir las infecciones.
 Leucemia mielógena crónica (chronic myelogenous leucemia CML):
La CML, también llamada leucemia mieloblástica, la médula ósea produce un exceso de
granulositos, un tipo de glóbulo blanco que normalmente combate las infecciones. En
este tipo de trastorno, la médula ósea produce un exceso de granulositos que no
maduran correctamente y que desplazan a las demás células sanguíneas sanas,
produce un reordenamiento cromosómico específico el cual cambia la posición y las
funciones de determinados genes y tiene como consecuencia un crecimiento celular
descontrolado.
3
La diferencia entre la leucemia linfocítica y la leucemia mielógena es la etapa de desarrollo

de la denominada célula madre pluripotente, la cual atraviesa varias etapas de desarrollo. La
leucemia está determinada por la etapa de desarrollo en que se encuentra la célula cuando se
vuelve maligna o cancerosa.
Las células madre maduran como células linfoides o células mieloides. A su vez, las
células linfoides maduran como linfocitos B o linfocitos T. Si la leucemia se presenta en alguna
de estas células, se denomina leucemia mielógena aguda (ALL). Si la leucemia se detecta en
una etapa más avanzada del desarrollo de las células, puede clasificarse tanto como ALL de
células B o ALL de células T. Cuanto más avanzada sea la etapa de maduración de las células
madre, más difícil será el tratamiento [3].
El primer paso para la detección de leucemia es por medio de una biometría hemática.
Una Biometría Hemática, es un estudio que arroja cantidades y porcentajes de los diferentes
tipos de células en la sangre (glóbulos rojos, glóbulos blancos y plaquetas).
Si al realizar este estudio se detecta una anormalidad en los porcentajes de los glóbulos
blancos o existe la presencia de blastos, se procede a un análisis morfológico de las células a
través de la observación de un frotis de sangre por medio de un microscopio óptico, a esta
técnica de analizar las células a través de un microscopio se le llama “Microscopía Óptica”.
Si se determina a partir del análisis morfológico que el paciente padece de una leucemia
linfoblástica o mieloblástica se realiza un examen de inmunofenotipo por citometría de flujo para
confirmar el padecimiento y saber el subtipo de leucemia que afecta al paciente y dependiendo
de este resultado, será el tipo de tratamiento de quimioterapia que se le proporcionará [19].
La fase del análisis morfológico requiere de una detallada observación de los frotis por
parte de expertos, sabemos que la capacidad de observación del ojo humano puede estar
limitada por diversos factores tales como el cansancio, estrés, condiciones en el entorno etc.,
que obstaculizan la identificación de detalles importantes que no favorezcan a la detección de
leucemia, por lo que este estudio resultaría ser vulnerable a errores y por lo tanto llegar a un
diagnostico no tan certero.
Por otra parte para tener un buen control médico sobre leucemia, es necesario que los
pacientes sean sometidos a análisis moleculares que determinan la expresión normal o anormal
de la enfermedad, criterio bajo el cual se define el seguimiento o modificación del esquema del
tratamiento, estos estudios son muy costosos y deben repetirse por lo menos cada tres o cuatro
meses a lo largo del año en que se detecto la este trastorno, lo que significa una erogación
importante para las instituciones de salud y para el enfermo.
Por lo anterior surge la necesidad de contar con herramientas que ayuden al quehacer de
los médicos y químicos para el análisis morfológico de los frotis que permitan determinar si el
paciente padece de un tipo de leucemia. Una alternativa para el desarrollo de estas herramientas
es el uso de las computadoras, las cuales ofrecen ventajas como velocidad, capacidad de
almacenamiento y un alto nivel de procesamiento.
4
1.1.1 Motivación
La detección de leucemia durante mucho tiempo se ha hecho con métodos manuales, y
requieren de la supervisión de expertos tanto químicos para la preparación de las muestras
como médicos para la evaluación y diagnóstico, en este proceso la observación se lleva a cabo
por el método tradicional de evaluación manual, de este punto se presentan problemas tales
como contratar personal especializado en identificación de esta enfermedad, es un proceso
manual, cansado, tardado y costoso.
En el proceso de observación de las células a partir de muestras sanguíneas tiene la

problemática de que existen errores en la clasificación que varían según la experiencia de los
expertos y que van de un 30% a un 40%. Además, existen detalles de las células que son muy
difíciles de percibir a través de la vista humana, igualmente otros aspectos que provocan que el
diagnóstico no sea lo suficientemente certero son la fatiga visual y la experiencia del químico o
médico en la exploración y análisis de los frotis.
Debido a esto, los hospitales que cuentan con un citómetro de flujo en la mayoría de los
casos omiten el análisis morfológico de las células y de la Biometría Hemática y pasan
directamente al análisis por citometría
El problema es que el citómetro de flujo es un equipo con un costo elevado, por lo que
muy pocos hospitales cuentan con el. Por lo anterior, en la gran mayoría de los laboratorios u
hospitales realizan un análisis morfológico de las células como un primer filtro para la detección
de leucemias u otras patologías [19].
Una alternativa para el análisis de muestras sanguíneas consiste en tomar fotografías

digitales de las mismas (digitalización), con imágenes digitalizadas es posible emplear técnicas
de visión por computadora para la detección de este trastorno, la identificación de estas células
en imágenes digitales se hace por medio de técnicas de procesamiento y clasificación de
imágenes.
El trabajo en segmentación de imágenes médicas y en especial de células ya cuenta con

una trayectoria importante en el ámbito computacional, sin embargo, estudios en segmentación
de imágenes con leucemia Mieloblástica Aguda y Leucemia Linfoblástica Aguda aun no se han
desarrollado, cabe mencionar que existen trabajos realizados en segmentación de células sobre
imágenes médicas, sin embargo todos ellos fueron hechos para resolver una problemática
específica por lo que sus soluciones no resuelve el problema de segmentación de glóbulos
blancos. Sin embargo sus metodologías desarrolladas aportan ideas para el desarrollo de la
solución.
En este proyecto existen requerimientos específicos que si bien nos permiten usar
algoritmos o herramientas ya existentes proporcionando un resultado parcialmente bueno, es
decir, que de un conjunto de imágenes no siempre devuelve la región de interés (glóbulos
blancos), por lo que es necesario desarrollar un procedimiento bajo el dominio de imágenes con
leucemia Mieloblástica Aguda y Leucemia Linfoblástica Aguda (glóbulos blancos).
5
1.1.2 Objetivos
El Objetivo General de este trabajo de investigación es:
 Elaborar un método para segmentar automáticamente células de leucemia
Mieloblástica Aguda y Leucemia Linfoblástica Aguda en base al algoritmo de
clasificación k-means a partir de imágenes digitales de médula ósea.
Los objetivos particulares de este trabajo de investigación son:
 Implementar el algoritmo k-means.

 Adaptar el algoritmo k-means para la tarea de segmentación en el dominio de las
células de leucemia.
 La imagen segmentada debe presentarse en color original.
 Automatizar la selección de semillas para la detección de regiones.
 Evaluar la precisión de la segmentación de las células de leucemia con el método
implementado.
 Comparar los resultados de segmentación con otros algoritmos y herramientas.
1.1.3 Aportaciones
 Implementación y adaptación del algoritmo k-means para la segmentación de
imágenes de muestras de medula ósea con leucemia.
 La base para el desarrollo de una herramienta de apoyo al diagnóstico médico para
la identificación de leucemia.
1.2 Solución Propuesta

En este trabajo de investigación se aborda el problema de identificar leucemia (glóbulos
blancos) y separarlas del resto de información de la imagen, a partir de imágenes de células de
médula ósea utilizando técnicas de Visión por Computadora.
Antes de realizar el proceso de segmentación, se realiza un preprocesado a la imagen, en

este paso se utilizó un filtro basado en umbrales el cual elimina notoriamente información no
deseada en la imagen, esto ayuda a facilitar el proceso de segmentación.
El algoritmo de segmentación propuesto está basado en un algoritmo de agrupamiento,

combinado con una etapa de umbralización, lo que hace que sea en gran medida robusto a los
cambios de iluminación y presencia de ruido.
La idea del proceso de segmentación es encontrar el valor de los centroides de manera

automática, que permiten segmentar correctamente las regiones de interés, la segunda etapa del
algoritmo realiza una segmentación por agrupamiento de píxeles, dicho agrupamiento se realiza
por distancia a los centroides, finalmente y en caso de que la imágen resultante del paso anterior
6
lo necesite se hace una segmentación por umbralización, el objetivo es hacer al algoritmo aún
más robusto a los cambios de tinción, iluminación y presencia de ruido en las imágenes.
Después del proceso de segmentación las imágenes resultantes pueden presentar ruido
el cual es considerado basura ya que no aporta información significativa de glóbulos blancos, por
ello es eliminado por medio de operaciones morfológicas.
Se evaluó de manera visual cada una de las etapas del algoritmo, los resultados obtenidos
de cada etapa demuestran que son óptimos para que en conjunto puedan llegar a una
segmentación satisfactoria.
1.3 Estado del Arte
Recientemente se han generado una gran cantidad de trabajos que presentan técnicas,
modelos y algoritmos para la segmentación. Sin embargo se ha desarrollado poca investigación
desde la perspectiva computacional para imágenes de medula ósea obtenidas por medio de un
frotis y un microscopio óptico.
El procesamiento digital de imágenes ha sido explorado en diversos trabajos para extraer

características a partir de imágenes de células como en la investigación titulada Procesamiento
digital de imágenes biomédicas [4], se resuelve el problema de determinar el nivel de astrocitos
en cultivos de células sometidas a radiación no ionizante, la cuantificación del nivel vírico en las
células, la extracción de vesículas y canales de comunicación entre células. Como un primer
paso se hace una segmentación de las imágenes por medio de la detección de bordes, la cual
es una técnica de movimiento de píxeles basada en los gradientes de energía residentes en la
misma. Define una serie de parámetros de movimiento e inicialización de forma conveniente, los
píxeles pertenecientes al borde pueden converger a los límites de forma correcta y precisa.
Otra investigación relacionada es [5] la realizada por, Carlos Platero en su investigación

en el Análisis de imágenes biomédicas en color procedente de microscopía, se presenta un
marco de trabajo para la segmentación de cuerpos biológicos procedentes de imágenes en color.
La estrategia de segmentación se sustenta en tres pasos: a) Selección del espacio de
representación de los colores, b) Técnicas de procesamiento vectorial empleando morfología en
color, c) Proceso de segmentación en dos etapas, una de determinación de las regiones de
interés y la segunda de refinamiento en la segmentación de los cuerpos biológicos. Según los
pasos establecidos se determinan las regiones de interés. Este trabajo nos permite pensar en la
idea de hacer pre-procesamiento a las imágenes de leucemia antes empezar con una
segmentación.
C. Platero Dueñas y Asensio Madrid en su trabajo [6], Difusión no lineal sobre imágenes
de color procedentes de microscopía, se determina el nivel de infección del virus C (hepatitis)
sobre pacientes, se contabilizan los hepatocitos y señales de virus C. Este trabajo nos dice que
el sistema RGB es muy sensible a las condiciones de iluminación de la escena capturada, por lo
que buscaron espacios alternativos al sistema de representación RGB. El objetivo es el proceso
de difusión, isotrópico y anisotrópico, sobre los canales cromáticos y acromáticos de la imágen,
7
de manera que regularice la imágen y hacer una comparación entre el tensor de Di Zenzo sobre
el sistema RGB a la difusión cromática compleja de HSV. En la comparación entre la difusión
cromática y la geometría de Di Zenzo, descubrieron que la difusión no lineal (aplicando la
geometría vectorial de Di Zenzo sobre RGB) preserva los bordes de los objetos de la escena, la
difusión cromática compleja se va a centrar en la expansión de los objetos cromáticos sobre los
acromáticos y prevalecen las características de cromaticidad, las peculiaridades cromáticas de
los hepatocitos y las señales víricas quedan realzadas en la difusión cromática, no así en la
difusión empleando el sistema RGB.
La investigación realizada por Pinzón [7], en la que se identifican glóbulos rojos infectados
por malaria y obtienen características como son el diámetro de las células, densidad (conteo de
células) y forma. En este trabajo utilizan una modificación de la transformada de Hough para
localizar los objetos circulares en la imagen. Para localizar los parásitos dentro de los glóbulos
rojos utilizan filtros morfológicos, los cuales resaltan los objetos obscuros de menor tamaño
(parásitos).
Trabajos adicionales se han enfocado a distinguir entre anormalidades en la hemoglobina

y la neoplasia hematológica, adquiriendo la característica de alpha-thalassemia utilizando
técnicas de inmunofluorescencia [8], o simplemente se realiza una evaluación núcleo-citoplasma
en frotis de papanicolau para el diagnóstico de la posible existencia de alteraciones pre-
cancerosas o cancerosas [9].
Sin embargo y con base en el estudio del estado del arte, no se han encontrado trabajos
dedicados a la identificación leucemia (glóbulos blancos) empleando técnicas de visión por
computadora y que las imágenes estén bajo diferentes condiciones.
1.4 Organización de la Tesis
En esta sección se presenta un panorama general de la organización del documento,

además se presenta una descripción de lo que se trata cada uno de los capítulos de la tesis.
En el capítulo 2, “Conceptos básicos” se expone términos médicos útiles para empezar a
comprender el trastorno de leucemia, se incluyen conceptos a cerca de leucemia así como las
técnicas de clasificación de la misma. También se realiza una descripción de conceptos de visión
por computadora, tales como técnicas de filtrado, operaciones morfológicas y técnicas
segmentación igualmente se describen algunos algoritmos de segmentación de imágenes.
En el capítulo 3, “Metodología de solución propuesta”, se describe la solución propuesta

para el problema de la segmentación de leucemias mediante técnicas de visión por
computadora, se presentan los fundamentos, la descripción, la implementación y el diagrama de
flujo de cada etapa del algoritmo: pre-procesado, segmentación por clusterización y
umbralización.
En el capítulo 4, “Pruebas y resultados obtenidos” se describen las pruebas realizadas

sobre imágenes de leucemia con distintas tinciones para evaluar el rendimiento del algoritmo
8
propuesto y se proporcionan los resultados que demuestran la eficacia del algoritmo, también se
muestran los resultados obtenidos para cada etapa de la solución general, así mismo se
presenta una comparación entre los resultados de segmentación que se obtienen del algoritmo
K-means del software ImageJ y el algoritmo desarrollado en este trabajo.
En el capítulo 5, “Conclusiones”, se presentan conclusiones a las que se llegaron después

de esta investigación.
En el capítulo 6, “Trabajo futuro” se define los posibles trabajos futuros que se pueden
realizar tomando como base este trabajo.
En el capítulo 7, “Glosario de términos” se define todos los términos empleados en este

documento y que no fueron completamente especificados.
Finalmente el capítulo 8, “Bibliografía” se muestran las referencias revisadas para el

desarrollo de éste trabajo.
9
Capitulo 2. Conceptos básicos

En este capítulo se describen los términos que se emplean al hablar de cáncer y en
especial de leucemia, así como las técnicas de visión por computadora utilizadas para
desarrollar la solución propuesta, tales como filtros de pre-procesamiento de imágenes,
algoritmos de segmentación basados en clusterización y operaciones morfológicas.
2.1 Conceptos básicos sobre leucemia
2.1.1 Leucemia
Cáncer es el término que se emplea para un grupo de enfermedades que tienen un
denominador común: la transformación de la célula normal en otra que se comporta de forma
muy peligrosa para el cuerpo humano.
La célula es el elemento más simple, dotado de vida propia, que forma los tejidos
organizados. Está compuesta por una masa rodeada de protoplasma que contiene un núcleo.
Una pared celular rodea la célula y la separa de su ambiente. Dentro del núcleo está el ADN, que
contiene la información que programa la vida celular (Fig. 1).
Fig. 1) Imágen de célula del ser humano
La célula se divide y al hacerlo sus estructuras se dividen también en otras

exactamente iguales a las anteriores, con los mismos componentes y funciones que la originaria.
Las células normales crecen a un ritmo limitado y permanecen dentro de sus zonas
10
correspondientes. Las células musculares se forman y crecen en los músculos y no en los

huesos; las de los riñones no crecen en los pulmones, etc. Estas funciones y este ritmo de
crecimiento vienen determinados por el ADN.
La célula normal se convierte en una célula cancerosa debido a un cambio o mutación

en el ADN. A veces esas células, cuya carga genética ha cambiado, mueren o son eliminadas en
los ganglios linfáticos. Pero, otras veces, siguen con vida y se reproducen.
Las células cancerosas tienen un aspecto diferente, ya sea porque su forma ha

cambiado o porque contengan núcleos más grandes o más pequeños, estas células son
incapaces de realizar las funciones que corresponden a las células pertenecientes a ese tejido.
Generalmente se multiplican muy rápidamente, porque les falta un mecanismo de control del
crecimiento, con frecuencia, son inmaduras debido a que se multiplican de una forma muy rápida
y no tienen tiempo suficiente para crecer plenamente antes de dividirse.
Al formarse un gran número de células cancerosas, se amontonan, presionan o

bloquean a otros órganos y les impiden realizar su trabajo. Como no se limitan al espacio
originario donde se forman, y se extienden a otras zonas, se dicen que son invasivas, tienden a
emigrar a otros lugares, a través de la sangre o de la linfa. Las células que se encargan de la
defensa del organismo suelen destruirlas, así separadas, pero si sobreviven pueden producir un
nuevo crecimiento en un lugar diferente, metástasis, y dañar a otros órganos [10].
La leucemia es una enfermedad maligna del sistema hematopoyético, caracterizada por

proliferación clonal no regulada de las células progenitoras no comprometidas o parcialmente
comprometidas, en este proceso, las células malignas sustituyen a las células normales [11]. En
los pacientes, la enfermedad se manifiesta a través de anemia, procesos infecciosos
(neutropenia) o sangrados mucocutáneos (trombocitopenia) moretones, dolor en los huesos y las
articulaciones, dolor abdominal, inflamación de los ganglios linfáticos, dificultad para respirar
(disnea) [3].
La leucemia se clasifica en aguda o crónica de acuerdo al estado de maduración celular

presente de la rama linfoide o mieloide, a continuación se describe cada una de ellas.
2.1.1.1 Aguda.
La leucemia aguda consiste en el crecimiento descontrolado de células hematopoyéticas
o células madre (formadoras de sangre), incapaces de madurar adecuadamente, que llegan a
invadir la mayor parte o la totalidad de la médula ósea, tras lo cual alcanzan la sangre periférica
y, a veces, se producen focos extrahemáticos, en uno o varios órganos del cuerpo, que se
comportan como tumores [10].
El término agudo no implica solamente una población de blastos pobremente
diferenciados, sino que presenta un síndrome clínico fatal dentro de un término de 30 días a
partir del diagnóstico si el paciente no recibe atención inmediata. Este tipo también se
subclasifica en:
Leucemia linfocítica aguda. En este tipo de trastorno, la afección se encuentra en los

linfocitos, que son los que combaten a las infecciones, lo que sucede es que en la
11
médula ósea produce un exceso de linfocitos que no maduran correctamente y que

desplaza a las demás células sanguíneas, ocasionando que no realicen adecuadamente
su trabajo de combatir las infecciones.
Leucemia mielógena aguda. En este tipo la médula ósea produce un exceso de
granulositos que no maduran correctamente y que desplazan a las demás células
sanguíneas, ocasionando que no realicen adecuadamente su trabajo de combatir las
infecciones.
Las causas que provocan este tipo de leucemia se desconocen, pero se le atribuye una
gran importancia a factores genéticos. Algunos factores externos que pueden coadyuvar al
desarrollo de la enfermedad son: radiaciones, radioterapia, medicamentos o disolventes
orgánicos, entre otros. La leucemia aguda en la población general es de 3 a 6 casos por cada
100,000 habitantes por año [10], con ligero predominio en el sexo masculino. Así mismo, las
leucemias agudas constituyen el grupo de neoplasias más frecuentes en la población infantil, con
40 nuevos casos anuales por cada millón de niños (menores de 15 años). De estos, el 80%
corresponde a leucemias agudas linfoblásticas y el 20 % a leucemias agudas mieloblásticas [12].
2.1.1.2 Crónica.
Existen varios tipos de leucemias crónicas según sean las células alteradas. Así, se
tienen los síndromes linfoproliferativos crónicos y los síndromes mieloproliferativos crónicos.
Los síndromes linfoproliferativos crónicos. Son una serie de enfermedades producidas

por el aumento descontrolado (de carácter neoplásico) de linfocitos de aspecto maduro y
que cursan con una afectación de la sangre periférica. La mayoría de estos síndromes
están producidos por el crecimiento y multiplicación anormal de los linfocitos B. La
leucemia linfática crónica es, dentro de estos síndromes, la más frecuente en la
población occidental. No se conoce la causa de la enfermedad. Afecta más a los
hombres que a las mujeres, el doble. Su incidencia a los 50 años es de cinco casos por
cada 100.000 habitantes. Siendo a los 70, de 30 casos por 100.000 habitantes.
Los síndromes mieloproliferativos crónicos. Son debidos a una alteración de las células
madre o formadoras de sangre, que hace que se aumente el número de las células
precursoras y de las células maduras que derivan de ellas. Dentro de estos
síndromes, se encuentra la leucemia mieloide crónica. Se ha observado que las
células de los pacientes, con esta leucemia, tienen una alteración en sus
cromosomas. La incidencia máxima se da entre los 40 y 50 años, aunque puede
presentarse a cualquier edad y afecta ligeramente más a los varones [10].
2.1.2 Técnicas de Clasificación de Leucemias.

La técnica de clasificación de leucemias más antigua y reconocida es la morfológica,
también conocida como la clasificación FAB (franco-americana-británica), pero el desarrollo de
nuevas técnicas como la citoquímica, la inmunocitoquímica, la inmunohistoquímica, la
citogenética, etc., han permitido reconocer algunas alteraciones más específicas. A continuación
se describe brevemente cada técnica:
12
Morfológica
En esta técnica, un patólogo (médico que se especializa en el diagnóstico de
enfermedades mediante pruebas de laboratorio) examina cualquier muestra (sangre, médula
ósea, tejido de los ganglios linfáticos o líquido cefalorraquídeo) por medio de un microscopio. Los
médicos verán el tamaño y la forma de las células en las muestras. Según el tamaño, la forma y
la presencia de los glóbulos blancos, los médicos pueden clasificarlos en tipos específicos y así
determinar el tipo de leucemia presente en la muestra: Linfoblástica o Mieloblástica.
Histoquímica
En esta técnica las células de la muestra se exponen a tintes químicos (colorantes) que
reaccionan únicamente con algunos tipos de células leucémicas. Estos tintes causan cambios de
color que se puede observar sólo bajo el microscopio, y estos cambios pueden ayudar al médico
a determinar qué tipos de células están presentes.
Inmunocitoquímica
Durante esta prueba, al igual que en la citometría de flujo, las células de la sangre o de
las muestras de la médula ósea se tratan con anticuerpos especiales. Sin embargo, en vez de
utilizar un láser y la computadora, la muestra se trata de tal forma que ciertos tipos de células
cambian de color. El cambio de color se puede observar únicamente con un microscopio.
Inmunohistoquímica (Inmunofenotipo)
Se basa en la utilización de un anticuerpo específico, previamente marcado mediante un
enlace químico con una sustancia que se puede transformar en visible, sin afectar la capacidad
del anticuerpo para formar un complejo con el antígeno. El complejo antígeno-anticuerpo,
mediante la utilización de alguna de las técnicas específicas (peroxidasa antiperoxidas,
fluoresceína, etc.) permite ser localizado e identificado dentro de la muestra a estudiar.
Citogenética
Es el proceso de analizar y detectar cambios en la forma y número de los cromosomas
de una célula (partes de ADN). Las células humanas normales contienen 23 pares de
cromosomas. Un citogenetista prepara, examina e interpreta el número y la forma de los
cromosomas en las células. En general, las alteraciones cromosómicas asociadas a LMA
corresponden a genes que codifican factores de trascripción de ADN o bien, la regulan,
modificando el “destino” celular. En LLA, 60-75% tienen alteraciones genéticas de estructura,
siendo el factor pronóstico más importante, ya que las características clínicas y de laboratorio de
buen o mal pronóstico se correlacionan con este tipo de alteraciones [19].
2.2 Visión por Computadora
La visión es uno de los mecanismos sensoriales de percepción más importantes en el

ser humano, en este mecanismo se inspiran los desarrollos de visión por computadora, los
cuales sugieren la existencia de diferentes tipos de tratamiento de la información visual
dependiendo de metas u objetivos específicos, es decir, la información visual percibida es
procesada en distintas formas con base en las características particulares de la tarea a realizar,
13
por esto la visión por computadora propone varias técnicas que permiten obtener una
representación del mundo a partir del análisis de imágenes, así, la imagen es procesada de tal
forma que el resultado sea el conjunto de características que definen el problema a resolver tales
como las diferentes zonas de color, presencia o no de objetos en movimiento, texturas y forma
de objetos.
El procesamiento de imágenes comprende aquellos algoritmos cuya finalidad es mejorar

la apariencia de la imágen original y extraer determinadas características de la imágen [13].
2.2.1 Imágen digital.

Una imágen es representada de forma digital como una matriz de M X N elementos. Cada
uno de los vértices en la matriz I[i] [j] (Fig. 2), representa un píxel. Cada píxel tiene un valor
numérico asociado, que representa el valor de intensidad o brillo del píxel dentro de la imágen.
El número de bits usados para almacenar información del nivel de gris de cada píxel
define la resolución de la imágen. Usualmente, para almacenar esta información de un píxel se
emplea 1 byte (8 bits), esto proporciona capacidad de almacenar hasta 256 valores o niveles de
gris, donde el valor 0 corresponde al más oscuro y el 255 para el más claro [13].
j
I[i][j]
i
Fig. 2) Representación de una imágen digital.
2.2.2 Histograma.
Un histograma es un resumen gráfico de la variación de un conjunto de datos (Fig. 3). La
naturaleza gráfica del histograma nos permite ver comportamientos que son difíciles de observar
en una simple tabla numérica.
Variación
7
6
5
4
3
2
1
0
Datos
Fig. 3) Histograma
14
Sabemos que los valores varían en todo conjunto de datos, esta variación sigue cierto
comportamiento.
El propósito del análisis de un histograma es, por un lado, identificar y clasificar el
comportamiento de variación, y por otro desarrollar una explicación razonable y relevante del
comportamiento. La explicación debe basarse en los conocimientos generales y en la
observación de las situaciones específicas. Las pautas habituales de variación más comunes
son la distribución en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico
aislado, o con un pico en el extremo [13].
2.2.3 Espacio de color RGB y HSB
El espacio RGB es un espacio de color tridimensional cuyas componentes son el rojo, el

verde y el azul que forman un color dado.
Cualquier color expresado en espacio RGB es una mezcla de tres colores primarios: rojo, verde
y azul, para indicar con qué proporción mezclamos cada color, se asigna un valor a cada uno de
los colores primarios, el valor 0 significa que no interviene en la mezcla, y a medida que ese
valor aumenta más intensidad aporta a la mezcla, de manera estándar, la intensidad de cada
una de las componentes se mide según una escala que va del 0 al 255.
Los espacios de color basados en RGB se pueden visualizar en un cubo (Fig. 4), con las
esquinas de negro, los tres primarios rojo, verde y azul, los tres secundarios cian, magenta y
amarillo, y el blanco [14].
Figura. 4. Tetraedro de color RGB
El modelo HSB se basa en la percepción humana del color. En este modelo, todos los
colores se describen según tres características fundamentales [15]:
Tonalidad.- Es el color reflejado o transmitido a través de un objeto. Se mide como una posición
en el círculo de colores estándar y se representa como un ángulo cuyos valores posibles van de
0 a 360° (Fig. 5. Tono).
15
Saturación.- Indica la pureza del color, se representa como la distancia al eje de brillo negro-
blanco. Los valores posibles van del 0 al 100%. Cuanto menor sea la saturación de un color,
mayor tonalidad grisácea habrá y más decolorado estará (Fig. 5. Saturación).
Brillo.- Es la luminosidad relativa del color y básicamente informa de si el color es más claro o
más oscuro y representa la altura en el eje blanco-negro. Los valores posibles van del 0 al 100%
(Fig. 5. Brillo).
Figura. 5. Triángulo de color HSB
2.2.4 Filtrado
Los filtros son operaciones que se aplican a los píxeles de una imágen digital para
mejorarla, resaltar cierta información o conseguir un efecto especial.
El filtrado espacial tiene como objetivo modificar la contribución de determinados rangos

de frecuencias a la formación de la imágen. El término espacial se refiere al hecho de que el filtro
se aplica directamente a la imágen y no a una transformada de la misma, es decir, el nivel de
gris de un píxel se obtiene directamente en función del valor de sus vecinos.
Estos filtros pueden clasificarse basándose en su linealidad [16].
 Filtros lineales (Fig. 6).- Estos a su vez se clasifican en.
o Filtros pasa bajo.- Atenúan o eliminan las componentes de alta frecuencia a

la vez que dejan pasar inalteradas las bajas frecuencia (Fig. 6 a).
o Filtros paso alto.- Atenúan o eliminan las componentes de baja frecuencia
con lo que agudizan las componentes de alta frecuencia (Fig. 6 b).
o Filtros paso banda eliminan regiones elegidas de frecuencias intermedias
(Fig. 6 c).
16
(a) (b) (c)

Fig. 6) Secciones Correspondientes a Filtros Espaciales:
(a) Filtro Paso Bajo; (b) Filtro Paso Alto; (c) Filtro Paso Banda.
 Filtros no lineales.- Al igual que los filtros lineales también operan sobre entornos.
Sin embargo, su operación se basa directamente en los valores de los píxeles en
el entorno en consideración. La clasificación de los filtros espaciales también
puede hacerse basándose en su finalidad [16].
o Filtros de realce.- Elimina zonas borrosas

o Filtros de suavizado.- Difumina la imágen,
o Filtros diferenciales.- Se componen de varios tipos de máscaras
(Laplaciano, Prewitt, Sobel, etc.), y se utilizan para la detección de
bordes.
2.2.5 Segmentación.
La segmentación consiste en dividir una imágen digital en regiones o entidades
significativas, esto es, tomar las partes o segmentos que se pueden considerar como unidades
homogéneas relevantes, con respecto a una o más características.
Sea R la región que incluye la imágen completa, podemos definir la segmentación como
un proceso que divide a R en k subregiones o subconjuntos disjuntos no vacíos R1, R2, R3,..., Rk,
cumpliéndose que [13]:
a) U Ri = R para i = 1, 2, 3,... k,
b) Ri es una región conectada; para i = 1, 2, ..., k
c) Ri ∩ Rj = ∅ para todo i y j, i ≠ j
d) P (Ri) = Verdadero para i = 1, 2,..., n, y
e) P (Ri U Rj) = Falso para i ≠ j,
donde P (Ri) es un predicado lógico sobre los puntos del conjunto Ri.
Las características comúnmente utilizadas para segmentar regiones son: intensidad,

textura, color, gradiente, movimiento, profundidad relativa, entre otras.
En general se asume que píxeles de un mismo objeto comparten propiedades similares,
por ejemplo, el color de los píxeles de un objeto son aproximadamente homogéneos. Aunque en
imágenes del mundo real el color de los píxeles pertenecientes a un mismo objeto puede variar
por variaciones en la iluminación o presencia de ruido en las imágenes. Distinguir este tipo de
variaciones locales en imágenes del mundo real, hace complejo y difícil lograr una segmentación
completa.
17
Las técnicas de segmentación se pueden clasificar en cuatro grandes grupos: basadas en

umbralización, detección de bordes, propiedades locales de la región, agrupamiento y en base a
algunas otras características (textura, movimiento, color, etc.).
Un adecuado método de segmentación es la clave para el buen desarrollo de los pasos
sucesivos en el análisis y procesamiento de imágenes, ya que la segmentación equivale a
realizar funciones perceptúales parecidas a las del ser humano, en donde se diferencian los
objetos de interés de lo irrelevante. Esto supone la capacidad de extraer "estructuras
interesantes" y de usar nuestro conocimiento previo acerca de los objetos, es por esto que
muchos métodos de segmentación han sido propuestos y siguen proponiéndose, siendo éste un
campo de investigación muy estudiado, para reducir los errores producidos por una
segmentación deficiente.
2.2.6 Técnicas de segmentación [18].
 Umbralización
 Detección de bordes
 Detección de regiones
 Clustering o agrupamiento estadístico de píxeles
 Basadas en otras características (textura, movimiento, color, etc.).
o Segmentación de texturas
o Morfología matemática
o Redes neuronales
o Transformada Watershed
o Etiquetado de componentes conexas
o Caracterización de regiones
2.2.6.1 Umbralización
Las técnicas de segmentación basadas en la umbralización consideran únicamente el
atributo intensidad de los píxeles, de acuerdo a esta intensidad, se asocia cada píxel de la
imágen a una determinada clase.
Determinar los rangos que representan a cada clase se puede hacer estableciendo un
valor fijo del umbral U, o determinando el valor U de manera dinámica mediante técnicas
basadas en el análisis del histograma. Este proceso de segmentación es una técnica rápida,
sencilla y fácil de implementar.
2.2.6.1.2 Umbralización fija.

La técnica de segmentación basada en un umbral fijo se puede emplear en imágenes
donde existe suficiente contraste entre los objetos que se desean separar, de esta manera,
establecer un umbral que divida las regiones de interés resulta relativamente sencillo. Para poder
establecer el umbral U adecuado, se debe tener información de la intensidad de cada píxel de
los objetos de interés.
18
La fijación de un umbral se considera una operación que implica pruebas con respecto a
una función U de la forma [19]:
U = U [x, y, p(x, y), f(x, y)]
Donde f(x, y) es la intensidad en el punto (x, y) y p(x, y) es alguna propiedad local del punto.
A partir de la imágen original I (i, j), y el valor U determinado, podemos establecer que la
imágen binaria B (i, j) resultante está definida como [19]:
1, si I(i, j) ≥ U
0, si I(i, j) < U
La efectividad de la técnica de segmentación basada en un umbral fijo, como se puede

observar, depende de la correcta elección del valor U.
Este método ignora las nociones de proximidad y conectividad, por lo que el uso de este
método suele estar limitado a imágenes donde las variaciones de la iluminación y presencia de
ruido, están muy controladas.
2.2.6.1.3 Multiumbralización.
Esta técnica de segmentación consiste en la elección de múltiples umbrales. Este método
se basa en extraer los mínimos relevantes del histograma y usarlos como umbrales para
segmentar la imágen. Los umbrales calculados son: 0, todos los mínimos extraídos del
histograma y 255, por lo que, el número de intervalos calculados es igual al número de mínimos
+ 1; esto permite separar diferentes objetos dentro de una imágen, donde los niveles de gris
difieren. Como imágen resultante obtenemos regiones con etiquetas diferentes.
Sea I (i, j) la imágen original e Is (i, j) la imágen segmentada y R1, R2,..., Rn, los n rangos
de nivel de gris usados para la umbralización, tenemos entonces:
I s (i, j) = 1, si I (i, j)å R1

= 2, si I (i, j) å R2
= 3, si I (i, j) å R3
...
= n, si I (i, j) å Rn
= 0, en otro caso.
2.2.6.1.4 Umbralización adaptiva.

En la mayoría de las imágenes que se encuentran en condiciones reales ocurre que
píxeles del mismo objeto, que en teoría tienen una misma tonalidad, tienen niveles de grises
diferentes, esto porque la iluminación no es uniforme. Partiendo del principio de la segmentación
basada en la umbralización fija, la umbralización adaptiva permite resolver este problema,
haciendo que el valor del umbral varíe en función de las características locales de la imágen [17].
19
El procedimiento para aplicar una umbralización adaptiva consiste de:

1. Dividir la imágen original I(i, j) en subimágenes Ik (i, j) donde los cambios de iluminación
no son tan fuertes.
2. Determinar independientemente un umbral Uk para cada subimágen.
3. Si en alguna subimágen no es posible determinar el umbral, éste se calcula mediante la
interpolación de los valores de los umbrales de subimágenes vecinas.
4. Procesar cada subimágen con respecto a su umbral local.
2.2.6.2 Detección de bordes

Considera el cambio de intensidad que se produce en los píxeles en el contorno o bordes
de un objeto. Dado que se ha encontrado una región con atributos similares, pero se desconoce
la forma del contorno, este último se puede determinar mediante un simple procedimiento de
seguimiento del borde.
Para la imágen binaria, el procedimiento es el de explorar la imágen hasta que se
encuentre un píxel dentro de la región, una vez encontrado un píxel en el interior de una región,
torcer a la izquierda y avanzar, o al contrario torcer a la derecha y avanzar un paso. El
procedimiento se detiene cuando se atraviesa el contorno y el camino vuelve al píxel inicial [20].
2.2.6.3 Detección de regiones

A diferencia de los métodos basados en umbralización, que sólo toman en cuenta el valor
de gris asociado a cada píxel de la imágen, los métodos de segmentación basados en regiones
analizan características locales de un conjunto de píxeles de la imágen (vecindad, conectividad).
2.2.6.3.1 División y unión de regiones (Split and Merge).

Este método basado en regiones, como su nombre lo indica, inicia con una primera fase
donde se divide la imágen en regiones uniformes y en una segunda fase se agrupan imágenes
similares bajo cierto criterio de homogeneidad.
Sea R la región que corresponde a la imágen completa y seleccionando un predicado P,
se realiza la división sucesiva en regiones cuadradas más pequeñas, de tal forma que, para
cualquier región Ri, P (Ri) sea verdadero. El procedimiento comienza con la región R, si P(R) es
falso (Fig. 7 b), se subdivide la imágen en cuadrantes. Si P es falso para algún cuadrante, dicho
cuadrante se subdividirá en subcuadrantes. Este proceso se realiza sucesivamente hasta que no
existan cuadrantes por subdividir. Al finalizar el proceso, la partición final está formada por
regiones adyacentes con propiedades idénticas (Fig. 7 c) [17]. Para satisfacer las condiciones
que rigen la segmentación, fusionaremos dos regiones adyacentes Ri y Rj solo si P (Ri U Rj) =
Verdadero (Fig. 7 c).
20
(a) (b) (c)

Fig. 7) División y unión de regiones. (a) Imágen original. (b) Subdivisión de la imágen. (c) Región resultante, Unión
de regiones adyacentes.
2.2.6.3.2 Segmentación por crecimiento de regiones.
El método de segmentación por crecimiento de regiones, actúa de manera local sobre la

imágen, el objetivo de este algoritmo es unir regiones homogéneas adyacentes espacialmente.
Este método de segmentación considera un píxel como región inicial (semilla), luego
analizando su vecindad, se unen a la región inicial aquellos que cumplan con el criterio de
similitud establecido. De esta manera, la región inicial “crece” hasta detenerse porque el criterio
de similitud no se satisface. La intensidad de los niveles de gris es la característica de similitud
buscada, de esta manera, los píxeles serán conectados si difieren en menos de un valor
constante previamente establecido (Fig. 8), también pueden ser usados otros criterios como la
dimensión esperada o el número de regiones.
En general las técnicas basadas en regiones trabajan mejor en imágenes con ruido, en
donde los bordes son difíciles de detectar.
Fig. 8) Ejemplo de crecimiento de regiones. a) Las semillas introducidas son los valores 2 y 6 subrayados. (b-e)
Considerar que se emplea el criterio de vecindad 4 y un píxel cumple el criterio de similitud si la diferencia es menor
o igual a 2 para realizar el crecimiento de las regiones.
f) Región resultante.
2.2.6.3.3 Crecimiento de regiones por enlace de centroide.

A diferencia de los métodos de segmentación por crecimiento de regiones, este método,
no utiliza la comparación de la similitud de los píxeles vecinos para unirlos, este método explora
la imágen comparando el valor del píxel con la media de las intensidades de un segmento o
región. Si el valor del píxel y la media del segmento están lo suficientemente cercanos, entonces
el píxel es agregado a la región y su media es actualizada. Si regiones no vecinas tienen una
21
media suficientemente cercana, entonces un nuevo segmento es establecido, siendo el píxel en

estudio su primer miembro o también llamado semilla. Si dos regiones diferentes están lo
suficientemente cercanas, las dos regiones son unidas y el píxel es adicionado a la nueva región
(Fig. 9).
Fig. 9) Ejemplo de crecimiento de regiones por enlace de centroide. (a) Región original, se establece como semilla
el valor 6, media = 6 y tolerancia = 2. (b),.., (f) El proceso agrega los píxeles que estén dentro del rango de la
tolerancia con respecto a la media, después la media es actualizada. El proceso termina en el momento que no
existen píxeles por agregar. g) Región resultante del proceso [17].
2.2.6.4 Clustering o agrupamiento estadístico de píxeles

Las técnicas de agrupamiento clasifican los píxeles estadísticamente, sin tener en
cuenta su situación espacial. Es decir, no empleamos información de regiones o de bordes, sólo
información de intensidad de cada punto. La forma más sencilla es aquella en que definimos a
priori el número de clases en que queremos clasificar los píxeles, y seleccionamos ciertas
muestras de cada clase. Esta es la clase de técnicas denominadas supervisadas, las técnicas no
supervisadas son totalmente automáticas y el número de clases se escoge a lo largo del
proceso. A continuación se describen algunos algoritmos de clustering.
2.2.6.4.1 K-Means
Este algoritmo permite determinar iterativamente el centroide de cada uno de los K
clusters y la partición del espacio de los parámetros en K zonas, una para cada cluster.
Partiendo de una estimación inicial para los centroides, se clasifica los datos según esos
centroides. A partir de los datos clasificados para cada cluster se vuelve a determinar el
centroide para ese cluster. Esto se repite hasta que la posición de los centroides de los clusters y
la clasificación de los datos no cambien apreciablemente. La imágen segmentada viene dada
entonces por las etiquetas correspondientes a la última clasificación [22].
 A diferencia de K-means que es una técnica basada en la estadística clásica, Fuzzy C-

2.2.6.4.2 Fuzzy C-Means (FCM)
means proviene de la teoría de los conjuntos difuso lo que permite que un mismo objeto
pertenezca a más de un cluster a la vez, con diferentes grados de pertenencia. Es un algoritmo
de segmentación que actúa sobre casos definidos por atributos numéricos. Como primer paso,
Fuzzy C-Means calcula los centros de los clusters difusos para el número elegido de clusters. A
continuación, calcula el grado de pertenencia de cada caso a cada cluster, y para cada variable.
22
A partir de esta información, y mediante una inspección de los valores calculados, se establece
cuales de las variables son de mayor relevancia para cada cluster y cuales tienen ambigüedades
[23].
 El algoritmo k-NN es un método de clasificación sencillo y eficaz. Su funcionamiento se

2.2.6.4.3 K-Nearest Neighbor (KNN)
basa en dos aspectos claramente diferenciados: una primera parte de entrenamiento y otra de
clasificación de un conjunto de test. Cada ejemplo del conjunto de entrenamiento {x1, x2,. . ., xl}
viene descrito por una serie de características, donde xi º Rn son los vectores de características,
y una clase C que indica su clasificación dentro del problema estudiado. Durante el proceso de
entrenamiento, el algoritmo almacena los ejemplos del conjunto de entrenamiento. Con estos
ejemplos almacenados, el proceso de clasificación es muy simple. Para obtener la clase a la que
pertenece un nuevo vector de test xi, se buscan los k ejemplos del conjunto de almacenamiento
que se encuentren mas próximos a el de acuerdo con la métrica empleada por el sistema y, a
continuación, se ponderan las clases a las que pertenecen dichos ejemplos, utilizando
generalmente un criterio de mayorýa. Aunque es posible utilizar distintas medidas de distancia,
en la mayor parte de los casos se opta por emplear la distancia euclideana [24].
2.2.6.4.4 Clasificación jerárquica

Inicialmente cada punto es un cluster (clasificación ascendente) o una solo clase (clasificación
descendente), en cada paso juntamos pares de clusters mas cercanos, se repite sucesivamente
hasta terminar de agrupar [25].
2.2.7 Operaciones Morfológicas
La morfología matemática se basa en geometría y forma. Las operaciones morfológicas

simplifican las imágenes y preservan las formas de los objetos.
La morfología matemática se puede utilizarse, entre otras, para las siguientes tareas:
– Suavizar los bordes de una región.
– Preprocesamiento de imágenes (supresión de ruidos, simplificación de formas).
– Destacar la estructura de los objetos (extraer el esqueleto, detección de objetos,
envolvente convexa, ampliación, reducción)
– Descripción de objetos (área, perímetro)
– Unir o separar regiones que están unidas o han sido separadas durante la
segmentación.
– Facilitar el cómputo de regiones en una imagen.
Las operaciones morfológicas tienen su principal aplicación en imágenes binarias y los
fundamentos matemáticos fueron concebidos desde el punto de vista de la posición de cada
píxel binario en la imágen en lugar de hacerlo desde el punto de vista de la intensidad. Aunque
existe un tratamiento morfológico para imágenes de grises.
Las operaciones morfológicas que se pueden aplicar en imágenes binarias son Dilatación,
erosión, Transformada Hit-or-Miss, apertura y cierre. Entre las aplicaciones que estas
operaciones tienen sobre este tipo de imágenes se encuentran; extracción de fronteras y
23
componentes conexas, rellenado de regiones, adelgazamiento y engrosamiento, esqueleto y

poda.
Las operaciones morfológicas que se aplican sobre imágenes en escala de grises se
encuentran la dilatación, erosión, apertura y cierre. Las aplicaciones que estas tienen son;
gradiente morfológico, transformada Top-Hat, texturas y granulometrías.
La morfología matemática aprovecha las propiedades de los conjuntos de puntos, los
resultados de la geometría integral y la topología. La premisa inicial consiste en suponer que las
imágenes reales pueden ser modeladas utilizando conjuntos de puntos de cualquier dimensión.
Desde la perspectiva de conjuntos se consideran las operaciones habituales en ellos, entre las
que se incluyen inclusión, unión, intersección, complementario o conjunto vacío.
El tratamiento de las imágenes por computadora utiliza el equivalente digital del espacio
euclídeo, conjuntos cuyos elementos son pares de números enteros en el contexto de las
imágenes binarias.
Un punto se representa por un par de enteros que corresponden a las coordenadas de la
imágen digital. Los puntos que pertenecen a los objetos de la imágen representan un conjunto X.
En imágenes binarias esos puntos son píxeles con valor binario uno. Los puntos del conjunto
complementario Xc corresponden al fondo con valores binarios iguales a cero (Fig. 10).
01110
01110
00110
00110
00000
Fig. 10) Representación de una imágen.
En este caso el conjunto de puntos X considerado exclusivamente los valores lógicos 1

vendría dado por X = {(0,1), (0,2), (0,3), (1,1), (1,2), (1,3), (2,2), (2,3), (3,2), (3,3)}.
Una transformación morfológica Ö viene dada por la relación de la imágen conjunto X, con
otro pequeño conjunto de puntos B, llamado elemento estructural (Fig. 11).
1 11 1
1 ·1 1 1 ·1 1 1 ·0 1
1 11 1
Fig. 11) Elementos estructurales típicos
La transformación morfológica Ö(X) aplicada a la imágen X significa que el elemento

estructural B se desplaza por toda la imágen. B se posiciona sobre algún punto de la imágen, el
píxel de la imágen correspondiente al punto representativo 0 de B se denomina píxel actual. El
resultado de la relación entre la imágen X y el elemento estructural B en la posición actual se
almacena en el píxel actual de la imágen [27].
24
2.2.7.1 Dilatación
La dilatación es una transformación morfológica que combina dos conjuntos usando la
adición de vectores de elementos de un conjunto [28].
AB = {a+b: aA y bB}
O bien, x  AB  x = a+b, aA, bB
Es decir, el conjunto de todos los posibles vectores suma de pares de elementos, uno
perteneciente a A y el otro a B (Fig. 12).
Ejemplo:
A = {(0,1), (1,1), (2,1), (2,2), (3,0)}
B = {(0,0), (0,1)}
AB = {(0,1), (1,1), (2,1), (2,2), (3,0), (0,2), (1,2), (2,2), (2,3), (3,1)}
    
  
      
  
A B AB
Fig. 12) Ejemplo de dilatación
2.2.7.2 Erosión
La transformación morfológica de la erosión combina dos conjuntos utilizando la
sustracción de vectores. Es dual de la dilatación [27].
X B = {d  E2: d+b  X para cada b  B}
Cada punto d del conjunto X, que para nosotros será la imágen, es comprobado; el
resultado de la erosión está dado por los puntos d para los cuales todos los posibles d+b están
en X. La figura 13 muestra un ejemplo del conjunto de puntos X erosionados por el elemento
estructural B [26]:
A = {(1,0), (1,1), (1,2), (1,3), (1,4), (1,5), (2,1), (3,1), (4,1), (5,1)}
B = {(0,0), (0,1)}
A  B = {(1,0), (1,1), (1,2), (1,3), (1,4)}
 
          
  



A B AB
Fig. 13) Ejemplo de erosión
25
Apertura y cierre
En la práctica, la erosión y dilatación se utilizan en pares, la erosión seguida de dilatación
o viceversa. En ambos casos, el resultado de aplicarlos iterativamente es la eliminación de
detalle específico de la imágen menor al tamaño del elemento estructurante, sin una distorsión
geométrica global de las características no suprimidas.
Por ejemplo, efectuar una apertura (erosión-dilatación) por un elemento estructurante con
forma de disco, suaviza el contorno, rompe ligas angostos, elimina pequeñas islas y agudiza
picos.
Realizar una cerradura (dilatación-erosión) por una elemento estructurante con forma de
disco, suaviza el contorno, une roturas angostas y golfos delgados, eliminando pequeños
agujeros, y completa espacios en el contorno.
La propiedad más saliente de estos filtros es que son idempotentes, es decir, la aplicación
consecutiva de una apertura o cerradura no cambia el resultado de la primera aplicación. La
importancia práctica es que constituyen estados completos y cerrados de algoritmos para el
análisis de imágenes porque las formas pueden describirse en términos de los elementos
estructurantes bajo los cuales pueden aplicarse aperturas o cerraduras sin efectuarse cambio
alguno.
El origen del elemento estructurante no afecta el resultado de una apertura o de una
cerradura [28].
26
Capitulo 3. Metodología de solución propuesta

En este capítulo se describe la metodología que se llevo a cabo para el proceso de
extracción de células de leucemia en imágenes de células de médula ósea.
La metodología que se desarrollo esta basada en técnicas de preprocesamiento y

clasificación de imágenes digitales.
Inicio
Recolección de Selección subconjunto

imágenes de imágenes
Preprocesamiento de Análisis de subconjunto

imágen de imágenes en RGB
Segmentación de Eliminación de ruido

imágen filtrada
Fin
Fig. 14) Diagrama a bloques del algoritmo
En el diagrama anterior (Fig. 14) se muestran los pasos que se llevan a cabo para la
extracción de células de leucemia en imágenes de células de médula ósea.
Como primera etapa de la metodología se hace la recolección de información (Fig. 14

Recolección de imágenes), se obtiene un conjunto de imágenes digitales de células de médula
ósea, de este conjunto de imágenes se selecciona un subconjunto (Fig. 14. Selección
subconjunto de imágenes), el cual servirá como objeto de estudio, realización de pruebas y
evaluación de los procedimientos desarrollados.
Cada imágen del subconjunto de imágenes es sometida a un análisis en sus canales RGB
(Fig. 14. Análisis de subconjunto de imágenes en RGB), resultado de este análisis se obtiene un
patrón el cual es usado para hacer una mejora a la imágen en proceso (Fig. 14.
Preprocesamiento de imágen), posteriormente se realiza la segmentación de la imagen (Fig. 14.
Segmentación de imagen filtrada), una vez teniendo la información que necesitamos separada
27
de la que no es útil, hacemos una mejora a la información obtenida de la segmentación (Fig. 14.
Eliminación de ruido).
3.1 Creación de la Base de Imágenes (Recolección de imágenes)
La información utilizada para el desarrollo del proceso de segmentación es un conjunto de

imágenes de células que se obtuvieron a partir de frotis de sangre de médula ósea elaborados
en el laboratorio de química del Hospital de Especialidades del IMSS en San José, los cuales
han sido previamente seleccionados por químicos y/o médicos con el objetivo de digitalizar
aquellos con una mayor calidad de imágen y que sean representativos de los distintos tipos de
leucemia. Acto seguido, se procede a su digitalización, empleando un microscopio óptico Carl
Seizz con lentes 10x, 40x y 100x. Además, este microscopio tiene incorporada una cámara
digital, a través de la cual se conecta a una tarjeta digitalizadora.
El proceso para obtener imágenes digitales a partir de un frotis es el siguiente:
 Primero se limpia el frotis de partículas de polvo o suciedad, colocándolo posteriormente

sobre el portaobjetos del microscopio.
 Se observa el frotis con la lente 10x, para obtener una visión de los campos de mayor
interés del mismo. Cabe hacer mención que de un solo frotis es posible obtener varias
imágenes de interés, las cuales serán seleccionadas por los médicos expertos en la
materia.
 Una vez seleccionado un campo de interés, primero se digitaliza el mismo con la lente a
10x, usando la resolución nativa de la cámara digitalizadora (800 x 600 píxeles).
 Posteriormente, se usa la lente 100x con aceite de inmersión, para ubicar las células de
mayor interés en el campo de observación que se trabaja. Una vez enfocadas, estas se
digitalizan. En este paso se obtienen las imágenes que muestran a mayor detalle las
características de las células.
 Este proceso se repite tantas veces como sea necesario, dependiendo de los campos de
interés que contenga el frotis, lo cual va a depender del criterio del médico (experto en el
dominio).
Las imágenes que se obtuvieron de este proceso de digitalización se almacenaron en

distintas carpetas, con lo cual se tiene un control de las imágenes que correspondan a los
diferentes frotis observados, estas imágenes pertenecen a la Leucemia Linfoblástica Aguda
(LLA) y a la Leucemia Mieloblástica Aguda (LMA). De las imágenes obtenidas se proporcionaron
48 imágenes de ambos tipos de leucemias para el desarrollo de este trabajo de tesis.
28
3.1.1 Selección del Sub-Conjunto de Imágenes
De las 48 de las imágenes con las que se cuenta se separo el 80% que corresponde a 38
imágenes, este 80% de imágenes fueron seleccionadas al azar para el análisis y realización de
pruebas de los procedimientos desarrollados.
3.2 Procesamiento de la Imágen
Utilizando técnicas de preprocesamiento y clasificación digital de imágenes, se procesan

las imágenes de células de médula ósea, para obtener una imágen con solo los glóbulos
blancos.
El proceso al cual se somete la imágen para llegar a la segmentación de glóbulos blancos
se muestra en la Tabla siguiente (Tabla1).
Preprocesamiento Imágen de Medula ósea

Filtro de mejora R>B, G>B y (B-G)>30
Segmentación Segmentación por K-means adaptado
Evaluación de la imágen resultado
En caso de ser necesario segmentar por umbralización en los
canales HSB, H(hue/tono), S(saturation/saturación), B(Bright/Brillo).
Optimizar la imágen segmentada.
Imágen segmentada.
Tabla 1) Etapas a las se somete una imágen para su segmentación.
Como primer paso la imágen de entrada siempre pasa por una etapa de pre-procesado el
cual consiste en la eliminación de píxeles que no cumplen con ciertas características esto se
hace para mejorar la calidad de la imágen que se quiere analizar y de esta manera hacer mas
eficiente la segmentación.
La imágen que se obtiene después de la mejora será utilizada como entrada en el
algoritmo de clasificación K-means, la imágen que resulta después de aplicar este algoritmo
puede llegar a no ser tan satisfactoria como se desea por lo que se hace un análisis de ella, este
análisis consiste en el calculo de porcentajes de color y fondo, si el porcentaje de color es mayor
al porcentaje del fondo es necesario someter a la imágen a una segmentación por umbralización.
Finalmente la imágen resultado será sometida a una mejora final, con la cual se pretende
eliminar píxeles que no pertenezcan a la información que se desea obtener.
En este trabajo de tesis un problema al que nos enfrentamos fue que no todos los frotis
tienen una tinción uniforme (unos son de mejor calidad que otros) por lo que la coloración de las
células es muy variada (unas azuláceas, otras rosadas, rojas y otras violeta) (Tabla 2), lo que
dificulta su segmentación.
Así mismo, se tienen otras dificultades como que en algunos casos los glóbulos rojos son
más obscuros que los glóbulos blancos (lo cual es incorrecto ya que en realidad los glóbulos
blancos son más obscuros que los glóbulos rojos; (Tabla 2. Fig. b, f, g) y en otros casos los
glóbulos rojos se presentan como manchones dentro de la imágen (Tabla 2. Fig. h). Algunos
ejemplos de estos casos se muestran en las imágenes que se presentan en la (Tabla 2).
29
(a) (b)
(c) (d)
(e) (f)
(g) (h)
Tabla 2) Imágenes con diferentes tinciones
Se trató de atacar el problema realizando segmentación por umbralización en nivel de

gris, en los canales R, G, B y en los canales HSB, sin embargo esto no dio resultados
satisfactorios ya que si bien funcionaba para algunas imágenes para otras no, esto se debe a los
diferentes tipos de tinciones que presentan las imágenes de nuestra base de datos.
También se probaron diferentes filtros como preprocesamiento a la imágen para mejorarla
tratando de destacar a los glóbulos blancos (que son las células que nos interesan),
desafortunadamente con esto tampoco se obtuvieron buenos resultados ya que se presenta el
mismo problema, sirve para algunas tinciones y para otras no.
Finalmente se analizó el fondo y cada célula de cada imágen, de esta manera se obtuvo
un patrón de los diferentes colores que toman los glóbulos blancos por las distintas tinciones,
para el análisis de cada célula se utilizó el software para procesamiento de imágenes ImageJ, de
este se fue obteniendo una lista de valores de los canales R, G, B de todas las células que
forman la imágen al igual que del fondo.
30
La Tabla 3 solo muestra algunos datos obtenidos del análisis que se hizo a los glóbulos blancos.
Nombre R G B
137 41 115
127 36 115
106 19 90
113 15 98
105 25 98
80 55 113
92 52 114
112 79 132
70 20 189
45 25 94
116 78 103
160 117 137
139 96 115
135 86 108
52 22 50
142 89 109
158 91 100
198 99 128
122 90 95
209 166 129
154 118 130
155 95 156
119 66 144
242 196 207
145 86 152
170 174 222
142 79 228
162 123 240
147 103 238
103 54 206
180 118 285
Tabla 3. Algunos datos obtenidos de análisis hecho a
glóbulos blancos con diferentes tinciones.
Después de analizar los canales R, G, B de los glóbulos blancos (Tabla 3. R, G, B) el

patrón que se encontró es; R>B, G>B y (B-G)>30, el cual es utilizado para hacer una mejora a la
imagen de entrada, esta mejora consiste en que si un píxel no cumple con; R>B, G>B y (B-
G)>30, entonces el píxel es igual a 0, en cualquier otro caso permanece igual. En la Tabla
4. se muestran algunas imágenes de salida del proceso de mejora de imagen.
31
Imágen Original Imágen Preprocesada
Tabla 4) Resultado de preprocesamiento a imágenes
Como se puede observar en las imágenes anteriores (Tabla 4), la sentencia R>B, G>B y
(B-G)>30, utilizada para mejorar la imágen antes de ser segmentada, logra eliminar en un solo
paso parte de la información que no es útil, el resultado de esto hace que la segmentación
posterior sea mas fácil y eficiente. Cabe hacer mención que esta mejora deja información que
tendrá que ser eliminada en el proceso de segmentación pero jamás elimina parcial o totalmente
los glóbulos blancos.
Existen algunos casos para los que esta mejora deja casi intacta a la imágen, tales como,
si los glóbulos rojos o el fondo se presentan igual o mas oscuros que los glóbulos blancos (pero
esto es debido a la mala tinción del frotis), (Tabla 5). Sin embargo esto no quiere decir que en
estos casos la segmentación fallará.
32
Imágen Original Imágen Preprocesada
Tabla 5) Ejemplos donde el preprocesado no es tan bueno
El efecto que se logra con esta mejora dentro de la imágen es la eliminación de píxeles
que son notoriamente diferentes a los píxeles que forman los glóbulos blancos, con esto no se
obtienen de inmediato únicamente las células de interés ya que en algunas imágenes este
patrón también lo cumplen otras células o el fondo, esta mejora es de gran ayuda ya que
después de esta contamos como máximo con tres colores diferentes sobre la imágen y esto
facilita la segmentación.
Dado que después de la mejora todavía no tenemos únicamente a los glóbulos blancos
fue necesario implementar un algoritmo de segmentación. Así que, una vez finalizado el proceso
de mejora de la imágen, se procede a realizar la segmentación por medio del algoritmo K-means
adaptado y utilizando los canales R (red/rojo), G (green/verde), B (blue/azul).
Para hacer la selección de este algoritmo de clasificación, se utilizó el software ImageJ el
cual cuenta con varios algoritmos de segmentación como Entropy Threshold, Local Threshold,
Otsu Threshold, Maximum Entropy Threshold, Mixture Modeling, Multi Thresholder, K-means y
Coulor Based Thresholding, con los cuales se realizaron varias pruebas y el que presento
mejores resultados sobre el dominio de datos fue K-means. Este algoritmo además de ser
eficiente para nuestro propósito, también tiene la ventaja de ser muy sencillo tanto en concepto
como en implementación (Fig. 15).
33
Inicio
Numero de
cluster k
Centroide
No hay
Movimientos Fin
Distancia del centroide a en los grupos
cada píxel
Agrupar basándose en la
mínima distancia
Fig. 15 Diagrama de flujo del algoritmo K-means
El algoritmo de clasificación K-means es un método de clasificación que separa los datos

en K categorías distintas. Para hacerlo se calculan K puntos que funcionan como centros de
cada categoría, y a cada punto del conjunto de datos se le asigna la categoría cuyo centro esté
más cerca. El centro de cada categoría se define como el centroide geométrico o el punto medio
de los puntos que la conforman; conforme se van recalculando los centroides, los puntos van
cambiando de categoría. El algoritmo se detiene cuando los centroides dejan de moverse [24].
El proceso que se lleva a cabo en la parte de segmentación de este trabajo se muestra a

continuación (Fig. 16).
34
Inicio
Imágen filtrada
Descomponer la imágen
en RGB
Histograma
Centroides
Descomponer la imágen
en HSB
Si
Distancia del centroide a No hay background>55
cada píxel movimientos en los Segmentar por
% al total de umbralización en HSB
grupos píxeles
Agrupar basándose en la
mínima distancia
B (i,Optimización
j)= de
imágen resultado
Fin
Fig. 16) Diagrama del proceso de segmentación propuesto
Teniendo la imágen filtrada se calcula su histograma, para esto y para el procesamiento

posterior la imágen se descompone en sus canales RGB (Fig. 16. Descomponer imagen en
RGB), el histograma es muy importante en este paso ya que es a través de este que se pueden
35
determinar correctamente los primeros centroides, es muy importante que los primeros
centroides que se obtengan sean los (píxeles mas representativos de cada grupo) correctos ya
que de estos depende que la segmentación sea satisfactoria (Fig.16. Histograma).
Una vez calculado el histograma de la imágen, se identifican los tres picos más altos, ya
que estos corresponden a los tres colores más representativos de la imagen y por esta razón se
facilita dividir la imagen en tres grupos, los picos identificados serán asignados como los tres
primeros centroides con los que iniciara el algoritmo de segmentación (Fig.16. Centroides).
El motivo por el cual se usan tres centroides para realizar la segmentación es porque
después del filtro de mejora, la imagen tiene como máximo tres colores diferentes, así, el
histograma de la nueva imágen solo presenta tres picos representativos, el primero se presenta
entre 0-5, y los dos picos restantes se presentan dentro del intervalo de 5-250, así que si se
identifica de manera correcta estos dos puntos podemos dividir la imágen satisfactoriamente en
tres grupos, donde el primero de ellos tendrá todo aquello que se elimino con el filtro de mejora,
el segundo grupo tendrá los glóbulos blancos que es la información que nos interesa y el tercer
grupo contendrá al complemento de los dos grupos anteriores.
Para asegurar que el algoritmo haga la identificación de los glóbulos blancos
correctamente, el segundo centroide debe estar entre los valores 10-200, este umbral fue
obtenido de un análisis de glóbulos blancos en imágenes con el filtro de mejora.
Después de calcular los primeros centroides, se calcula la distancia Euclideana entre cada
centroide y cada píxel que forma la imagen (Fig. 16. Distancia del centroide a cada píxel), la
distancia Euclideana se calcula en base a los niveles de gris de los píxeles seleccionados como
centroides y el resto de los píxeles de la imágen, obteniendo con esto tres matrices de
distancias, de estas se generan los grupos en base a las distancias mínimas a cada centroide
(Fig.16. Agrupar en base a la mínima distancia).
Hasta este momento supondríamos que el grupo que contiene a los glóbulos blancos seria
el grupo 2 dado que este se forma con el centroide que es mas cercano al color de los glóbulos
blancos, sin embargo no toda la información esta en este grupo, ya que en ocasiones algunos
píxeles con información de los glóbulos blancos son clasificados en el tercer grupo esto sucede
normalmente con los píxeles que en el histograma pertenecen o están muy cercanos a un valle.
Para corregir este error, en el algoritmo K-means se filtra el grupo 3 de distancias, el
proceso que se realiza es; se identifican las distancias mínimas con respecto a los otros dos
grupos de distancias, las distancias identificadas corresponden a los píxeles que forman el tercer
grupo, de estas distancias se filtran aquellas que sean mayor a 40, el 40 a pesar que fue una
distancia menor y el píxel que le corresponde debería estar en el grupo tres, indica que el valor
de su píxel correspondiente esta muy alejado del centroide tres, por ello este píxel de la imágen
también pertenece al grupo 2, y debe ser marcado como 0 en el grupo 3.
Todo lo descrito anteriormente se hace en la primera iteración, para cada una de las
siguientes iteraciones se vuelven a calcular los tres centroides pero ahora para cada uno de ellos
se calcula el promedio en nivel de gris de los píxeles que corresponden a su grupo formado en la
iteración anterior.
Cuando ya se tienen los nuevos centroides nuevamente se calcula la distancia entre cada
centroide y cada píxel que forma la imágen, esto se hace de la misma manera que en la primera
interacción, con la distancia Euclidiana en nivel de gris de cada píxel, se generan los grupos en
base a las distancias mínimas a cada centroide.
36
Como ya se mencionó anteriormente hasta este momento en el grupo 1 tenemos gran

parte de la información que deseamos sin embargo podríamos tener información perdida por lo
que para recuperarla hacemos el mismo procedimiento que en la primera iteración, del grupo
tres de distancias, se identifican las distancias mínimas con respecto a los otros dos grupos de
distancias, de estas distancias se filtran aquellas que sean mayor a 40, ya que este valor indica
que su píxel correspondiente esta muy alejado del centroide tres, por ello este píxel de la imágen
también pertenece al grupo 2, y debe ser marcado como 0 en el grupo 3.
Después de generar los tres nuevos grupos se comparan los tres grupos generados en la
iteración anterior, si en alguno de ellos existió algún cambio se repite el proceso, de no ser así,
se detiene, regresando los píxeles de la imágen filtrada marcados en el grupo 1.
Después de aplicar el algoritmo K-means, la mayoría de las imágenes con las que se
realizaron pruebas en este trabajo, resultaron con una segmentación satisfactoria, sin embargo y
debido a que en determinadas imágenes los colores entre glóbulos blancos y glóbulos rojos son
tan semejantes resulta muy difícil la segmentación de los glóbulos blancos por medio de los
canales RGB, así, se tiene que para identificar el tipo de imágenes que presentan una coloración
similar entre glóbulos blancos y glóbulos rojos o imágenes que no estén correctamente
segmentadas, se hace una evaluación de la imágen de salida del algoritmo K-means (Fig. 16. Si
background>55% al total de píxeles).
Esta evaluación consiste en calcular el porcentaje de background y de color, si el
porcentaje de background es menor que el 45% de la imágen original entonces la imágen
necesitará un método alternativo de segmentación.
Esta forma de evaluar la segmentación por medio de porcentajes es valida ya que las
imágenes que se usan en este trabajo tienen la característica, que la información que no
deseamos (fondo y glóbulos rojos) en número de píxeles es mucho mayor que la cantidad de
píxeles de las células que tiene la imágen.
Si la imágen después de pasar por el algoritmo K-means cumple con los porcentajes
correspondientes, podemos afirmar que la imágen no se segmento correctamente, por esta
razón es necesario someter a la imágen a un proceso de segmentación por umbralización en los
canales HSB, este terminará de segmentar a la imágen correctamente, esto se asegurar ya que
el proceso fue aplicado a imágenes que se sabe no son bien segmentadas por el algoritmo K-
means y todas ellas fueron segmentadas correctamente por medio de umbralización en los
canales HSB.
Para llevar a cabo la segmentación por umbralización, se toma la imagen de salida del
algoritmo K-means, esta se descompone en los canales HSB, de los cuales solo utilizaremos H y
S ya que en estos canales se encuentra la mayor parte de información sobre color (Fig. 16.
Descomponer imágen en HSB).
En este paso se dejan pasar aquellos píxeles que en el canal H sean mayores a 238 pero
menores a 360 y en el canal S sean mayores a 28 pero menores a 100, estos umbrales fueron
obtenidos a través de la segmentación manual de una muestra significativa de 25 imágenes en
los canales HS con el software ImageJ (Fig. 16. Segmentar por umbralización en HSB).
Después de estos procesos la imágen resultado puede llegar a presentar algunas
manchas dispersas a lo que le llamamos ruido, para eliminar parte del ruido se identifican
aquellos píxeles que su canal R sea mayor que B y que B sea menor que 80, como sabemos los
glóbulos blancos tienen la característica que el canal B es mayor que el R, aunque para algunas
37
tinciones el canal R es mayor que el B pero también en estas imágenes los glóbulos blancos
tienen la característica que el canal B es mayor a 80 por lo que la sentencia (R>B) and ( B<80)
ayuda a eliminar píxeles que para los algoritmos de clasificación seria difícil diferenciar bajo
nuestras condiciones de segmentación, a demás deja en mejores circunstancias a la imágen ya
que minimiza las manchas de ruido y esto ayuda a que la operación morfológica de apertura
elimina la mayor cantidad de ruido posible.
Se planteó usar la operación morfológica de apertura ya que consiste en hacer una
erosión seguida de una dilatación a la imagen, con la erosión se eliminan las pequeñas manchas
que pudiera presentar la imagen y con la dilatación se recuperan los píxeles de los glóbulos
blancos que fueron erosionados.
En el proceso de erosión se empleo una mascara de 3x3 de la cual los nueve puntos de la
mascara deben coincir para que una vecindad no sea erosionada en cualquier otro caso dicha
vecindad será erosionada (Fig. 17 a), con esta operación se elimina la mayor cantidad de ruido y
también se pierden los bordes de los glóbulos blancos, sin embargo estos se recuperan en el
proceso de dilatación posterior. En la dilatación se emplea una mascara de 3x3 de la cual los
nueve puntos de la mascara deben coincidir para que una vecindad sea dilatada en una
vecindad de 8 en cruz (Fig. 15 b), con esta dilatación se recuperan los bordes de los glóbulos
blancos que se perdieron con la erosión.
1 1 1 0 0 0
1 x 1 0 0 0
1 1 1 0 0 0
a) Erosión
1 1 1 1
1 x 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1
1
b) Dilatación
Fig. 17) Elementos estructurantes empleados

para operación morfológica apertura
38
Capitulo 4. Pruebas y resultados

En este capítulo se presentan los resultados obtenidos durante el desarrollo de esta
investigación.
Los resultados aquí mostrados son pruebas que muestran el desarrollo de este trabajo,
igualmente con esto se muestra todo el proceso por el cual pasa una imágen para poder obtener
de ella los glóbulos blancos que contenga, y pruebas que se llevaron a cabo para llegar a la
solución propuesta por este trabajo de tesis.
Durante el desarrollo de este trabajo se realizaron diversas pruebas las cuales
mencionaremos en este apartado.
Dentro de los filtros que se probaron para el preprocesamiento se encuentran Gaussian,
Mean, Median, Maximum, Minimum, Variance, Convolve, Pseudo Flatfield, Unsharp Mask,
Sigmoide, Contraste, Brillo, Ecualización, de estos los que marcaban mejor las diferencias entre
las células en las imágenes son, Sigmoide, Contraste, Brillo y Ecualización.
Estos últimos fueron aplicados sobre las 38 imágenes de prueba y posteriormente fueron
procesadas por los algoritmos de segmentación K-means y Coulor based Threshold, que se
habían seleccionado por ser los que mejor resultados proporcionaban, en las imágenes
resultantes se observo que los algoritmos de segmentación probados se comportaban mucho
mejor con la imágen original que con algún filtro sobre ellas, por lo que se opto por crear el filtro
que ayudara a eliminar información de la imágen en vez de solo marcar diferencias entre colores
de los objetos que la forman.
En primer lugar se presentan los resultados obtenidos de la segmentación realizada con el
algoritmo propuesto en este trabajo, las imágenes de entrada (Tabla 6. Fig. a, b, c, d), se
consideran sencillas de segmentar ya que los colores que las componen responden
correctamente a las condiciones de preprocesamiento y segmentación por lo que el resultado es
visiblemente satisfactorio (Tabla 6.).
Imágen original Imágen segmentada
(a) (a’)
(b) (b’)
39
(c) (c’)
(d) (d’)
Tabla 6. Imágenes originales y su correspondiente segmentada
En la tabla anterior (Fig. a’, b’, c’, d’) se muestran algunos resultados de la segmentación
los cuales evaluados de manera visual son bastante buenos ya que no se pierden su citoplasma,
las figuras a’, b’, c’, d’ de la Tabla 6 todas las imágenes pasaron solamente por el algoritmo K-
means, ya que según la evaluación que se hace durante el proceso de segmentación determina
que la cantidad de color que quedo en la imágen de salida corresponde a una imágen que ya
esta segmentada correctamente, por lo que ya no es necesario pasarla al módulo de
segmentación por umbralización.
Como segundo punto se presentan los resultados obtenidos de la segmentación realizada
con el algoritmo propuesto en este trabajo, pero en este caso la imágen pasa por el segundo
módulo de segmentación ya que las imágenes de entrada se consideran de mayor dificultad para
ser segmentadas, esto se debe a que las células que no son glóbulos blancos presentan una
coloración bastante similar a la que tienen los glóbulos blancos o en otros casos que los valores
que componen a cada píxel de esas células que no son glóbulos blancos corresponden al umbral
que contiene los valores que forman a cada píxel de los glóbulos blancos.
Como consecuencia de ello, la división entre estos dos tipos de coloraciones muy
similares resulta ser mas difícil de realizar satisfactoriamente por el primer módulo del algoritmo,
por esto la imágen de salida del primer módulo se pasa al segundo módulo del algoritmo, el cual
realiza una segunda segmentación por umbralización en los canales HSB (Tabla 7).
(a) (a’)
40
(b) (b’)
(c) (c’)
(d) (d’)
Tabla 7. Imágenes originales y su correspondiente segmentada
Como se muestra en las imágenes anteriores (Tabla 7), el que la coloración de los
glóbulos rojos sea muy similar a los glóbulos blancos, no implica que los resultados sean
erróneos, ya que precisamente el segundo módulo del algoritmo se propone para resolver este
tipo de problemática y evaluando los resultados de manera visual estos son bastante buenos.
Existen casos como (Tabla 7. Fig. a’), en el cual la coloración de los glóbulos blancos es
muy similar a la que se presentan los glóbulos rojos, por lo que su división resulta bastante difícil.
También se puede llegar a presentar el caso aunque es poco común, en el cual puede
presentarse poca perdida de información de los glóbulos blancos, debido igualmente a la
similitud en coloración entre glóbulos blancos y rojos como se muestra en la (Tabla 7. Fig. d’), en
(Tabla 7. Fig. b’, c’) se puede ver que se obtienen resultados bastante satisfactorios ya que no
hay perdida de información.
Como tercer punto de evaluación se presentan los resultados obtenidos después de
aplicar la operación morfológica de apertura, esta operación se emplea ya que en ocasiones el
resultado de la segmentación presenta pequeñas manchas dispersas en la imágen, a las cuales
llamaremos ruido.
Para eliminar este ruido se propuso aplicar la operación morfológica de apertura, la cual
como se ve (Tabla 8), elimina el ruido significativamente.
En muchos de los casos elimina por completo el ruido que presenta la imágen (Tabla 8.
Fig. b’), y en otros casos ayuda para disminuir el tamaño de cada mancha (Tabla 8. Fig. a’, c’),
lo cual puede ayudar en trabajos posteriores a esta investigación, por ejemplo a la hora de
41
buscar características, de manera visual se sabe que en el tipo de imágenes que estudiamos, los
glóbulos blancos no son tan pequeños por lo que se pueden desechar aquellas manchitas, de no
ser menor en tamaño este ruido algunas manchas por su tamaño pondrían llegar a ser
confundidas con glóbulos blancos y por ello ocasionar errores y también se tendría que invertir
mas tiempo en poder desechar ese ruido.
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 8. Imágenes binarizadas y su correspondiente con la operación morfológica apertura
En la Tabla 9. se muestran dos ejemplos representativos de imágenes fáciles y difíciles de

segmentar, en la primera columna de imágenes (Tabla 9, Fig. a) se muestra una imágen
considerada fácil de segmentar ya que las características de los colores que forman la imágen
responden satisfactoriamente al primer módulo del algoritmo aquí propuesto, por lo que ya no es
necesario someter a la imágen de salida del primer módulo a la segmentación por umbralización.
En la segunda columna (Tabla 9, Fig. b) se muestra el proceso al que es sometida una
imágen considerada difícil de segmentar, este tipo de imágenes se someten a una segunda
segmentación por umbralización ya que el resultado de la primera segmentación no es tan
satisfactorio debido a que los colores de los glóbulos blancos y rojos son muy parecidos, en el
caso particular (Tabla 9, Fig. b) ambos son azules, con distintas saturación pero azules, por eso
se pasa al segundo módulo y como se puede observar el resultado es satisfactorio, ya que el
que sea difícil de segmentar no quiere decir que el resultado tenga que ser erróneo.
42
Nombre de cada (a) (b)

paso del proceso Imágen sencilla de segmentar Imágen difícil de segmentar
Imágen
Original
Imágen
Filtrada
Imágen con
Algoritmo
K-means
Imágen con
umbralización
XXXX
Imágen con
operación
Morfológica
de apertura
Imágen
Resultado
Tabla 9. Proceso al que es sometida una imágen de medula ósea para su extracción de glóbulos blancos
Como cuarto punto de evaluación se muestra una comparación entre la segmentación

realizada con el algoritmo K-means del software ImageJ y el algoritmo desarrollado en esta
investigación, para evaluar este algoritmo se plantea hacer una comparación entre sus
resultados de salida y los resultados arrojados por el algoritmo K-means de ImageJ.
43
Esta comparación se propuso debido a que la herramienta ImageJ fue utilizada a lo largo
del desarrollo de esta investigación y que desde su inicio se deseaba mejorar los resultados de
su algoritmo K-means, la comparación que se realizó se describe a continuación.
Se realizó una segmentación de un conjunto de imágenes con ImageJ (Tabla 10), el
objetivo de esto es empezar a mostrar resultados, los cuales nos ayudan a comprender el
funcionamiento general del algoritmo K-means, y más adelante nos ayudaran a corroborar que el
algoritmo aquí propuesto tiene una mayor efectividad.
Las siguientes imágenes (Tabla 10) muestran algunos de los resultados obtenidos de la
segmentación de imágenes originales con el algoritmo K-means con tres grupos del software
ImageJ.
Imágen Original Segmentación K-means de
ImageJ
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 10. Segmentación por K-means con tres grupos de ImageJ.
Como vemos en las imágenes anteriores (Tabla 10. Fig. a’, b’, c’) se divide la imágen en
tres grupos según el nivel de gris, vemos que los glóbulos blancos si se diferencian en casi todas
las imágenes excepto en la imágen a’ (Tabla 10. Fig. a’), esto por que el nivel de gris de los
glóbulos blancos y los glóbulos rojos es bastante similar, si bien es cierto que en el resto de las
imágenes se logran diferenciar los glóbulos blancos de los rojos, también es cierto que hay
mucha confusión entre estos dos tipos de células debido a los colores tan similares que
presentan, además de perdida considerable de información de los glóbulos blancos.
44
Podría pensarse que si se aumenta el numero se grupos se tendrían mejores resultados

sin embargo no es así. En la tabla siguiente se muestran imágenes segmentadas en 4 grupos
(Tabla 11).
Imágen original Segmentación por K-means

de ImageJ
(a) (a’)
(b) (b’)
(c) (c’)
Tabla 11. Segmentación por K-means con cuatro grupos de ImageJ.
Se ve (Tabla 11. Fig. a’, b’, c’) que presentan mejores resultados, sin embargo no es
completamente satisfactorio ya que no hay una clara separación de los glóbulos rojos y los
blancos además que el hacer 4 grupos no arroja resultados satisfactorios para todo el conjunto
de imágenes con el que se hicieron las pruebas.
Si seguimos aumentando el número de grupos se siguen dividiendo aun más los glóbulos
blancos ya que estos aunque su característica general es que caen en tonalidades moradas, no
tienen un color uniforme.
Para probar únicamente el funcionamiento del algoritmo de segmentación K-means

modificado en combinación con la segmentación por umbralización, se hicieron pruebas con
imágenes preprocesadas con el filtro propuesto en este trabajo. Estas pruebas consisten en
segmentar con la herramienta de prepocesamiento de imágenes ImageJ las imágenes
preprocesadas y comparar el resultado con la segmentación obtenida por el algoritmo propuesto,
en la siguiente tabla (Tabla. 12) se muestran algunos de los resultados obtenidos.
45
Imágen Segmentación ImageJ Segmentación ImageJ Segmentación Algoritmo

Preprocesada 3 grupos 4 grupos propuesto 3 grupos
(a) (a’) (a’’) (a’’’)
(b) (b’) (b’’) (b’’’)
(c) (c’) (c’’) (c’’’)
(d) (d’) (d’’) (d’’’)

Tabla 12. Se muestran los resultados de segmentar imágenes preprocesadas con el filtro propuesto en este trabajo
y segmentadas con las herramientas para procesamiento de imágenes ImageJ.
Como se muestra en la tabla anterior la segmentación por K-means de ImageJ con tres
grupos confunde los glóbulos blancos y rojos en algunas imágenes (Tabla 12. Fig. a’, c’, d’) en
otras logra separar a los glóbulos blancos sin embargo pierde una cantidad de información
considerable de ellos (Tabla 12. Fig. b’) cuando se trata de cuatro grupos en la mayoría de los
casos funciona mejor sin embargo también pierde demasiada información de los glóbulos
blancos (Tabla 12. Fig. a’’,b’’,c’’,d’’) y en algunos casos los pierde por completo (Tabla 12. Fig.
b’’).
Haciendo una comparación entre la segmentación de tres y cuatro grupos con el resultado
de la segmentación del algoritmo propuesto en todos los casos el resultado de este último es
46
visiblemente mucho mejor (Tabla 12. Fig. a’’’, b’’’, c’’’, d’’’). La evaluación de las comparaciones
de los resultados se hizo de manera visual ya que los resultados son notoriamente mejores.
Finalmente para evaluar el resultado de segmentación de manera cuantitativa se
propusieron dos métodos el primero consiste en realizar una evaluación visual con ayuda de
químicos expertos en detección de leucemia, ellos consideran únicamente dos posibilidades,
imagen bien segmentada e imagen mal segmentada.
Se contó con 48 imágenes de las cuales 23 se consideran sencillas de segmentar y 25
consideradas de difícil segmentación, los químicos evaluaron visualmente la segmentación de
las 48 imágenes y de esta evaluación se obtuvo la siguiente tabla (Tabla. 13).
La Tabla 13 muestra los porcentajes obtenidos bajo esta clasificación, esta tabla contiene
4 columnas, la primera titulada “Tipo de imagen” contiene el nombre de cada grupo en que se
clasificaron las 48 imágenes, la segunda columna “Número de imágenes” contiene la cantidad de
imágenes que pertenecen a cada grupo, la tercer columna “Número de imágenes con
segmentación satisfactoria” contiene el número de imágenes consideradas por los expertos con
segmentación correcta y su correspondiente porcentaje, con respecto al numero de imágenes
del grupo al que pertenecen, la cuarta columna “Número de imágenes con segmentación
errónea” contiene el número de imágenes consideradas por los expertos como segmentación
errónea, igualmente contienen su correspondiente porcentaje calculado con respecto al número
de imágenes del grupo al que pertenecen.
Tipo de Número de Número de imágenes con Número de imágenes

imágenes imágenes segmentación con segmentación
satisfactoria errónea
sencillas 23 22=96% 1=4%
Difíciles 25 21=84% 4=16%
Total 48=100% 43=90% 5=10%

Tabla. 13. Resultados de evaluación visual de segmentación
El último renglón de la tabla 13, muestra el número total de imágenes que resultaron con
segmentación correcta y errónea así como sus correspondientes porcentajes, con la evaluación
visual realizada por expertos se puede ver que el 90% del total de imágenes son segmentadas
correctamente y que solo el 10% presentan una segmentación errónea.
El segundo método consiste en calcular el porcentaje de error en la segmentación de cada
imagen, para poder realizar esta evaluación y debido a que no se cuentan con imágenes que se
sepa están segmentadas en un 100%, se propuso el siguiente procedimiento.
 Restar a cada imagen original su correspondiente segmentada, de esta manera se
elimina la región de interés y queda el fondo con la parte de célula(s), que no fueron
incluidas en la segmentación por el algoritmo propuesto.
 Segmentar manualmente la imagen restada por medio de umbralización en HSB y con
ello se obtiene únicamente el complemento de la célula que no fue incluido en el proceso
de segmentación aquí propuesto.
 Obtenida la imagen con la región de error, se suma con la imagen de salida del
algoritmo aquí propuesto, sacamos su histograma, se suman todos los valores del
47
histograma excepto los valores con intensidad 0, recordemos que en 0 esta contenido el
fondo, el total de estos valores corresponde al 100% de glóbulos blancos, de la misma
forma se calcula el histograma de la imagen con la región de error y se suman todos los
valores con intensidad diferente de 0.
 Finalmente se calcula el porcentaje de los píxeles de error con respecto al 100% de
píxeles obtenidos previamente.
Por ello la Tabla 13 muestra los porcentajes obtenidos bajo esta clasificación, esta tabla
contiene 4 columnas la primer columna titulada “No. de Imagen Sencilla” contiene los números
de las imágenes se clasificaron como imágenes sencillas, se cuenta con 23 imágenes de
muestra bajo estas características, la segunda columna “% de error en imágenes sencillas”
muestra en porcentajes el error en la segmentación, considerando que la totalidad de las células
de esa imagen fueron clasificadas correctamente, la tercer columna es homologa a la primer
columna pero para 25 imágenes clasificadas como difíciles, la cuarta y última columna
corresponde al error obtenido de las imágenes difíciles, bajo las mismas consideraciones que
con las imágenes fáciles.
No. de % de error en No. de % de error en

Imagen imágenes Imagen imágenes
Sencilla Sencillas Difícil Difíciles
Sencilla 1 7.6 Difícil 1 4.70
Difícil 24 12.01
Difícil 25 1.83
Tabla 14. Porcentajes del error de segmentación
48
En la Tabla 15 se muestra el promedio total del error tanto para el conjunto de imágenes
sencillas como para el conjunto de imágenes difíciles, como se ve en estos resultados, la
segmentación de las imágenes sencillas y difíciles muestran un error mínimo, por lo que se
puede decir que los resultados de segmentación obtenidos en este trabajo de tesis son
satisfactorios, en esta misma tabla también se presenta el promedio general del error de las 48
imágenes, el cual también es un porcentaje mínimo.
Sencillas Difíciles
Promedio del
los %’s del error 5 7
Promedio General de
los %’s del error 6
Tabla 15. Resultados de la evaluación por porcentajes del error de segmentación.
La literatura nos marca que para la detección efectiva de la leucemia en un paciente, el

químico debe tener una exactitud en su diagnóstico del 80%, por lo cual para este trabajo
consideramos que una segmentación de un 80% es considerada como correcta, ya que muestra
las regiones de interés que ayudarán a los químicos a mejorar su diagnóstico.
Los resultados arrojados de la evaluación (Tabla. 15), muestran que el porcentaje del error
promedio es menor al 20% por lo que se puede afirmar que el algoritmo aquí propuesto es
completamente satisfactorio.
.
49
Capitulo 5. Conclusiones
Con el desarrollo de éste trabajo de tesis, se sientan la base principal para el desarrollo de
un sistema que apoyará al diagnóstico médico, dicho sistema esta enfocado a la detección de
leucemias agudas a partir de muestras de imágenes digitales de células de médula ósea. Con
dicho sistema se busca que el área medica enfocada a la leucemia cuente con una herramienta
de bajo costo de adquisición, pero de alta precisión en el diagnóstico, que además de
proporcionar diagnósticos mas confiables ayudará a mejorar la obtención de información de
médula ósea, corroborar diagnósticos y puede ser empleado con fines académicos como el
entrenamiento de nuevos patólogos, por lo que su desarrollo esta plenamente justificado.
Este trabajo de tesis se enfocó a proponer y desarrollar una metodología para la

segmentación de imágenes de medula ósea, en la cual se incluye análisis de las imágenes,
operaciones morfológicas, implementación de técnicas preprocesamiento y clasificación de
imágenes digitales.
En base a los experimentos y resultados obtenidos en este trabajo de investigación se
puede concluir lo siguiente:
La extracción de glóbulos blancos a partir de imágenes tomadas de frotis de médula ósea
no es una tarea fácil, ya que diversos factores como la tinción, preparación de la muestra,
entornos de iluminación, condiciones de iluminación sobre la escena entre otros cambian
sensiblemente las características de la imágen obtenida.
Por ello, se experimentó en los canales RGB y HSB con diferentes estrategias tanto para
preparar la imágen antes de pasar a su segmentación como para el propio proceso de
segmentación, de las cuales se concluyó que utilizar la sentencias R>B, G>B y (B-G)>30, ayuda
a resolver en gran parte el problema de tener una variedad de frotis con diferentes tinciones, ya
que llega a eliminar bastante información no necesaria pero sin perjudicar a los glóbulos blancos
lo que facilita la segmentación posterior.
Para este paso después de realizar pruebas con diversos algoritmos se concluyó que el
algoritmo más apropiado para este propósito es K-means ya que fue el que presentó mejores
resultados aunque presentaba deficiencias como eliminación y confusión de partes de glóbulos
blancos, las que fueron corregidas en su implementación en este trabajo.
Cuando se habla de trabajar con imágenes en color se dice que es mucho mejor hacerlo
en los canales HSB ya que en estos esta la mayor cantidad de información del color que
percibimos a simple vista [24], sin embargo en este trabajo se opto por trabajar en los canales
RGB ya que en estos se nota claramente la diferencia entre los glóbulos blancos y rojos por lo
que casi no hay perdida de información correcta, además la segmentación en estos canales es
menos complicado, lo que acelera todo el proceso.
Existe un tipo de imágenes para las cuales la segmentación por medio de los canales
RGB no es del todo satisfactoria a lo que recurrimos a finalizar la segmentación por medio de los
canales HSB, cabe mencionar que gracias al preprocesado que se le hizo a la imágen y a la
segmentación con el algoritmo K-means, ya no es necesario implementar un algoritmo robusto
para la segmentación por HSB ya que basta con segmentar por umbralización.
50
El trabajar con los cales HSB tiene ventajas importantes para algunas aplicaciones al igual
que el trabajar con los canales RGB, en este trabajo de tesis se conjugaron las ventajas de
ambas formas de descomponer a la imágen para obtener mejores resultados.
En base a las pruebas realizadas podemos decir que los resultados obtenidos en la
segmentación de imágenes son satisfactorios ya que de las 48 imágenes con las que se contó
para realizar este trabajo, 45 de ellas que corresponden al 94% del total de imágenes tienen una
segmentación correcta de más del 80% (Tabla. 13) y solo 3 de ellas que representan el 6% del
total de imágenes presentan una segmentación de menos del 80%.
Cabe mencionar que la tinción de las imágenes es un proceso manual por lo que no
siempre se conserva características uniformes en las imágenes ya sea por que no se efectuó de
manera correcta el proceso de tinción, o porque la muestra a sido usada varias veces, además
de que el proceso de digitalización también manual y la imagen puede ser capturada con ciertas
variantes como son iluminación en la muestra e iluminación alrededor de la muestra y la óptica
del lente, estos procesos manuales impiden que el sistema obtenga mejores resultados, por
tanto se recomienda que el proceso de digitalización de las imágenes sea estandarizado, usando
características equivalentes en el microscopio digital en cada proceso de digitalización.
51
Capitulo 6. Trabajo futuro
Este trabajo contribuye para el desarrollo de una herramienta de apoyo al diagnóstico

médico de la leucemia, y a pesar, que con esta investigación se llegó a obtener resultados
satisfactorios bien sabemos que cualquier técnica o proceso puede llegar a ser mejorada o
superada por otra, a si que se propone seguir con el estudio de técnicas para la segmentación
bajo este dominio de información, si se toma como referencia este trabajo de tesis para la
investigación futura quizá se pueda llegar a una total perfección en la segmentación.
Algo importante que se debe realizar es aplicar la metodología desarrollada sobre

muestras de imágenes de células sanas, con el fin de definir si un paciente tiene o no el
trastorno. Para ello, es necesario construir una base de datos con muestras de células sanas, lo
que representa ser un costo muy alto, ya que en la mayoría de los casos se realizan estudios de
médula cuando el experto tiene altos indicios de que la enfermedad esta presente en un
organismo. Sin embargo, estudios de sangre periférica son más comunes de realizar, siendo una
oportunidad en la cual se podría llevar a cabo este trabajo futuro.
Otro punto por hacer es en la parte de optimización de la imágen de salida de el proceso

de segmentación, ya que debido a que en algunos casos las imágenes pueden llegar a presentar
algunos puntos o manchas muy pequeñas que no se recomienda estén en la imágen para
módulos posteriores, estos puntos se presentan ya que los colores que la forman son muy
similares a los de los glóbulos blancos así que no pueden ser eliminados durante la
segmentación.
Recordemos que el proceso de segmentación en este trabajo se hace en base al color

como lo perciben nuestros ojos, por esto es natural que los puntos que cumplan con las
características de los glóbulos blancos sean clasificados en su grupo. Por ello es necesario
contar con alguna técnica que ayude a eliminar aquellos puntos considerados como ruido, en
este trabajo se implementaron algunas técnicas básicas para eliminar este ruido presentando
resultados medianamente buenos por ello se considera que este punto requiere ser atendido
mas a detalle en otra investigación.
También se puede mencionar como trabajo futuro el identificar cada glóbulo blanco de la
imágen previamente segmentada y ya sin ruido, para su estudio particular y extracción de
características. Este punto es muy importante y de alta dificultad para su realización ya que si se
tienen a los glóbulos blancos muy pegados con técnicas básicas para separarlas no se podría
lograr su separación. Para esto se requiere una ardua labor de investigación y desarrollo.
52
Apéndice A. Glosario de términos
Anticuerpo: Son glicoproteínas (proteínas unidas a azúcares) secretadas por un tipo particular
de células llamadas plasmocitos. Los plasmocitos son el resultado de la proliferación y
diferenciación de los linfocitos B que han sido activados. Su propósito es reconocer cuerpos
extraños invasores como las bacterias y virus para mantener al organismo libre de ellos.
Antígeno: Es una molécula (generalmente una proteína o un polisacárido) de superficie celular,

que puede inducir la formación de anticuerpos.
Blastos: Son glóbulos inmaduros que no funcionan normalmente y mueren en la médula ósea o
brevemente después de que ingresan a la sangre. Esto deja menos espacio para que se formen
glóbulos blancos, glóbulos rojos y plaquetas sanas en la médula ósea.
Disnea: Es la dificultad para respirar o la sensación de falta de aire.
Ganglios Linfáticos: son unos nódulos pequeños, suaves y en forma de fríjol que no suelen ser
visibles ni son fáciles de sentir al tacto. Están ubicados en racimos en varias partes del cuerpo
como el cuello, las axilas y la ingle. Dichos ganglios producen las células inmunes (como los
linfocitos, monocitos y células plasmáticas); además, filtran el líquido linfático y eliminan el
material extraño, como bacterias y células cancerosas. Cuando las bacterias son reconocidas en
el líquido linfático, los ganglios se agrandan a medida que producen y suministran una cantidad
adicional de glóbulos blancos para ayudar a combatir la infección.
Linfa: Es un líquido entre transparente y blanquecino compuesto de:

• Quilo (líquido proveniente de los intestinos después de la digestión que contiene
proteínas y grasas)
• Algunos glóbulos rojos
• Muchos glóbulos blancos, especialmente linfocitos, los cuales son células que atacan a
las bacterias en la sangre.
Linfocitos: Los linfocitos son las células responsables de las respuestas inmunitarias (inmune,
del latín, 'estar libre de carga'). Se desarrollan a partir de progenitores linfoides inmaduros y se
dividen en dos grandes grupos, linfocitos B y linfocitos T, según que estos progenitores linfoides
maduren en la médula ósea (B) o en el timo (T), respectivamente.
Linfocitos B: Son un tipo celular que cumple múltiples funciones en el mantenimiento de la

inmunidad mediada por anticuerpos, con actividad específica de fijación de antígenos. Los
linfocitos B se originan y maduran en medula ósea pero una vez que hayan completado estos
cambios se ubican en los ganglios linfáticos, donde se activan en presencia de un agente
extraño, con la ayuda de otro tipo celular, los Linfocitos T CD4 + o Linfocitos T helper; aunque
bajo ciertas circunstancias pueden hacerlo en ausencia de estos. Las células B durante su
maduración expresan diferentes moléculas de superficie que son útiles para su identificación y
conocimiento de su capacidad funcional.
53
Metástasis: Es el movimiento o diseminación de las células cancerosas de un órgano o tejido a

otro, por lo general a través del torrente sanguíneo o del sistema linfático.
Neutropenia: Es un número anormalmente bajo de neutrófilos en la sangre.
Trombocitopenia: es un trastorno cuya característica es la escasez de plaquetas (las células

que se producen en la médula ósea y que son necesarias para la coagulación) provocando
sangrado en los tejidos y a menudo moretones en la piel.
54
Apéndice B. Descripción del sistema
La implementación del algoritmo propuesto en este trabajo fue hecho en el lenguaje de

programación JAVA versión 1.4.2_06, el sistema resultante SegLeukemia consta de una barra
de menú en la cual solo se incluye un solo menú desplegable Tesis, en el que la primera opción
K-means lleva a cabo todo el procedimiento para segmentar una imágen muestra de medula
ósea, en esta opción se presenta un cuadro de dialogo el cual permite abrir imágenes. La
segunda opción Exit permite salir del ambiente del sistema.
El sistema hace uso de un cuadro de dialogo para seleccionar la (s) imágenes que se
desea segmentar, el cual solo muestra los directorios existentes, a los que se puede acceder sin
ningún problema y también se muestran únicamente los archivos de imágenes en especifico
JPG, GIF, PNG, esto para facilitar el uso del sistema al usuario y para evitar errores a la hora de
cargar las imágenes, otra característica importante del sistema es que, se pueden seleccionar
múltiples imágenes para ser segmentadas, finalmente este pequeño sistema una vez finalizado
el proceso de segmentación genera la imágen y la etiqueta con el mismo nombre a su original
anteponiendo la palabra KMEANS y la guarda en el mismo directorio donde se ubica la imágen
original.
Para ejecutar el programa solo es necesario dar doble clic en el icono de SegLeukemia y
aparecerá la barra de menú de este sistema solo basta dar clic en el menú Tesis y se desplegará
su submenú, si se desea segmentar una imágen solo basta con dar clic en el menú K-means en
ese momento aparecerá un cuadro de dialogo en el que se puede buscar la (s) imágenes que se
desean segmentar, en el cuadro de dialogo solo se muestran los directorios a los que se puede
acceder sin ningún problema y también se muestran únicamente los archivos de imágenes JPG,
GIF, y PNG, después de seleccionar las imágenes solo hay que esperar a que finalice el proceso
de segmentación de las imágenes. Si se desea salir del sistema SegLeukemia, ir al menú Tesis,
Exit y cerrará el ambiente del sistema.
55
Bibliografía
[1] Ruth Rodríguez, El universal, Fecha de consulta 17 de marzo de 2007.

<http://www2.eluniversal.com.mx/pls/impreso/noticia.html?id_nota=108838&tabla=nacion>
[2] Periodismo de salud, ciencia y tecnología, 2006, Fecha de consulta 17 de marzo de 2007.
<http://www.invdes.com.mx/forma01.cfm?id=435&publicant=Dic%202003>
[3] Kimberly P. Dunsmore, Department of Pediatrics, Division of Hematology/Oncology

Universidad de Virginia Health system, Fecha de consulta 17 de marzo de 2007.
<http://www.healthsystem.virginia.edu/UVAHealth/peds_hematology_sp/leukemia.cfm>
[4] Carlos Platero, Jorge Moreno, Miguel Ángel Sánchez, Gabriel Asensio, Miguel Hernando,
Roberto González, 2002-2003, Procesamiento digital de imágenes biomédicas.
[5] Carlos Platero, Análisis de imágenes biomédicas en color procedente de microscopía en

campo claro, Grupo de Bioingeniería Aplicada, Dpto. Electrónica, Automática e Informática
Industrial Universidad Politécnica de Madrid, JOURNAL OF VIROLOGY,
[6] C. Platero Dueñas, G. Asensio Madrid, Difusión no lineal sobre imágenes de color
procedentes de microscopía en campo claro, Grupo de Bioingeniería Aplicada, Universidad
Politécnica de Madrid, Congreso Anual de la Sociedad Española de Ingeniería Biomédica.
[7] Pinzón R, Garavito G, Hata Y, Arteaga L, García J. Desarrollo de un sistema de análisis

automático de imágenes de extendidos sanguíneos. CASEIB, 2004.
[8] Steensma D,Gibbons R, Higgs D. 2005, Acquired alpha-thalassemia in association with

myelodysplastic syndrome and other hematologic malignancies. Blood, Journal of the
American Society of Hematology, Vol. 105, (12): 443-452.
[9] Mendiola JD, Altamirano L., 2000, Evaluación del grado de alteración en la relación
núcleo citoplasma mediante el uso de análisis de imágenes como apoyo para el
diagnóstico de alteraciones precancerosas cérvico uterinas. CONIELECOMP.
[10] El mundo salud, Fecha de consulta 27 de marzo 2007.

<http://www.elmundo.es/elmundosalud/especiales/cancer/basicos.html >
[11] McKenzie Shirlyn B, 2000, Hematología Clínica. Ed. El Manual Moderno.
[12] Sans-Sabrafen J; Besses Raebel C; Vives Corrons J. L., 2001 Hematología Clínica.
Harcourt.
[13] Gonzalo Pajares, Jesús M. de la Cruz., 2002 Visión por computador. Imágenes digitales
y aplicaciones. Ed. Ra-Ma.
56
[14] Seminario de Imagen y Sonido Digital, Fecha de consulta, 22 de abril del 2007,
<http://pub.ufasta.edu.ar/SISD/vision/cie.htm>
[15] WebUsable, Fecha de consulta, 21 de abril del 2007, <http://www.webusable.com/colours.htm>
[16] Técnicas de Procesado de Imágen, Fecha de Consulta: 28 de marzo 2007.

<http://www.des.udc.es/~adriana/TercerCiclo/CursoImagen/curso/web/Filtrado_Espacial.html>
[17] Luis Enrique Jiménez Copoya., 2003, Algoritmo de Segmentación local dinámica
aplicado a la caracterización de partículas. INAOE.
[18] Arturo de la Escalera, 2001, Visión por computador. Fundamentos y métodos, Ed.
Prentice Hall.
[19] González, Rafael y Woods, Richard, 1992, Tratamiento digital de imágenes, Ed. Addison
Wesley / Diaz de Santos.
[20] Análisis y procesamiento, Fecha de consulta 28 de marzo de 2007,

<http://itapizaco.edu.mx/paginas/ttm/unid74.html>
[21] Morales González Blanca A., 2006, Extracción de Características de Imágenes de

Células de Médula Ósea para la Clasificación de Leucemias Agudas, Instituto Nacional de
Astrofísica Óptica y Electrónica.
[22] Marcos Martín, 2002, Técnicas Clásicas de Segmentación de Imágen.
[23] David Nettleton, Ricardo Baeza-Yates, 2005, Búsqueda de información en la Web:

técnicas para la agrupación y selección de las consultas y sus resultados, Soft Computing
and Intelligent Information Systems.
[24] Lorena Álvarez Pérez, Enrique Alexander Cortizo, Lucas Cuadra Rodríguez, Roberto Gil
Pita, Francisco López Ferreras, 2006, Discriminación Automática Voz/No-Voz Mediante
Combinación de Clasificadores, Departamento de Teoría de la Señal y Comunicaciones,
Universidad de Alcalá. Escuela Politécnica Superior.
[25] Universidad de Chile, fecha de consulta 28 de marzo de 2007

<http://www.dcc.uchile.cl/~churtado/topava20034.ps.>
[26] Javier Eduardo Rojas Romero, 2006, Documento de tesis “Medición automática del D-
score en imágenes de muestras de endometrio humano
[27] Gonzalo pajares, Jesús M. de la Cruz, José M. Molina, Juan Cuadrado, Alejandro López,
Imágenes Digitales Procesamiento práctico con JAVA, Ed. Alfaomega Ra-Ma.
[28] Operaciones Morfológicas, fecha de consulta 30 de marzo de 2007, <http://www-

2.dc.uba.ar/materias/pdi2/morfologia_binaria.doc>

Proy Leuzemia

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Proy Leuzemia

Uploaded by

Copyright:

Available Formats

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA

SEGMENTACIÓN DE CÉLULAS DE LEUCEMIA UTILIZANDO

REQUISITO PARA OBTENER EL TITULO DE

Índice de figuras, gráficas y tablas. VIII

2.2.6.4.2 Fuzzy C-Means (FCM) 21

Índice de figuras y tablas.

Fig. 1) Imágen de célula del ser humano 9

Fig. 14) Diagrama a bloques del algoritmo 26

Tabla 6. Imágenes originales y su correspondiente segmentada 38

1.1 Descripción del Problema

La leucemia es el cáncer de la sangre que se desarrolla en la médula del hueso, la médula

Las células anormales se reproducen muy rápidamente y no funcionan como glóbulos

En México, estudios realizados por el Laboratorio Clínico del Instituto Nacional de

Existen tres tipos principales de leucemia según la bibliografía citada [3]:

 Leucemia linfocítica aguda (acute lymphocytic leukemia, ALL): también llamada

La diferencia entre la leucemia linfocítica y la leucemia mielógena es la etapa de desarrollo

En el proceso de observación de las células a partir de muestras sanguíneas tiene la

Una alternativa para el análisis de muestras sanguíneas consiste en tomar fotografías

El trabajo en segmentación de imágenes médicas y en especial de células ya cuenta con

Los objetivos particulares de este trabajo de investigación son:

 Implementar el algoritmo k-means.

1.2 Solución Propuesta

Antes de realizar el proceso de segmentación, se realiza un preprocesado a la imagen, en

El algoritmo de segmentación propuesto está basado en un algoritmo de agrupamiento,

La idea del proceso de segmentación es encontrar el valor de los centroides de manera

1.3 Estado del Arte

El procesamiento digital de imágenes ha sido explorado en diversos trabajos para extraer

Otra investigación relacionada es [5] la realizada por, Carlos Platero en su investigación

Trabajos adicionales se han enfocado a distinguir entre anormalidades en la hemoglobina

1.4 Organización de la Tesis

En esta sección se presenta un panorama general de la organización del documento,

En el capítulo 3, “Metodología de solución propuesta”, se describe la solución propuesta

En el capítulo 4, “Pruebas y resultados obtenidos” se describen las pruebas realizadas

En el capítulo 5, “Conclusiones”, se presentan conclusiones a las que se llegaron después

En el capítulo 7, “Glosario de términos” se define todos los términos empleados en este

Finalmente el capítulo 8, “Bibliografía” se muestran las referencias revisadas para el

Capitulo 2. Conceptos básicos

2.1 Conceptos básicos sobre leucemia

Fig. 1) Imágen de célula del ser humano

La célula se divide y al hacerlo sus estructuras se dividen también en otras

correspondientes. Las células musculares se forman y crecen en los músculos y no en los

La célula normal se convierte en una célula cancerosa debido a un cambio o mutación

Las células cancerosas tienen un aspecto diferente, ya sea porque su forma ha

Al formarse un gran número de células cancerosas, se amontonan, presionan o

La leucemia es una enfermedad maligna del sistema hematopoyético, caracterizada por

La leucemia se clasifica en aguda o crónica de acuerdo al estado de maduración celular

Leucemia linfocítica aguda. En este tipo de trastorno, la afección se encuentra en los

médula ósea produce un exceso de linfocitos que no maduran correctamente y que

Los síndromes linfoproliferativos crónicos. Son una serie de enfermedades producidas

2.1.2 Técnicas de Clasificación de Leucemias.

2.2 Visión por Computadora

La visión es uno de los mecanismos sensoriales de percepción más importantes en el

El procesamiento de imágenes comprende aquellos algoritmos cuya finalidad es mejorar

2.2.1 Imágen digital.

2.2.3 Espacio de color RGB y HSB

El espacio RGB es un espacio de color tridimensional cuyas componentes son el rojo, el

Figura. 4. Tetraedro de color RGB

Figura. 5. Triángulo de color HSB

El filtrado espacial tiene como objetivo modificar la contribución de determinados rangos

Estos filtros pueden clasificarse basándose en su linealidad [16].

 Filtros lineales (Fig. 6).- Estos a su vez se clasifican en.

o Filtros pasa bajo.- Atenúan o eliminan las componentes de alta frecuencia a

(a) (b) (c)