Radiologia Brasileira - Publicação Científica Oficial do Colégio Brasileiro de Radiologia

AMB - Associação Médica Brasileira CNA - Comissão Nacional de Acreditação
Idioma/Language: Português Inglês

Vol. 38 nº 6 - Nov. / Dez.  of 2005

ARTIGO ORIGINAL
Print 

Page(s) 421 to 426



Caracterização de lesões intersticiais de pulmão em radiograma de tórax utilizando análise local de textura

Autho(rs): Elias Ribeiro da Silva Martins, Paulo Mazzoncini de Azevedo-Marques, Lucas Ferrari de Oliveira, Roberto Rodrigues Pereira Jr., Clóvis Simão Trad

PDF Português      

Texto em Português English Text

Descritores: Auxílio ao diagnóstico, Lesões intersticiais de pulmão, Atributos de textura, Reconhecimento de padrões

Keywords: Computer-aided diagnosis, Interstitial lung lesions, Texture characteristics, Pattern recognition

Resumo:
OBJETIVO: Caracterizar lesões intersticiais em radiografias frontais de tórax, com base na análise de atributos estatísticos de textura, os quais permitem detectar sinais de anormalidades com natureza difusa. MATERIAIS E MÉTODOS: O esquema começa com a segmentação semi-automática dos campos pulmonares, sendo o contorno externo marcado manualmente, com posterior divisão automática de cada pulmão em seis regiões. O banco de imagens utilizado neste trabalho é composto por 482 regiões obtidas de exames contendo lesões e 324 regiões obtidas de exames normais. Os atributos de textura são extraídos automaticamente de cada uma dessas regiões e uma seleção das melhores combinações de atributos é feita através da distância Jeffries-Matusita. A classificação das regiões em normal ou suspeita é feita pela comparação com os k vizinhos mais próximos e o treinamento do classificador é baseado na técnica de treino e teste "half-half" e correlação cruzada. RESULTADOS: Os resultados obtidos foram analisados através do valor da área sob a curva ROC ("receiver operating characteristic"), a qual indica um sistema perfeito para uma área igual a 1. Os resultados forneceram uma área sob a curva ROC (A Z) igual a 0,887, com valores de sensibilidade igual a 0,804 e especificidade igual a 0,793. CONCLUSÃO: Os resultados indicam que o sistema de caracterização baseado em atributos de textura possui bom potencial para o auxílio ao diagnóstico de lesões intersticiais de pulmão.

Abstract:
OBJECTIVE: To characterize interstitial lesions in anterior-posterior chest X-rays based on the analysis of textural statistical features that allow the detection of abnormalities with diffuse pattern. MATERIALS AND METHODS: Image analysis begins with the semiautomatic segmentation of the lungs, marking the external contour of the lung manually followed by an automatic division of each lung in six regions. The data base of images used in this study consisted of 482 regions obtained from examinations in which lesions were detected and 324 regions from normal examinations. Textural features were automatically extracted from each area and the selection of the best set of features was made based on the Jeffries-Matusita distance. The regions were classified as normal or suspected using the k nearest-neighbor method and half-half, and cross-correlation methodologies were used for training the classifier. RESULTS: Results were assessed based on the value of the area under the ROC (receiver operating characteristic) curve that indicates an ideal response for an area equal to 1. The results showed an area under the ROC curve (A Z) of 0.887, sensitivity of 0.804, and specificity of 0.793. CONCLUSION: These results indicate that the implemented system has a good potential for computer-aided diagnosis of interstitial lung lesions.

IIIBacharel em Ciências da Computação, Mestre em Engenharia Elétrica, Aluno de Doutorado junto ao CCIFM/FMRP-USP
IVMatemático, Doutor em Engenharia Elétrica, Pós-Doutorando junto ao CCIFM/FMRP-USP
VMédico Radiologista, Doutor em Clínica Médica, Docente do CCIFM/FMRP-USP

Endereço para correspondência

 

 

INTRODUÇÃO

As doenças intersticiais são definidas como anormalidades dos compartimentos intersticiais do pulmão, decorrentes de inflamação, proliferação de células neoplásicas, acúmulo de fluidos ou até mesmo acúmulo anormal de material protéico(1).

A análise das imagens radiográficas com lesões intersticiais é uma tarefa complexa, podendo apresentar significativa variabilidade inter e intra-observador, mesmo entre radiologistas(2). Isto é conseqüência dos numerosos padrões de imagem e da quantidade de doenças existentes neste grupo(3). Além disso, essas lesões não necessariamente são homogeneamente distribuídas, podendo acometer de maneira assimétrica os pulmões, com algumas regiões sendo mais atingidas que outras, assim como podem comprometer homogeneamente toda a extensão dos pulmões.

O avanço tecnológico dos últimos 20 anos possibilitou o surgimento de sistemas de diagnóstico auxiliado por computador (CAD) orientados para fornecer ao médico radiologista ferramentas auxiliares de diagnóstico e, dessa maneira, melhorar o desempenho das análises(4). Vários métodos têm sido desenvolvidos com a finalidade de detectar e caracterizar as lesões intersticiais, sendo a análise de textura a sua principal ferramenta(5–7).

Este artigo descreve um estudo realizado junto ao Serviço de Radiodiagnóstico do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP-USP) sobre a possibilidade de utilização de atributos estatísticos de textura, extraídos de radiogramas de tórax, para caracterização de lesões intersticiais de pulmão, visando à detecção automatizada de regiões suspeitas em imagens digitais.

O trabalho aqui apresentado faz parte de um projeto maior, voltado para a implementação de um sistema de auxílio ao diagnóstico em lesões intersticiais, que está sendo desenvolvido junto ao Centro de Ciências das Imagens e Física Médica (CCIFM) do Departamento de Clínica Médica da FMRP-USP.

 

MATERIAIS E MÉTODOS

A. Formação do banco de dados

Dentre o conjunto de lesões contidas no grupo das lesões intersticiais, que abrange mais de 200 tipos(8,9), definiu-se um subconjunto de maior relevância clínica no HCFMRP-USP. Dessa forma, foram selecionadas as seguintes doenças: esclerose sistêmica, fibrose pulmonar idiopática, histoplasmose, linfangite carcinomatosa, paracoccidioidomicose, sarcoidose, silicose e tuberculose miliar.

Após a definição das doenças a serem estudadas, coletaram-se as imagens para a formação do banco de dados. As imagens utilizadas para a construção do banco de imagens foram obtidas de forma retrospectiva junto ao arquivo de raios-X do Serviço de Radiodiagnóstico do HCFMRP-USP. A digitalização das imagens foi feita por meio de um "scanner" (Vidar – DiagnosticPro) por transmissão óptica, sendo o tamanho do elemento de imagem ("pixel") das imagens igual a 83,66 µm (300 dpi), com 12 "bits" de quantização por "pixel" (4.096 níveis de cinza).

O "padrão áureo" para a avaliação das imagens foi estabelecido por médicos radiologistas do HCFMRP mediante inspeção visual, sendo cada região da imagem rotulada como normal, acometimento acentuado, acometimento moderado e acometimento leve. O banco de dados foi construído com 42 exames com alguma doença pertencente ao grupo das lesões intersticiais (482 regiões acometidas) e 27 exames normais (324 regiões normais), extraídas de radiogramas em póstero-anterior de tórax. Foram utilizados somente casos com comprometimento ou ausência de comprometimento comprovado por tomografia computadorizada, segmento clínico ou biópsia.

B. Segmentação das imagens

A segmentação das imagens (separação e divisão dos pulmões em regiões) foi feita de forma semi-automática. Inicialmente foi manualmente demarcado o contorno de cada pulmão (pontos), e então, a região interna ao contorno (pulmão) foi extraída da imagem póstero-anterior e colada sobre um fundo preto para posterior divisão em regiões menores: superior, média e inferior. A partir desta divisão, cada uma das regiões menores é particionada em duas outras regiões (proximal e distal). Dessa forma, cada um dos pulmões é separado em seis regiões menores, conforme pode ser visto na Figura 1. A demarcação dos contornos dos pulmões foi supervisionada pelos médicos radiologistas do HCFMRP.

C. Análise de textura

A análise de textura foi feita a partir de informações estatísticas obtidas através de atributos extraídos da matriz de co-ocorrência de níveis de cinza(5). A matriz de co-ocorrência de níveis de cinza fornece relações espaciais entre os níveis de cinza da imagem, possibilitando a extração de atributos que representam características de textura da imagem, como rugosidade, granulosidade, aspereza, regularidade, direcionalidade, entre outras. Foram extraídas quatro matrizes de co-ocorrência para as direções 0°, 45°, 90° e 135°. A Figura 2 ilustra a extração da matriz de co-ocorrência para uma imagem simples com quatro níveis de cinza na direção 0° (detalhes sobre a matriz de co-ocorrência de níveis de cinza disponíveis em Haralick et al.(5)).

 

 

Os seguintes atributos de textura foram extraídos das matrizes de co-ocorrência de níveis de cinza nas quatro direções: energia (uniformidade), contraste, correlação, momento da diferença inversa, média da soma, média da diferença, entropia, entropia da soma, entropia da diferença, variância da soma, variância da diferença e medida de informação da correlação I.

Para compreendermos melhor o que representa um atributo, tomemos como exemplos a energia e o contraste da imagem, que são dois atributos mais intuitivos da imagem. A energia, também chamada de uniformidade, é um indicador de uniformidade ou suavidade das texturas. Texturas homogêneas terão valor mais alto que uma não homogênea. O contraste é uma estimativa da média quadrada da variação dos níveis de cinza entre pares de elementos da imagem, isto é, o quanto um "pixel" difere um do outro em termos de tonalidade. Texturas mais homogêneas tenderão a ter valores menores que texturas bem heterogêneas (alto contraste).

Os valores obtidos para cada atributo formaram os vetores de atributos para cada uma das regiões dos pulmões previamente subdivididas (segmentadas). As imagens foram, então, classificadas através desses vetores.

D. Classificação dos atributos nos vetores de textura

O poder discriminatório entre regiões com textura normal e regiões com textura anormal fornecido por estes atributos é uma medida da sua capacidade em diferenciar pulmões sadios de pulmões acometidos por doença infiltrativa.

Neste estudo foi utilizada uma técnica de distância para a seleção dos atributos mais discriminantes para as classes normal e anormal. As técnicas de distância, apesar de não reduzirem a quantidade de atributos, nos dão uma noção do quão sobrepostas as classes estão em relação aos atributos utilizados (Figura 3). Utilizou-se a distância Jeffries-Matusita (JM)(10), de modo a obter a melhor combinação de atributos e, conseqüentemente, a maior discriminação entre as classes. Quanto maior o poder discriminatório, melhor o desempenho do sistema para classificar as imagens.

 

 

E. Classificação das imagens

Para a classificação das imagens em relação aos padrões normal e anormal, utilizou-se o método de classificação dos k vizinhos mais próximos (kNN)(11), um método de determinação e não paramétrico (sem a utilização de parâmetros) que classifica uma imagem desconhecida através do cálculo de uma métrica (medida de distância). As métricas são distâncias vetoriais entre a imagem a ser classificada (desconhecida) e cada imagem do conjunto de treinamento (imagens conhecidas e previamente rotuladas como normais ou anormais). A distância euclidiana entre um novo elemento e um elemento do conjunto de treinamento é uma medida de distância no espaço multidimensional, onde o número de dimensões depende da quantidade de atributos utilizada para caracterizar cada imagem(11). Através das distâncias euclidianas entre a imagem desconhecida e as imagens do banco de treinamento, o algoritmo dos k vizinhos mais próximos (kNN) seleciona as k imagens do banco de treinamento (imagens conhecidas e previamente rotuladas como normal ou anormal) mais semelhantes à imagem desconhecida e então a classifica segundo o maior número de votos dentre os k vizinhos mais próximos, isto é, se o maior número de votos for de imagens normais, a imagem é classificada como normal, senão, como anormal (Figura 4).

 

 

RESULTADOS

A. Segmentação

O processo de segmentação foi feito de forma semi-automática, sendo a demarcação manual do contorno dos pulmões inicialmente feita sob supervisão de médicos radiologistas. Na Figura 5 é apresentado o resultado deste processo. As etapas posteriores da segmentação são executadas automaticamente a partir dos pontos do contorno, sendo independente do usuário. A Figura 6 mostra as etapas automáticas do processo de segmentação.

 

 

 

 

B. Classificação dos atributos nos vetores de textura

Para efetuar a redução de dimensão dos vetores de atributos de textura (quantidade de atributos por imagem) foi calculada a distância JM para os 13 atributos de Haralick extraídos das imagens, fazendo-se todas as combinações de atributos possíveis de forma a se obter as maiores distâncias para cada uma das combinações. Para seleção das melhores combinações foi estabelecido, empiricamente, baseando-se nos valores de distâncias obtidos para as várias combinações, um limiar igual a 1,41413 para a distância JM, visto que é um valor bem próximo do máximo possível, o qual é 1,41422, sendo obtida como melhor uma combinação de nove atributos.

C. Classificação das imagens

Para encontrar o melhor número de k vizinhos para comparação (valor de k) do classificador kNN, a base de dados foi dividida aleatoriamente em dois grupos, um para treinamento e outro para teste do sistema, designados por grupo A e grupo B. Em primeira instância, o grupo A foi tomado para treino e o grupo B, para teste. Em segunda instância, o grupo B foi tomado para treino e o grupo A, para teste, e então feita a média da sensibilidade e especificidade do sistema. Esta técnica de treino e teste é chamada "half-half". A técnica "half-half" foi feita para todos os valores de k utilizados no processo de classificação. O processo descrito acima foi repetido 20 vezes, sendo em cada vez o banco de dados dividido em A e B, aleatoriamente. Ajustou-se, então, uma média de todas as áreas AZ sob a curva ROC ("receiver operating characteristic") (que representa a eficiência geral do sistema) para cada um dos valores de k, conforme a Tabela 1, verificando-se que os melhores valores de k para o desempenho do sistema são k = 9 e k = 10. O desempenho do classificador pode ser avaliado através da área sob a curva ROC (AZ) para cada uma das curvas de k. As curvas ROC para os valores de k = 9 e k = 10 podem ser vistas nas Figuras 7 e 8, respectivamente. Os resultados forneceram para a melhor configuração uma área sob a curva ROC (AZ) igual a 0,887, com valores de especificidade igual a 0,793 e sensibilidade igual a 0,804.

 

 

 

 

 

 

DISCUSSÃO

O algoritmo de segmentação mostrou-se eficiente, sendo aplicável ao sistema desenvolvido, porém podendo ainda ser melhorado, principalmente no que se refere à sua automatização total. A extração de atributos foi executada para cada região dos campos pulmonares, resultando em 13 atributos estatísticos de textura para cada região. O algoritmo de extração de atributos se mostrou robusto, não apresentando falhas.

Através do cálculo da distância JM, mediu-se o grau de discriminação das classes normal e anormal e encontrou-se a combinação 9 a 9 como a mais otimizada, levando-se em consideração o valor da distância JM e a quantidade de dimensões do vetor de atributos. Obteve-se uma distância JM** = 1,41413 para a melhor combinação 9 a 9, sendo ela formada pelos seguintes atributos: 1 – energia; 4 – correlação; 5 – média da diferença inversa; 6 – entropia; 8 – diferença da entropia; 9 – média da soma; 10 – soma da variância; 11 – média da diferença; 13 – medida de correlação I. À medida que se aumenta o número de atributos nos vetores e se faz o cálculo da distância JM, esta tende a se aproximar de , entretanto, não é interessante aumentar o número de dimensões do vetor de atributos depois que a distância JM atinge um certo limiar próximo de , pois a variação da distância JM será de décimos de milésimo (0,0001), o que praticamente não afetará os resultados da classificação, porém aumentará consideravelmente o custo computacional do processo.

O método de classificação não paramétrico utilizado, o kNN, não necessita de informações a priori para realização do processo de classificação. No entanto, requer a presença de amostras de treinamento, o que pode tornar o custo computacional do classificador elevado, conforme o banco de dados de comparação aumenta de tamanho. Entretanto, o método kNN se aplica de forma eficiente ao sistema proposto, devido ao tamanho da base de dados ser relativamente pequeno, o que faz com que o custo computacional seja reduzido.

Os melhores resultados obtidos através da análise da curva ROC para este sistema são encontrados quando k assume os valores iguais a 9 e 10, cujas respectivas áreas sob a curva ROC são 0,88709 e 0,88713. Embora o resultado da classificação tenha sido satisfatório, uma possível forma de melhorar ainda mais o sistema de detecção seria ignorar áreas que parecem conter estruturas de fundo, como bordas de costelas e grandes vasos, pois esses dois padrões estão contidos tanto em imagens normais quanto anormais. Essas estruturas podem ser confundidas com um padrão patológico, ou até mesmo mascarar possíveis anormalidades, uma vez que essas estruturas estão contidas no padrão das imagens normais. Esse mascaramento de anormalidades pode afetar diretamente a sensibilidade do sistema. De fato, deve ter contribuído para que o sistema tivesse uma tendência de ser mais específico que sensível. Esta tendência pode ser vista nos gráficos das Figuras 7 e 8. O problema das estruturas de fundo possivelmente pode ser resolvido empregando-se técnicas de pré-processamento para sua remoção, por exemplo, um filtro de costelas(12).

 

CONCLUSÃO

Devido ao padrão difuso apresentado pelas lesões intersticiais de pulmão, as quais tendem a acometer pelo menos um terço de cada campo pulmonar(2), verificou-se ser a textura um bom parâmetro para sua caracterização. Dentre as várias formas de extração de textura existentes, esta pesquisa explorou a abordagem estatística proposta por Haralick, uma estatística até então não explorada em sistemas de auxílio ao diagnóstico para lesões intersticiais de pulmão.

Devido ao número limitado de amostras, optou-se por usar o classificador não paramétrico kNN, pois este, a priori, não necessita de informações previamente estabelecidas para a realização da classificação. Todavia, outros classificadores poderiam ter sido utilizados, como o classificador bayesiano, o qual permite a inserção de informações anteriormente estabelecidas na realização da classificação, e até mesmo um classificador baseado em redes neurais. Outros trabalhos de pesquisa estão em andamento para teste dessas outras técnicas.

Considerando os resultados obtidos para a melhor configuração, indicando uma área sob a curva ROC (AZ) igual a 0,887, com valores de especificidade igual a 0,793 e sensibilidade igual a 0,804, pode-se concluir que a metodologia estudada apresenta bom potencial para a caracterização de lesões intersticiais de pulmão em radiografias digitalizados de tórax.

 

REFERÊNCIAS

1. Genereux GP. Pattern recognition in diffuse lung disease. A review of theory and practice. Med Radiogr Photogr 1985;61:2–31.        [  ]

2. van Ginneken B, Katsuragawa S, ter Haar Romeny BM, Doi K, Viergever MA. Automatic detection of abnormalities in chest radiographs using local texture analysis. IEEE Trans Med Imaging 2002;21: 139–149.        [  ]

3. Fraser RG, Paré JAP. Diagnosis of diseases of the chest. Philadelphia, Pa: Saunders, 1970.        [  ]

4. Azevedo-Marques PM. Diagnóstico auxiliado por computador na radiologia. Radiol Bras 2001;34: 285–293.        [  ]

5. Haralick RM, Shanmugam K, Dinstein I. Textural features for image classification. IEEE Trans Systems, Man, Cybernetics 1973;SMC-3:6l0–621.        [  ]

6. Van Gool L, Dewaele P, Oosterlinck A. Survey: texture analysis anno 1983. Computer Vision, Graphics, and Image Processing 1985;29:336–357.        [  ]

7. Reed RT, Du Buf JMH. A review of recent texture segmentation and feature extraction techniques. Computer Vision, Graphics, and Image Processing 1993;57:359–372.        [  ]

8. Demedts M, Wells AU, Antó JM, et al. Interstitial lung diseases: an epidemiological overview. Eur Respir J Suppl 2001;32:2–16.        [  ]

9. Coultas DB, Zumwalt RE, Black WC, Sobonia RE. The epidemiology of interstitial lung diseases. Am J Respir Crit Care Med 1994;150:967–972.        [  ]

10. Young TY, Fu KS. Handbook of pattern recognition and image processing. New York, NY: Academic Press, 1986.        [  ]

11. Duda RO, Hart PE. Pattern classification and scene analysis. New York, NY: Wiley, 1973.        [  ]

12. Vogelsang F, Weiler F, Dahmen J, Kilbinger MW, Wein B, Günther RW. Detection and compensation of rib structures in chest radiographs for diagnostic assistance. Proc SPIE 1998;3338:774–785.        [  ]

 

 

Endereço para correspondência:
Elias Ribeiro da Silva Martins
Avenida Pampulha, Qd. Mansão, Lt. 22, Urias Magalhães
Goiânia, GO, 74565-020
E-mail: netsaille@yahoo.com.br / pmarques@fmrp.usp.br

Recebido para publicação em 28/10/2004. Aceito, após revisão, em 1/4/2005.

 

 

* Trabalho realizado no Serviço de Radiodiagnóstico do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (HCFMRP-USP), Ribeirão Preto, SP.
** O máximo valor de JM é » 1, 41422.


 
RB RB RB
GN1© Copyright 2024 - All rights reserved to Colégio Brasileiro de Radiologia e Diagnóstico por Imagem
Av. Paulista, 37 - 7° andar - Conj. 71 - CEP 01311-902 - São Paulo - SP - Brazil - Phone: (11) 3372-4544 - Fax: (11) 3372-4554