ARTIGO ORIGINAL
|
|
|
|
Autho(rs): Elias Ribeiro da Silva Martins, Paulo Mazzoncini de Azevedo-Marques, Lucas Ferrari de Oliveira, Roberto Rodrigues Pereira Jr., Clóvis Simão Trad |
|
Descritores: Auxílio ao diagnóstico, Lesões intersticiais de pulmão, Atributos de textura, Reconhecimento de padrões |
|
Resumo: IIIBacharel em Ciências da Computação, Mestre em Engenharia Elétrica, Aluno de Doutorado junto ao CCIFM/FMRP-USP
INTRODUÇÃO As doenças intersticiais são definidas como anormalidades dos compartimentos intersticiais do pulmão, decorrentes de inflamação, proliferação de células neoplásicas, acúmulo de fluidos ou até mesmo acúmulo anormal de material protéico(1). A análise das imagens radiográficas com lesões intersticiais é uma tarefa complexa, podendo apresentar significativa variabilidade inter e intra-observador, mesmo entre radiologistas(2). Isto é conseqüência dos numerosos padrões de imagem e da quantidade de doenças existentes neste grupo(3). Além disso, essas lesões não necessariamente são homogeneamente distribuídas, podendo acometer de maneira assimétrica os pulmões, com algumas regiões sendo mais atingidas que outras, assim como podem comprometer homogeneamente toda a extensão dos pulmões. O avanço tecnológico dos últimos 20 anos possibilitou o surgimento de sistemas de diagnóstico auxiliado por computador (CAD) orientados para fornecer ao médico radiologista ferramentas auxiliares de diagnóstico e, dessa maneira, melhorar o desempenho das análises(4). Vários métodos têm sido desenvolvidos com a finalidade de detectar e caracterizar as lesões intersticiais, sendo a análise de textura a sua principal ferramenta(57). Este artigo descreve um estudo realizado junto ao Serviço de Radiodiagnóstico do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP-USP) sobre a possibilidade de utilização de atributos estatísticos de textura, extraídos de radiogramas de tórax, para caracterização de lesões intersticiais de pulmão, visando à detecção automatizada de regiões suspeitas em imagens digitais. O trabalho aqui apresentado faz parte de um projeto maior, voltado para a implementação de um sistema de auxílio ao diagnóstico em lesões intersticiais, que está sendo desenvolvido junto ao Centro de Ciências das Imagens e Física Médica (CCIFM) do Departamento de Clínica Médica da FMRP-USP.
MATERIAIS E MÉTODOS A. Formação do banco de dados Dentre o conjunto de lesões contidas no grupo das lesões intersticiais, que abrange mais de 200 tipos(8,9), definiu-se um subconjunto de maior relevância clínica no HCFMRP-USP. Dessa forma, foram selecionadas as seguintes doenças: esclerose sistêmica, fibrose pulmonar idiopática, histoplasmose, linfangite carcinomatosa, paracoccidioidomicose, sarcoidose, silicose e tuberculose miliar. Após a definição das doenças a serem estudadas, coletaram-se as imagens para a formação do banco de dados. As imagens utilizadas para a construção do banco de imagens foram obtidas de forma retrospectiva junto ao arquivo de raios-X do Serviço de Radiodiagnóstico do HCFMRP-USP. A digitalização das imagens foi feita por meio de um "scanner" (Vidar DiagnosticPro) por transmissão óptica, sendo o tamanho do elemento de imagem ("pixel") das imagens igual a 83,66 µm (300 dpi), com 12 "bits" de quantização por "pixel" (4.096 níveis de cinza). O "padrão áureo" para a avaliação das imagens foi estabelecido por médicos radiologistas do HCFMRP mediante inspeção visual, sendo cada região da imagem rotulada como normal, acometimento acentuado, acometimento moderado e acometimento leve. O banco de dados foi construído com 42 exames com alguma doença pertencente ao grupo das lesões intersticiais (482 regiões acometidas) e 27 exames normais (324 regiões normais), extraídas de radiogramas em póstero-anterior de tórax. Foram utilizados somente casos com comprometimento ou ausência de comprometimento comprovado por tomografia computadorizada, segmento clínico ou biópsia. B. Segmentação das imagens A segmentação das imagens (separação e divisão dos pulmões em regiões) foi feita de forma semi-automática. Inicialmente foi manualmente demarcado o contorno de cada pulmão (pontos), e então, a região interna ao contorno (pulmão) foi extraída da imagem póstero-anterior e colada sobre um fundo preto para posterior divisão em regiões menores: superior, média e inferior. A partir desta divisão, cada uma das regiões menores é particionada em duas outras regiões (proximal e distal). Dessa forma, cada um dos pulmões é separado em seis regiões menores, conforme pode ser visto na Figura 1. A demarcação dos contornos dos pulmões foi supervisionada pelos médicos radiologistas do HCFMRP. C. Análise de textura A análise de textura foi feita a partir de informações estatísticas obtidas através de atributos extraídos da matriz de co-ocorrência de níveis de cinza(5). A matriz de co-ocorrência de níveis de cinza fornece relações espaciais entre os níveis de cinza da imagem, possibilitando a extração de atributos que representam características de textura da imagem, como rugosidade, granulosidade, aspereza, regularidade, direcionalidade, entre outras. Foram extraídas quatro matrizes de co-ocorrência para as direções 0°, 45°, 90° e 135°. A Figura 2 ilustra a extração da matriz de co-ocorrência para uma imagem simples com quatro níveis de cinza na direção 0° (detalhes sobre a matriz de co-ocorrência de níveis de cinza disponíveis em Haralick et al.(5)).
Os seguintes atributos de textura foram extraídos das matrizes de co-ocorrência de níveis de cinza nas quatro direções: energia (uniformidade), contraste, correlação, momento da diferença inversa, média da soma, média da diferença, entropia, entropia da soma, entropia da diferença, variância da soma, variância da diferença e medida de informação da correlação I. Para compreendermos melhor o que representa um atributo, tomemos como exemplos a energia e o contraste da imagem, que são dois atributos mais intuitivos da imagem. A energia, também chamada de uniformidade, é um indicador de uniformidade ou suavidade das texturas. Texturas homogêneas terão valor mais alto que uma não homogênea. O contraste é uma estimativa da média quadrada da variação dos níveis de cinza entre pares de elementos da imagem, isto é, o quanto um "pixel" difere um do outro em termos de tonalidade. Texturas mais homogêneas tenderão a ter valores menores que texturas bem heterogêneas (alto contraste). Os valores obtidos para cada atributo formaram os vetores de atributos para cada uma das regiões dos pulmões previamente subdivididas (segmentadas). As imagens foram, então, classificadas através desses vetores. D. Classificação dos atributos nos vetores de textura O poder discriminatório entre regiões com textura normal e regiões com textura anormal fornecido por estes atributos é uma medida da sua capacidade em diferenciar pulmões sadios de pulmões acometidos por doença infiltrativa. Neste estudo foi utilizada uma técnica de distância para a seleção dos atributos mais discriminantes para as classes normal e anormal. As técnicas de distância, apesar de não reduzirem a quantidade de atributos, nos dão uma noção do quão sobrepostas as classes estão em relação aos atributos utilizados (Figura 3). Utilizou-se a distância Jeffries-Matusita (JM)(10), de modo a obter a melhor combinação de atributos e, conseqüentemente, a maior discriminação entre as classes. Quanto maior o poder discriminatório, melhor o desempenho do sistema para classificar as imagens.
E. Classificação das imagens Para a classificação das imagens em relação aos padrões normal e anormal, utilizou-se o método de classificação dos k vizinhos mais próximos (kNN)(11), um método de determinação e não paramétrico (sem a utilização de parâmetros) que classifica uma imagem desconhecida através do cálculo de uma métrica (medida de distância). As métricas são distâncias vetoriais entre a imagem a ser classificada (desconhecida) e cada imagem do conjunto de treinamento (imagens conhecidas e previamente rotuladas como normais ou anormais). A distância euclidiana entre um novo elemento e um elemento do conjunto de treinamento é uma medida de distância no espaço multidimensional, onde o número de dimensões depende da quantidade de atributos utilizada para caracterizar cada imagem(11). Através das distâncias euclidianas entre a imagem desconhecida e as imagens do banco de treinamento, o algoritmo dos k vizinhos mais próximos (kNN) seleciona as k imagens do banco de treinamento (imagens conhecidas e previamente rotuladas como normal ou anormal) mais semelhantes à imagem desconhecida e então a classifica segundo o maior número de votos dentre os k vizinhos mais próximos, isto é, se o maior número de votos for de imagens normais, a imagem é classificada como normal, senão, como anormal (Figura 4).
RESULTADOS A. Segmentação O processo de segmentação foi feito de forma semi-automática, sendo a demarcação manual do contorno dos pulmões inicialmente feita sob supervisão de médicos radiologistas. Na Figura 5 é apresentado o resultado deste processo. As etapas posteriores da segmentação são executadas automaticamente a partir dos pontos do contorno, sendo independente do usuário. A Figura 6 mostra as etapas automáticas do processo de segmentação.
B. Classificação dos atributos nos vetores de textura Para efetuar a redução de dimensão dos vetores de atributos de textura (quantidade de atributos por imagem) foi calculada a distância JM para os 13 atributos de Haralick extraídos das imagens, fazendo-se todas as combinações de atributos possíveis de forma a se obter as maiores distâncias para cada uma das combinações. Para seleção das melhores combinações foi estabelecido, empiricamente, baseando-se nos valores de distâncias obtidos para as várias combinações, um limiar igual a 1,41413 para a distância JM, visto que é um valor bem próximo do máximo possível, o qual é 1,41422, sendo obtida como melhor uma combinação de nove atributos. C. Classificação das imagens Para encontrar o melhor número de k vizinhos para comparação (valor de k) do classificador kNN, a base de dados foi dividida aleatoriamente em dois grupos, um para treinamento e outro para teste do sistema, designados por grupo A e grupo B. Em primeira instância, o grupo A foi tomado para treino e o grupo B, para teste. Em segunda instância, o grupo B foi tomado para treino e o grupo A, para teste, e então feita a média da sensibilidade e especificidade do sistema. Esta técnica de treino e teste é chamada "half-half". A técnica "half-half" foi feita para todos os valores de k utilizados no processo de classificação. O processo descrito acima foi repetido 20 vezes, sendo em cada vez o banco de dados dividido em A e B, aleatoriamente. Ajustou-se, então, uma média de todas as áreas AZ sob a curva ROC ("receiver operating characteristic") (que representa a eficiência geral do sistema) para cada um dos valores de k, conforme a Tabela 1, verificando-se que os melhores valores de k para o desempenho do sistema são k = 9 e k = 10. O desempenho do classificador pode ser avaliado através da área sob a curva ROC (AZ) para cada uma das curvas de k. As curvas ROC para os valores de k = 9 e k = 10 podem ser vistas nas Figuras 7 e 8, respectivamente. Os resultados forneceram para a melhor configuração uma área sob a curva ROC (AZ) igual a 0,887, com valores de especificidade igual a 0,793 e sensibilidade igual a 0,804.
DISCUSSÃO O algoritmo de segmentação mostrou-se eficiente, sendo aplicável ao sistema desenvolvido, porém podendo ainda ser melhorado, principalmente no que se refere à sua automatização total. A extração de atributos foi executada para cada região dos campos pulmonares, resultando em 13 atributos estatísticos de textura para cada região. O algoritmo de extração de atributos se mostrou robusto, não apresentando falhas. Através do cálculo da distância JM, mediu-se o grau de discriminação das classes normal e anormal e encontrou-se a combinação 9 a 9 como a mais otimizada, levando-se em consideração o valor da distância JM e a quantidade de dimensões do vetor de atributos. Obteve-se uma distância JM** = 1,41413 para a melhor combinação 9 a 9, sendo ela formada pelos seguintes atributos: 1 energia; 4 correlação; 5 média da diferença inversa; 6 entropia; 8 diferença da entropia; 9 média da soma; 10 soma da variância; 11 média da diferença; 13 medida de correlação I. À medida que se aumenta o número de atributos nos vetores e se faz o cálculo da distância JM, esta tende a se aproximar de , entretanto, não é interessante aumentar o número de dimensões do vetor de atributos depois que a distância JM atinge um certo limiar próximo de , pois a variação da distância JM será de décimos de milésimo (0,0001), o que praticamente não afetará os resultados da classificação, porém aumentará consideravelmente o custo computacional do processo. O método de classificação não paramétrico utilizado, o kNN, não necessita de informações a priori para realização do processo de classificação. No entanto, requer a presença de amostras de treinamento, o que pode tornar o custo computacional do classificador elevado, conforme o banco de dados de comparação aumenta de tamanho. Entretanto, o método kNN se aplica de forma eficiente ao sistema proposto, devido ao tamanho da base de dados ser relativamente pequeno, o que faz com que o custo computacional seja reduzido. Os melhores resultados obtidos através da análise da curva ROC para este sistema são encontrados quando k assume os valores iguais a 9 e 10, cujas respectivas áreas sob a curva ROC são 0,88709 e 0,88713. Embora o resultado da classificação tenha sido satisfatório, uma possível forma de melhorar ainda mais o sistema de detecção seria ignorar áreas que parecem conter estruturas de fundo, como bordas de costelas e grandes vasos, pois esses dois padrões estão contidos tanto em imagens normais quanto anormais. Essas estruturas podem ser confundidas com um padrão patológico, ou até mesmo mascarar possíveis anormalidades, uma vez que essas estruturas estão contidas no padrão das imagens normais. Esse mascaramento de anormalidades pode afetar diretamente a sensibilidade do sistema. De fato, deve ter contribuído para que o sistema tivesse uma tendência de ser mais específico que sensível. Esta tendência pode ser vista nos gráficos das Figuras 7 e 8. O problema das estruturas de fundo possivelmente pode ser resolvido empregando-se técnicas de pré-processamento para sua remoção, por exemplo, um filtro de costelas(12).
CONCLUSÃO Devido ao padrão difuso apresentado pelas lesões intersticiais de pulmão, as quais tendem a acometer pelo menos um terço de cada campo pulmonar(2), verificou-se ser a textura um bom parâmetro para sua caracterização. Dentre as várias formas de extração de textura existentes, esta pesquisa explorou a abordagem estatística proposta por Haralick, uma estatística até então não explorada em sistemas de auxílio ao diagnóstico para lesões intersticiais de pulmão. Devido ao número limitado de amostras, optou-se por usar o classificador não paramétrico kNN, pois este, a priori, não necessita de informações previamente estabelecidas para a realização da classificação. Todavia, outros classificadores poderiam ter sido utilizados, como o classificador bayesiano, o qual permite a inserção de informações anteriormente estabelecidas na realização da classificação, e até mesmo um classificador baseado em redes neurais. Outros trabalhos de pesquisa estão em andamento para teste dessas outras técnicas. Considerando os resultados obtidos para a melhor configuração, indicando uma área sob a curva ROC (AZ) igual a 0,887, com valores de especificidade igual a 0,793 e sensibilidade igual a 0,804, pode-se concluir que a metodologia estudada apresenta bom potencial para a caracterização de lesões intersticiais de pulmão em radiografias digitalizados de tórax.
REFERÊNCIAS 1. Genereux GP. Pattern recognition in diffuse lung disease. A review of theory and practice. Med Radiogr Photogr 1985;61:231. [ ] 2. van Ginneken B, Katsuragawa S, ter Haar Romeny BM, Doi K, Viergever MA. Automatic detection of abnormalities in chest radiographs using local texture analysis. IEEE Trans Med Imaging 2002;21: 139149. [ ] 3. Fraser RG, Paré JAP. Diagnosis of diseases of the chest. Philadelphia, Pa: Saunders, 1970. [ ] 4. Azevedo-Marques PM. Diagnóstico auxiliado por computador na radiologia. Radiol Bras 2001;34: 285293. [ ] 5. Haralick RM, Shanmugam K, Dinstein I. Textural features for image classification. IEEE Trans Systems, Man, Cybernetics 1973;SMC-3:6l0621. [ ] 6. Van Gool L, Dewaele P, Oosterlinck A. Survey: texture analysis anno 1983. Computer Vision, Graphics, and Image Processing 1985;29:336357. [ ] 7. Reed RT, Du Buf JMH. A review of recent texture segmentation and feature extraction techniques. Computer Vision, Graphics, and Image Processing 1993;57:359372. [ ] 8. Demedts M, Wells AU, Antó JM, et al. Interstitial lung diseases: an epidemiological overview. Eur Respir J Suppl 2001;32:216. [ ] 9. Coultas DB, Zumwalt RE, Black WC, Sobonia RE. The epidemiology of interstitial lung diseases. Am J Respir Crit Care Med 1994;150:967972. [ ] 10. Young TY, Fu KS. Handbook of pattern recognition and image processing. New York, NY: Academic Press, 1986. [ ] 11. Duda RO, Hart PE. Pattern classification and scene analysis. New York, NY: Wiley, 1973. [ ] 12. Vogelsang F, Weiler F, Dahmen J, Kilbinger MW, Wein B, Günther RW. Detection and compensation of rib structures in chest radiographs for diagnostic assistance. Proc SPIE 1998;3338:774785. [ ]
Endereço para correspondência: Recebido para publicação em 28/10/2004. Aceito, após revisão, em 1/4/2005.
* Trabalho realizado no Serviço de Radiodiagnóstico do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (HCFMRP-USP), Ribeirão Preto, SP. |