[논문리뷰] Topological feature search method for multichannel EEG Application in ADHD classification (2)
이 논문은 ADHD(주의력결핍 과잉행동장애) 진단에 다채널 EEG(뇌파) 데이터를 활용하기 위한 새로운 위상수학적 특징 검색 방법을 제시한다. 기존 TDA(위상수학적 데이터 분석) 방법의 한계를 극복하기 위해, 다채널 EEG 데이터의 숨겨진 위상수학적 특징을 정확하게 식별하는 데 초점을 맞추고 있다. 특히, k-PDTM(k-Power Distance to Measure)과 MKDE(Multivariate Kernel Density Estimation) 기술을 통합하여 위상수학적 특징 손실 문제를 해결하고, PI(Persistence Image) 방법을 통해 특징을 추출한다. 해당 연구는 EEG 신호의 비선형적 특성을 분석하고 ADHD 진단의 정확도, 민감도, 특이성을 향상시키는 데 기여하며, 궁극적으로 ADHD 조기 진단에 도움을 줄 수 있다.
4. Experiment and discussion
The relevant evaluation metrics
제안된 알고리즘의 효과를 정량적으로 평가하기 위해 정확도(Accuracy, ACC), 민감도(Sensitivity, SE), 특이도(Specificity, SP) 세 가지 지표를 사용
정확도(ACC): 전체 샘플 중 올바르게 분류된 샘플의 비율로, 다음과 같이 정의된다.
$$\text{ACC} = \frac{TP + TN}{TP + TN + FP + FN}$$
민감도(SE): 모든 양성 사례 중 실제 양성을 정확히 분류한 비율로, 다음과 같다.
$$\text{SE} = \frac{TP}{TP + FN}$$
특이도(SP): 모든 음성 사례 중 실제 음성을 정확히 분류한 비율로, 다음과 같다.
$$\text{SP} = \frac{TN}{TN + FP}$$
여기서 TP는 True Positive, TN은 True Negative, FP는 False Positive, FN은 False Negative를 의미
분류기에는 소규모 샘플에서 개별 특성 분류에 효과적인 K-최근접 이웃(K-Nearest Neighbors, KNN) 알고리즘을 사용
The experimental results and Comparison
Persistence Image(PI)에서 가중 함수의 효과를 평가하기 위해, 낮은 지속성(노이즈)과 높은 지속성(유의미한 특징)에 영향을 미치는 두 파라미터 a와 c를 조합하여 실험을 수행하였다.
그 결과 a = 0, c = 3 조합이 가장 우수한 성능(정확도 78.27%, 민감도 80.62%, 특이도 75.63%)을 나타냈다.
이는 ADHD EEG에서 낮은 지속성 특징들이 분류 정확도를 떨어뜨릴 수 있으며, 다채널 분석 과정에서 반복적인 매핑으로 인해 위상 노이즈의 지속성이 증가해 낮은 지속성 점의 수가 많아지는 경향이 있다는 점을 시사한다. 따라서 PI 기반 ADHD 분류에서는 낮은 지속성 점들이 불필요할 수 있음을 확인하였다.
Entropy Summary Function, Persistence Landscape, Betti number, 그리고 Persistence Image(PI) 방법을 적용하여 특징 벡터를 생성하고, 동일한 KNN 분류기로 비교 실험을 수행하였다.
PI 방법은 정확도, 특이도, 민감도에서 모두 가장 우수한 성능을 보였으며, 특히 Betti number는 판별력이 거의 없는 것으로 나타났다. 이는 ADHD EEG에서 중요한 위상 특징이 단순한 생성 개수보다는 지속 시간(persistence)에 기반하고 있다는 점을 시사한다.
기존 TDA 방식은 포인트 클라우드에서 추출된 위상 특징의 분리 능력이 부족하여 ADHD와 대조군의 EEG를 효과적으로 구분하지 못하는 한계가 있었다. 반면, 본 연구의 개선된 TDA 방법은 지속성 점들의 소멸 시점을 지연시킴으로써 ADHD EEG의 위상 특징이 더 오래 유지되도록 하였으며, 이에 따라 더 높은 평균 소멸 값을 확보할 수 있었다.
Clinical assessment and future work
본 연구에서 제안한 위상 기반 특징은 ADHD EEG와 정상 EEG를 효과적으로 구별할 수 있음을 보였지만, 아직 임상 실무에 적용되기에는 몇 가지 보완이 필요하다.
임상 적용 시 고려 사항:
- 특징 해석 가능성: 임상의들은 수학적으로 도출된 특징이 ADHD의 핵심 증상(예: 주의력 결핍, 충동성)과 어떻게 연관되는지를 이해할 수 있어야 한다. 생물학적 해석 가능성을 높이기 위한 노력이 필요하다.
- 채널 수 간소화: 현재 사용된 EEG 장치는 19개 이상의 채널을 사용하고 있어 임상 현장에서의 활용에는 다소 복잡할 수 있다. 향후 연구에서는 진단 정확도를 유지하면서 채널 수를 줄이는 최적화가 필요하다.
- 질병 데이터 다양성 확대: 알고리즘의 일반화 능력을 높이기 위해 더 다양한 질환군의 EEG 데이터를 수집하고, 이를 기반으로 위상 특징의 신경생물학적 의미를 탐색해야 한다.
향후 계획:
- 실제 ADHD 환자 및 기타 질환 데이터를 수집하여 모델을 정제하고,
- 신경과학자 및 임상의와의 협업을 통해 위상 특징의 생리학적 기반을 해석하며,
- 궁극적으로는 제안된 알고리즘을 EEG 장치에 내장하여 ADHD의 신속한 탐지 및 식별이 가능한 임상 시스템으로 발전시키고자 한다.
5. Conclusion
- 본 연구는 다채널 ADHD EEG 분석을 위해 개선된 위상 데이터 분석(TDA) 기반 방법론을 제안하였다.
- 핵심 기여는 k-PDTM을 활용하여 이상적인 포인트 클라우드 구조를 재구성하고, MKDE 기법을 통해 리매핑된 persistence diagram 상의 이상치를 효과적으로 필터링함으로써 분석의 견고성을 높인 점에 있다.
- 또한, 각 persistence point가 분류 결과에 미치는 영향을 정량적으로 분석하고, Persistence Image(PI) 기법에서 다양한 가중 함수를 적용하여 실험을 수행하였다.
- IEEE ADHD 데이터셋 기반 실험 결과, 제안한 위상 기반 특징이 기존의 비선형 특성 기술자들보다 우수한 분류 성능을 보였다.
- 향후 연구에서는 비선형 위상 특징과 EEG의 다양한 도메인 특성을 통합한 다채널 분석을 확장하고, 제안한 알고리즘을 실제 EEG 기기에 내장하여 ADHD의 실시간 감지 및 조기 식별 시스템으로 발전시키는 것을 목표로 한다.