이 논문은 ADHD(주의력결핍 과잉행동장애) 진단에 다채널 EEG(뇌파) 데이터를 활용하기 위한 새로운 위상수학적 특징 검색 방법을 제시한다. 기존 TDA(위상수학적 데이터 분석) 방법의 한계를 극복하기 위해, 다채널 EEG 데이터의 숨겨진 위상수학적 특징을 정확하게 식별하는 데 초점을 맞추고 있다. 특히, k-PDTM(k-Power Distance to Measure)과 MKDE(Multivariate Kernel Density Estimation) 기술을 통합하여 위상수학적 특징 손실 문제를 해결하고, PI(Persistence Image) 방법을 통해 특징을 추출한다. 해당 연구는 EEG 신호의 비선형적 특성을 분석하고 ADHD 진단의 정확도, 민감도, 특이성을 향상시키는 데 기여하며, 궁극적으로 ADHD 조기 진단에 도움을 줄 수 있다.
1. Introduction
- 개선된 TDA 기법을 통해 ADHD 환자의 다채널 EEG 시계열 데이터에서 숨겨진 위상적 특성을 정확하게 식별하는 것이 목표
- 기존 TDA 단점
: 1) 노이즈 간섭에 취약 2) 위상 특징 손실 3) 오인식 4) 단일 시계열만 적용 가능, 다채널에서의 효율성, 정확성 떨어짐
⇒ 단점 극복 가능한 새로운 TDA를 본 논문에서 제시하는 것
ADHD의 multi-channel EEG에 적용할 수 있는 향상된 TDA 접근법을 제안
1. 다채널 EEG에 대한 최적의 입력 파라미터를 결정
2. 각 채널의 EEG에 대해 위상 공간 재구성(Phase Space Reconstruction, PSR) 수행
3. k-Power Distance to Measure(k-PDTM)를 사용하여 이상적인 point clouds 근사
4. 다차원 시계열을 다시 임베딩, TDA를 적용해 위상 특징 정보 얻음
5. 가우시안 기반 다변량 커널 밀도 추정(Gaussian function-based Multivariate Kernel Density Estimation, MKDE)을 병합된 Persistence Diagram에 적용하여 원하는 위상 특징 매핑(topological feature mappings)을 필터링
6. Persistence Image (PI) 방법을 사용하여 위상 특징을 추출하고, 다양한 가중 함수(weighting functions)가 결과에 미치는 영향을 논의
2. Materials and signal preprocessing
Data Materials & preprocessing
- IEEE DataPort에서 제공하는 IEEE ADHD 데이터를 활용
- 7~12세 ADHD 진단 아동 61명과 건강한 대조군 60명으로 구성
- EEG 신호는 국제 10-20 시스템에 따라 19개 전극(Fz, Cz, Pz 등)으로 기록, 샘플링 주파수는 128Hz
- 신호 전처리 과정에서는 0.5Hz~50Hz 대역 통과 필터와 독립 성분 분석(ICA)을 사용하여 노이즈 제거
- 계산 복잡성을 줄이기 위해 ADHD와 관련된 Fz, F8, F3, C4, C3, F7 6개 전극만을 선택
- 각 채널의 EEG는 4초 길이로 분할하여 분석
- 개별 주파수 대역 분석하지 않고 전체 주파수 대역 분석 → 비선형 분석에서 뇌 영역 활동 종합적 파악 가능하고 복잡한 상호작용과 전반적인 동적 특성을 포착할 수 있기때문
Determining the parameters of phase space reconstruction
Phase space reconstruction (PSR) : TDA에서 매우 중요한 전처리 단계, 시계열 신호를 point cloud 구조로 변환하는 역할을 함.
- time delay embedding 과정이 필수적 → 이를 통해 신호의 point cloud 얻을 수 있음
- 임베딩 차원 : m , 시간 지연 : Δt
- 단변량 시계열에서 최적의 임베딩 파라미터를 찾기 위한 방법 : FNN, 자기상관 계수, MI
- 다변량 시계열은 정보 많기에 단변량 기반 방법들을 다변량 시계열에 확장하여 시계열의 동적 시스템을 복원할 수 있는지 여부는 논의할 문제
- 단변량 시계열 → 다변량 확장 시, 임베딩 차원 : $m_i$ , 시간 지연 : $\tau_i$
- i번째 시계열의 임베딩 벡터 $X_i(t) = \left[ x_i(t),\ x_i(t - \tau_i),\ \dots,\ x_i(t - (m_i - 1)\tau_i) \right]$
- 다변량 시계열 파라미터 결정법 : 비균일 상태 공간 재구성, 로컬 상수 방법, 다변량 C-C 방법
- 불필요하거나 중복된 변수 피할 수 있다는 장점, 계산 비용 높고 단변량 시계열의 위상 공간 특징 훼손 할수 있어 EEG 다변량 신호 분석에 적합하지 않은 경우 있음
- 비선형 분석 → 서로 다른 뇌 영역의 단변량 시계열이 가지는 attractor 구조를 최대한 보존하는 것이 목표
+) Garcia의 다변량 위상 공간 재구성 → 단변량 기반 분석 방법 확장 ; 논문 참조해야함
- 본 연구에서는 다변량 EEG 신호의 시간 지연과 임베딩 차원을 계산하기 위해
- uniform multivariate average mutual information method (균일 다변량 평균 상호 정보량 방법)과
- multidimensional extension method of FNN(FNN의 다차원 확장 방법) 채택
- 최종적으로 계산된 다차원 임베딩에서 각 시계열에 대한 최적 파라미터 : m = 2, t = 10
3. Methodology
'방법론 파트는 후반부로 갈수록 이해에 실패하여.. 정리하려고 했으나.. 정리가 안되었다.. ㅠ 그래서 이해안되는 부분은 거의 다 적어내려갔다.'
PSR 이후 ADHD 시계열 신호는 point cloud 형태로 변환
→ point cloud에 대해 TDA 수행하면 원래 신호의 비선형 위상 특징을 효과적으로 추출할 수 있음
- 이때, Persistent Homology(PH)가 TDA의 핵심 방법
Persistent homology and persistence diagram
용어 | 의미 |
k-simplex | 점들을 연결해서 만든 k차원 도형 |
face | simplex의 “경계 부분” (하위 차원 simplex) |
simplex | 그림 | 구성 |
0-simplex | 점 하나 ● | 점 1개 |
1-simplex | 선분 ●———● | 점 2개 + 선(1-simplex) 1개 |
2-simplex | 삼각형 △ | 점 3개 + 변(1-simplex) 3개 |
simplicial complex (단순체 복합체)
- 여러 개의 simplex(점, 선, 삼각형, …)를 규칙에 맞게 조합한 것 → 그래프 + 도형 + 고차원 구조를 다 표현 가능
- 규칙 두 가지 :
1️⃣ 포함 규칙
어떤 simplex가 있다면 그 face(경계)도 반드시 포함되어야 함
예: 삼각형(2-simplex)이 있으면 → 그 삼각형의 변(1-simplex)들도 반드시 포함!
2️⃣ 교집합 규칙
두 simplex가 겹치면 → 그 교집합은 반드시 둘 다의 face여야 함
(예: 삼각형 2개가 한 변을 공유한다면 → 그 변(1-simplex)은 두 삼각형 모두의 face로 들어가야 함)
- 단순체 복합체의 차원(dimension)은 그 안에 포함된 simplex 중에서 가장 높은 차원의 simplex의 차원
- 모든 k-차원의 simplex는 최소 k-차원 공간에 임베딩될 수 있는 기하학적 단순체 복합체(geometric simplicial complex)와 연관지을 수 있으며, 이때 그들의 위상학적 성질은 서로 동등하다.
-X는 m-차원 공간에 임베딩된 점군이며, 각 점은 $x_i \ (i = 1, 2, …, n) \in X$ 이다.
- 각 점 $x_i$를 중심으로 반지름 $\epsilon$인 구(ball) B를 정의한다. Vietoris-Rips 복합체(Vietoris-Rips complex)는 TDA에서 널리 사용되는 단순체 복합체 구조로, 다음과 같은 정의를 만족한다:
$$ V_\epsilon = \left\{ \sigma^k_i \ \big| \ B(x_i, \epsilon/2) \neq \emptyset,\ \forall x_i \in \sigma^k_i \right\} $$
- point cloud 내 두 점 사이의 거리가 $\epsilon$보다 작으면 1-simplex(선분)의 부분 집합 형성할 수 있음.
- Vietoris-Rips 복합체 $V_\epsilon$는 이러한 조건을 만족하는 모든 simplex들의 부분 집합으로 구성되어 simplicial complex 구조를 형성
- 거리 파라미터 $\epsilon$을 증가시키면, 기존의 simplicial complex는 유지되면서 더 큰 $\epsilon$에 해당하는 새로운 simplex들이 추가됨
- 점군 X에서 서로 다른 거리 파라미터 $\epsilon_i$에 따른 Vietoris-Rips 복합체 $V_{\epsilon_i}(X)$들은 다음과 같은 포함 관계(inclusion relationship)를 갖는다:
$$ V_{\epsilon_1}(X) \subseteq V_{\epsilon_2}(X) \subseteq \dots \subseteq V_{\epsilon_n}(X) $$
- 거리 파라미터 $\epsilon_i$에 해당하는 simplicial complex $V_{\epsilon_i}(X)$ 안에는 다양한 위상학적(topological) 특징 존재
- Persistent homology에서는 이러한 전역적(global) 위상 특징들을 Betti 수(Betti number) $\beta_k$로 정의한다. 이는 위상 공간에서 k-차원의 “구멍(hole)” $H_k$를 나타낸다.
구체적으로:
- $\beta_0$ → 연결된 성분(connected components)의 개수
- $\beta_1$ → 2차원 표면 상의 “구멍”(loops, holes)의 개수
- $\beta_2$ → 3차원 공간 속의 “빈 공간”(voids)의 개수
- 그 이상도 고차원으로 확장 가능
- 각 simplicial complex $V_{\epsilon_i}(X)$는 이에 대응하는 homology group $H_k \left( V_{\epsilon_i}(X) \right)$와 연결된다.
- 이 homology group들은 다음과 같은 포함 관계를 가진다:
$$H_k(V_{\epsilon_1}(X)) \subseteq H_k(V_{\epsilon_2}(X)) \subseteq \cdots \subseteq H_k(V_{\epsilon_n}(X))$$
- $\epsilon$ 값을 연속적으로 변화시키는 과정에서, inclusion 관계를 가지는 simplicial complex들은 Filtration이라는 구조를 형성한다.
- Filtration을 구축하는 과정에서 $\beta_k$ (구멍의 개수)가 생기고(출생, birth) 사라지는(소멸, death) 과정이 나타난다.
- Persistent homology의 핵심 아이디어는, 큰 스케일에서 오랫동안 유지(persist)되는 $\beta_k$ 특징들이 의미 있는(topologically significant) 특징으로 간주된다는 것이다.
- 이는 homology group $H_k ( V_{\epsilon_i}(X) )$의 차원(dimension)을 계산함으로써 평가된다.
- 주어진 point cloud로부터 단순체 복합체를 구성하려면 distance parameter 거리 파라미터를 도입해야함.
정리
ε(거리 임계값)를 키워가면서 복합체가 커지는 과정을 Filtration이라고 한다. 이때 구멍(βₖ)이 생기고 사라지는 패턴을 추적하고, 오래 유지되는 구멍이 의미 있는 구조로 간주된다. 구체적으로는 각 시점의 Homology group의 차원을 계산해서 βₖ를 얻는다.
$\beta_k$의 차원이 높아질수록, 그 계산에 필요한 연산 자원은 지수적으로 증가한다. 이를 고려하여, 본 연구에서는 2차원(topological) 특징을 가장 잘 나타내는 $\beta_1$(구멍의 개수)를 선택하여 계산에 사용하였다.
Improvement of TDA methodology in ADHD EEG
- 보통 EEG의 point cloud를 구성하면, 위상 공간(phase space) 전체에 걸쳐 고밀도의 점들이 산재하는 분포가 나타나게 된다.
- 이로 인해 이웃한 점들끼리 서로 방해하면서 원래 존재하던 위상 구조가 흐릿해지고, 그 결과 topological feature들이 손실되는 문제가 발생한다.
- 다행히도 TDA에서는 데이터에 뚜렷한 topological structure가 없어도, diagonal(대각선)에 가까운 점들은 여전히 Persistence Diagram에 나타나게 된다.
- 하지만 이러한 점들은 보통 노이즈(noise)로 해석되며, 분석에 도전 과제가 된다.
- ADHD EEG의 point cloud 역시 상대적으로 작은 규모의 topological feature만을 포함하고 있는데, 기존 TDA 방법은 이러한 feature를 효과적으로 추출하지 못한다.
정상 EEG | ADHD EEG |
Phase space에 점들이 넓게 분산됨 | 밀집 뭉침 (고밀도) |
구멍(loops)이 크고 오래 유지 | 구멍이 작고 금방 사라짐 |
Persistent Diagram에서 long persistence point 많음 | short persistence 위주 → 노이즈와 구분 어려움 |
- 그 결과 Persistence Diagram 상에서는 너무 짧은 birth-death 시간(short persistence time)이 feature들을 덮어버려, topological noise 아래에 묻히게 된다.
👉 이러한 topological feature 손실 현상을 방지하는 것이 본 연구의 핵심 목표
- phase space reconstruction(위상 공간 재구성) 이후에 숨겨진 topological structure들이 일반적인 phase point들과 밀도 차이(density difference)를 보인다는 사실을 발견하였다.
- 이는 기존 TDA에서 노이즈 영향이 큰 경우에 적용되는 topological feature 복원 방법을 이번 연구의 feature search 문제에도 유사하게 적용할 수 있음을 시사한다.
- 구체적으로, distance-to-measure (DTM) 함수의 파생된 방법을 사용하여 원래의 topological feature를 추출할 수 있으며, 본 연구에서는 이를 위해 k-power-distance-to-measure (k-PDTM) 기법을 활용하여 topological structure를 분리(separation)하는 접근법을 제안.
- DTM(distance-to-measure) 함수에서, n개의 점을 포함하는 point cloud Z 내의 어떤 점 x에 대한 매핑(mapping)은 다음과 같은 형태로 표현할 수 있다:
$$d^2_{Z,q}(x) = \inf_{c \in \mathbb{R}^d} \left\| x - m(x, Z, q) \right\|^2 + v(x, Z, q)$$
여기서:
$$m(x, Z, q) = \frac{1}{q} \sum_{i=1}^q X^{(i)} $$
$X^{(i)}$는 x의 i-번째 최근접 이웃(nearest neighbor)을 의미하고, $v(x, Z, q)$는 해당 이웃들의 분산(variance)으로 정의된다:
$$ v(x, Z, q) = \frac{1}{q} \sum_{i=1}^q \left\| m(x, Z, q) - X^{(i)} \right\|^2 $$
하지만 본 연구의 실험에서는 DTM의 n-ball 구조를 그대로 사용하면 계산 비용이 매우 커진다. 따라서 k-PDTM에서 제안된 방식처럼 k-ball을 이용한 근사를 사용한다. k-PDTM에서는 k-ball만으로도 원래의 n-ball을 근사할 수 있으며, 이를 통해 계산량을 줄이면서도 성능을 유지할 수 있다.
k-PDTM의 수식은 다음과 같다:
$$ d^2_{Z, q, k}(x) = \min_{i \in \{1, 2, \dots, k\}} \left\| x - m(c_i^, Z, q) \right\|^2 + v(c_i^, Z, q) $$
여기서 $c^*_i$는 k-ball의 중심(geometric center)이고, 다음 식으로 결정된다:
$$(c_1, c_2, \cdots, c_k) \mapsto \sum_{X \in \mathcal{Z}} \min_{i \in \{1, 2, \dots, k\}} \left\| X - \mathbf{m}(c_i, \mathcal{Z}, q) \right\|^2 + \nu(c_i, \mathcal{Z}, q)$$
Fig. 5에서 보이듯이, ADHD EEG의 phase space에서 350개의 최적 center를 선택함. 이 center들은 위의 수식을 통해 계산됨.
k-PDTM 계산 이후, 모든 점 $x \in Z \subseteq \mathbb{R}^d$는 distance measure 값이 할당된다.
Fig. 5는 k-PDTM으로 얻은 distance measure가 원래 DTM의 sublevel set과 유사한 분포를 나타냄을 보여준다.
이를 통해 계산 효율성을 유지하면서도 topological feature 추출이 가능함을 확인함.
ADHD EEG에서는 phase space에서 고밀도 점들이 원래의 topological structure를 방해하게 된다.
따라서 distance measure 값이 작은 점들(고밀도 영역의 중심 근처)을 제거하고, 상대적으로 feature 구조에 더 가까운 점들만을 남기는 전략을 사용.
여러 차례 실험을 통해, 각 단일 채널 point cloud에서 140개의 phase point를 남기는 것이 다변량 분석(multivariate analysis)에서 최적의 성능을 보임을 확인함.
이 방법은 persistence diagram에서 노이즈 아래 묻혀 있던 topological feature를 효과적으로 복원할 수 있으며,
이미 feature가 잘 형성된 채널에는 영향을 주지 않으므로 전체 phase space에서 feature를 잘 보존할 수 있게 한다.
Topological Features extraction
TDA에서 얻은 persistence diagram은 일반적인 머신러닝 분류기에 바로 입력하기 어려워서 persistence diagram을 변환해 그 안의 topological feature를 추가로 추출하는 과정이 필요함.
- Entropy Summary Function (ES)
- Persistence Landscape (PL)
- Persistence Image (PI)
(위 방법들은 barcode 또는 persistence diagram을 벡터 형태로 매핑(mapping)하여 통계적 분석이나 머신러닝 모델 구축이 가능하게 함)
위와 같은 대표적인 방법들이 제안되어 왔지만, ES, PL 방법은 topological feature 추출 과정에서 유연성이 부족.
고정된 매핑 방식을 사용하기 때문에, persistence point마다 feature vector가 어떻게 구성되는지 실험적으로 조정하기 어렵다.
이러한 한계를 보완하기 위해 PI 방법은 선택 가능한 weighting function을 제공하여,다양한 persistence point 유형의 비중을 조정할 수 있다는 장점이 있다. 따라서 본 연구에서는 persistence diagram에서 topological feature를 추출하기 위한 방법으로 PI 방법을 선택하였다.
PI 방법에서는 먼저 persistence diagram의 point를 2차원 평면으로 선형 매핑(linear mapping)한다.
이를 $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ 로 나타내며, 기본적으로 다음과 같이 설정한다:
$$T(x, y) = (x, y - x)$$
persistence diagram 상의 birth-death 좌표 집합을 B라고 할 때, PI는 다음과 같은 persistence surface로 매핑된다:
$\rho_B(z) = \sum_{u \in T(B)} f(u) \phi_u(z)$
여기서:
- $z = (x, y)$
- $\phi$는 표준화된 대칭 Gaussian 분포:
$\phi_u(x, y) = \frac{1}{2 \pi \sigma^2} \exp\left( -\frac{(x - u_x)^2 + (y - u_y)^2}{2 \sigma^2} \right)$ - $u = (u_x, u_y)$는 persistence point의 좌표
- $f(u)$는 horizontal axis에 따른 non-negative weighting function으로서, 각 persistence point가 PI에서 얼마나 영향을 미칠지를 조정한다.
최종적으로 PI는 다음과 같이 pixel intensity의 집합으로 표현된다:
$I(\rho_B)_P = \iint_P \rho_B , dy , dx$
일반적으로 PI에서 weighting function은 persistence의 vertical 좌표 y에만 의존하게 설정한다. $f(x, y) = w_b(y)$
기존에는 단조 증가하는 sigmoid형 함수 또는 $y = x^2$ 형태의 weighting function을 사용하는 경우가 많았다.
하지만 본 연구에서는 ADHD EEG에서 low persistence point와 high persistence point 모두가 feature에 어떤 영향을 미치는지 종합적으로 분석하기 위해 다음과 같은 weighting function을 설계하였다:
$$ w_b(y) = \begin{cases} a, & 0 < y \leq t_1 \\\\ \frac{c - a}{t_2 - t_1} y + \frac{t_2 a - t_1 c}{t_2 - t_1}, & t_1 < y \leq t_2 \\\\ (y - t_2)^2 + c, & y > t_2 \end{cases} $$
이 함수는 horizontal axis(= diagonal axis)에 대해 0이 되고, 연속적이며 구간별로 미분 가능하도록 설계되었다.
이번 연구에서는 ADHD EEG의 topological feature 특성에 맞춰서 $t_1 = 100, t_2 = 200$으로 설정하였다:
- $y \leq 100$→ low persistence → constant weight a
- $100 < y \leq 200$ → 중간 persistence → 선형 증가
- $y > 200$ → high persistence → exponential 증가
PI에서는 보통 PI image 전체를 벡터로 평평하게 펼쳐서 feature로 사용하는데, 본 연구에서는 가중치(weighting function)를 적용한 후에는 image 내 가장 큰 intensity를 가지는 pixel만을 feature로 사용하였다. 이렇게 하면 불필요한 변수들이 분류 성능을 저하시키는 것을 방지할 수 있다.
마지막으로 남은 변수는 weighting function의 $a$와 $c$인데:
- $a$→ low persistence point가 PI에 미치는 영향
- $c$ → high persistence point가 PI에 미치는 영향
따라서 a, c 값을 조정함으로써, 동일한 persistence diagram으로부터 다양한 topological feature를 실험적으로 얻을 수 있게 된다.
'논문 리뷰' 카테고리의 다른 글
[논문리뷰] Topological feature search method for multichannel EEG Application in ADHD classification (2) (0) | 2025.06.25 |
---|
댓글