Functional Principal Component Analysis
- Functional Principal Component Anlaysis (FPCA)란 이름 그대로 functional data에 적용하는 PCA 방법
- 일반적으로 잘 알려져 있는 multivariate PCA는 \(p\)개의 변수를 \(q(\ll p)\)개의 변수로 차원축소(dimension reduction)하는 방법으로 각 변수들이 uncorrelated되기 때문에 회귀분석(regression)에서 흔히 발생하는 다중공선성(multicolinearity)을 해결할 수 있는 대표적인 방법임
Functional data??
- Functional data란 여러 개체가 각각 시간이나 위치 등에 따라 관측된 형태를 보이는 데이터로 보통 종단자료(longitudinal data) or 시계열(time series) 데이터를 다른 관점에서 본 경우입니다. 
- 시간에 따라 관측된 데이터를 연속(continuous)인 곡선(curve) 형태로 보고 분석하는 데이터 형태입니다. 
- Smootheness를 가정하고 있기 때문에 smoothing 방법이 필요하게 됩니다. 
- B-spline, wavelet basis 등의 basis function을 사용하여 smoothing하게 되고 basis 개수에 따라 smoothing 정도가 결정됨 
- 하지만 형태가 복잡해지는 경우, smooth basis function의 개수가 많아져 차원이 커지는 문제 발생 \(\Rightarrow\) 차원축소 방법이 필요!!  
캐나다 35개 지점의 월별 기온 데이터(출처: Functional Data Analysis Website)
Functional PCA
- Functional PCA도 역시 dimension reduction 방법으로 basis fuction의 dimension을 줄여주는 방법 
- PCA와 마찬가지로 covariance matrix를 고유값 분해(eigenvalue decomposition)를 통해 구하게 됨 
- Smoothness를 가정하기 때문에 inner product가 새롭게 정의됨 \[ \langle x, y \rangle = \int x(t)y(t)dt \] 
How to solve Functional PCA??
- PCA와 마찬가지로 데이터의 평균(mean)을 빼어 centering한 후에 계산된 covariance matrix를 고유값 분해(eigenvalue decomposition)하여 구할 수 있음
- Define the covariance function - \[ v(s,t) = \frac{1}{N}\sum_{i=1}^N x_i(s)x_i(t) \] where \(x_i(t)\) is centerized. 
- Each of PC weight functions(or loadings) satisfies follow eigenequation - \[ \int v(s,t)\xi(t)dt = \rho \xi(s) \] or another form using covariance overator \(V\), - \[ V\xi = \rho \xi \] where $ V= v(,t)(t)dt $ and \(\xi\) is an eigenfunction. 
- Apply eigenvalue decomposition to above eigenequation - The eigenfunction \(\xi\) be the PC weight function.
 
Multivariate PCA vs Functional PCA
- 구할 수 있는 eigen pairs의 개수가 다름
- Multivariate : # of eigen pairs = \(p\) (raw data의 dimension)
- Functional : # of eigen pairs = \(\infty\) (\(\because\) smootheness)
 
- Smoothness 가정
- 이 가정으로 인해 multivariate PCA에서 \(\sum\)으로 구하게 되는 inner product가 functional PCA에서는 \(\int\)로 구하게 됨
 
Reference
- Ramsay. & Silverman. (2005), Functional Data Analysis 2nd edition. Springer
- Functional Data Analysis Website
