시계열7 [Time series] ARIMA 적용 표준절차 그러면 이제 ARIMA 모델링을 적용하는 표준 절차에 대해서 한번 살펴볼까요? Box-Jenkins의 ARIMA procedure입니다. 1. 모델 식별 (Model Identification)시계열이 stationary인지 체크하고 그렇지 못할 경우 추세/주기성 제거, 차분, 시계열 변환 등을 활용해서 시계열을 안정화하는 작업을 선행합니다(ARIMA모델의 차수 \(d\) 는 시계열의 차분 횟수를 의미합니다). 여기서, 비정상 시계열을 정상화하는데 만능키처럼 차분을 남용하는 것은 좋지 않습니다. 기본적으로 차분이라는 것은 정보를 꽤나 많이 손실시키는 작업이기 때문에(예를 들어서 상수항의 의미도 '절편'에서 '기울기'로 달라지죠) 최대한 다른 처리를 통해 정상화를 시도해보고 최후의 보루로서 시도하는 것이.. 2025. 1. 11. [Time Series] ARMA parameter의 MLE 추정 자 지금까지는 어떤 시계열이 주어졌을 때 그게 어떤 process이고 그 process를 규정하는 parameter들(\(\phi\)같은 애들)의 참값이 어떤값인지 아는 상태에서 covariance가 어떻게 되는지, 예측값은 어떻게 되는지 이런것들을 계산했습니다. 그런데, 실제 세상에서는 이런 parameter들의 참값을 알수는 없겠죠? 대개 주어진 시계열이 어떤 process를 따르는지 조차 모르는 상태에서 모델을 가정하고 parameter값을 통계적으로 추정하게 됩니다. 그리고 이렇게 추정하는 대표적인 방법이 Maximum Likelihood Estimation(MLE)입니다. MLE는 선형회귀분석쪽에서도 제가 다룬 적이 있었죠? 이번 포스팅에서는 ARMA에서의 MLE에 집중해서 살펴보겠습니다. A.. 2024. 11. 30. [Time Series] ARMA Forecast 저번 포스팅에서 시계열에서 최적(RMSE관점) 예측의 조건, 그 중에서도 선형 꼴 예측의 조건을 살펴봤습니다. 예고드린대로 이번에는 우리가 다루고 있었던 ARMA process에서의 예측을 다루어보도록 하겠습니다. (계산 상의 편의를 위해서 observation이 무한하다고 가정한 상황만 다루어 보겠습니다. 만일 유한한 관측에서의 forecasting을 알아보고 싶으시면 Hamilton 교재의 4장을 참고하세요) 1. 오차항의 Lag에 기반한 예측 (MA꼴에서 출발)먼저 MA(\(\infty\)) 형태로 표현되는 process를 고려해볼까요?\[ (Y_t - \mu) = \psi(L) \epsilon_t \]where \(\epsilon_t\) is white noise and\[ \psi(L) = \s.. 2024. 11. 27. [Time series] Forecasting 일반론 시계열을 분석하는 목적은 궁극적으로 미래예측 즉, Forecasting일 겁니다. 먼저 Forecasting 일반론을 살펴보고 우리가 알아보았던 ARMA시계열에서 구체적으로 어떤식으로 예측을 진행하는지 살펴보겠습니다. \( Y_{t+1} \)의 값을 예측한다고 해봅시다. 이때, 예측은 시점 \( t \)에 관측된(Observed) 변수 \( X_t \)의 값을 기반으로 이루어집니다. 만약, \(t+1\)시점의 \(Y\)값 \( Y_{t+1} \)를 가장 최근 \( m \)개의 \(Y\) 값에 기반하여 예측한다면 \( X_t \)는 \( Y_t, Y_{t-1}, \ldots, Y_{t-m+1} \)과 상수로 구성됩니다. 수식적으로 \( Y_{t+1|t} \)를 \( X_t \)를 기반으로 한 \( Y_{t.. 2024. 11. 25. [Time Series] Stationary ARMA process ARMA(p, q) processARMA(p, q) 모델은 다음과 같이 정의됩니다:\[ Y_t = c + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \cdots + \phi_p Y_{t-p}\\ + \epsilon_t + \theta_1 \epsilon_{t-1} + \theta_2 \epsilon_{t-2} + \cdots + \theta_q \epsilon_{t-q} \]또는 Lag Operator를 이용하여 다음과 같이 표현할 수 있습니다:\[ (1 - \phi_1 L - \phi_2 L^2 - \cdots - \phi_p L^p) Y_t = c + (1 + \theta_1 L + \theta_2 L^2 + \cdots + \theta_q L^q) \epsilon_t \]ARMA(.. 2024. 11. 20. [Time Series] Lag Operator Dr.Trillion Dr.Trillion Dr.Trillion Dr.Trillion Dr.TrillionLag Operator \( L \)는 시계열 데이터 \( y_t \)를 한 시점 이전으로 이동시키는 연산자입니다\[ L y_t = y_{t-1} \]여러 번 적용하면\[ L^k y_t = y_{t-k} \]Difference Operator1차 차분은 다음과 같이 표현됩니다:\[ \Delta y_t = (1 - L) y_t \]2차 차분은 다음과 같습니다:\[ \Delta^2 y_t = (1 - L)^2 y_t \]ARIMA ModelARIMA(p, d, q) 모델은 다음과 같이 정의됩니다:\[ (1 - \phi_1 L - \cdots - \phi_p L^p)(1 - L)^d y_t = \t.. 2024. 11. 17. 이전 1 2 다음 728x90