본문 바로가기

알아두면좋은IT상식

[논문 분석] 강우자료의 비동질성 규명을 위한 변동점 분석기법의 상호비교 및 적용

https://sam.riss.kr/findThesisAnalysis.do?controlNo=100250641&qry=%ea%b0%95%ec%9a%b0%ec%9e%90%eb%a3%8c%ec%9d%98+%eb%b9%84%eb%8f%99%ec%a7%88%ec%84%b1+%ea%b7%9c%eb%aa%85%ec%9d%84+%ec%9c%84%ed%95%9c+%eb%b3%80%eb%8f%99%ec%a0%90+%eb%b6%84%ec%84%9d%ea%b8%b0%eb%b2%95%ec%9d%98+%ec%83%81%ed%98%b8%eb%b9%84%ea%b5%90+%eb%b0%8f+%ec%a0%81%ec%9a%a9&docType=A

 

SAM 학술관계분석서비스

 

sam.riss.kr

 

데이터가 급격하게 변화하는 지점을 탐지하기 위해서 위의 논문을 분석후 참고할 예정 입니다.

 

위 논문에서는 홍수, 가뭄같은 수문현상을 예측하는데 문제가 되는 비동질성(==비정상성) 요인을 해결하는데 활용가능한 변동점 분석 결과를 제시한다.

 

# 정상성의 의미(Stationarity)

시간에 따라 일정한 특성을 유지하는 현상

  1. 평균(constant mean): 시계열 데이터의 평균이 일정하다.
  2. 분산(constant variance): 데이터의 분산이 일정하다.
  3. 자기상관(constant autocorrelation): 시간에 따라 자기상관이 일정하다.

# 비정상성이란(Non-Stationarity)?

반면에, 비정상성(Non-Stationarity)을 가지는 시계열 데이터는 시간에 따라 평균, 분산, 또는 자기상관이 변하는 특성을 갖습니다. 이는 추세(Trend)나 계절성(Seasonality) 등이 포함되어 있거나, 시간에 따라 분산이 증가하는 등의 특징을 나타낼 수 있습니다. 비정상성을 가진 데이터는 정상성을 회복시켜야 통계적 모델링이나 예측이 가능해집니다.

 

on-line 방법: 순차적으로하나씩분석, 새로입력된 자료가 기존자료들과 어떠한통계적특성이 있는지를분석하고 이로부터변동점의 여부를 결정

 

off-line 방법: 자료 의 전체를 입력하여 대상자료 전체에 대해 변동점 분석을 수 행