단순 다변수 시계열 예측

블로그

이 튜토리얼은 지난 주에 게시될 예정이었습니다. 내가 일을 얻을 수 없다는 것을 제외하고 ( 그리고 괜찮은 ) 모델은 이에 대한 기사를 작성할 준비가 되었습니다. 사실, 코드에서 유용하고 읽기 쉬운 출력을 얻기 위해 코드에 2일을 소비해야 했습니다.

하지만 나는 그것에 화를 내지 않는다( 지금 ). 이것이 여기에서 내 도전의 목표이며 사실 나는 이전의 모든 분류 작업을 연속으로 푸는 것에 다소 지쳐가고 있었습니다. 그리고 좋은 소식은 데이터를 처리에 적합한 형식으로 모델링하고 시계열 데이터에 대한 탐색적 데이터 분석을 수행하고 좋은( 내가 생각해낼 수 있는 최선, 예를 들어, 2일 후에 ) 모델.

그래서 제 여행을 기념하기 위해 밈도 만들었습니다. 나는 튜토리얼이 반대편에 있음을 약속합니다.

치아코인은 어디서 살 수 있나요?

네, 제 코드로 밈을 만들었습니다.

_데이터 세트 정보: _ _가스 센서 어레이 데이터 세트, 다운로드 여기 ** , _ ** 8개의 센서 판독값으로 구성되어 에틸렌 가스와 메탄 또는 일산화탄소 혼합물의 농도 수준을 감지하도록 설정되었습니다. 농도 수준은 시간에 따라 지속적으로 변하고 센서는 이 정보를 기록합니다.

회귀는 이 데이터 세트에 대해 구현할 수 있는 다른 유형의 솔루션이지만 시계열 예측 문제에 익숙해지고 나 자신에게 더 많은 도전 과제를 설정하기 위해 의도적으로 다변수 시계열 모델을 구축하기로 결정했습니다.

시계열 데이터는 시간에 따라 지속적으로 변합니다. 그렇게 하는 하나의 변수(단변량) 또는 주어진 데이터 세트에서 시간에 따라 변하는 여러 변수(다변량)가 ​​있을 수 있습니다.

여기에는 총 11개의 기능 변수가 있습니다. 8개의 센서 판독값(시간 종속), 온도, 상대 습도 및 기록이 관찰된 시간(스탬프).

UCI Machine Learning Repository에 있는 대부분의 데이터 세트와 마찬가지로 플랫 파일을 정리하고 CSV 형식으로 변환하고 맨 위에 열 헤더를 삽입하는 데 시간을 소비해야 합니다.

이것이 지겹게 들리면 간단히 다운로드할 수 있습니다. 하나의 그러한 파일 저는 이미 준비했습니다.

카드 게임 튜토리얼 화합

NS

그의 글은 대부분의 초보자가 모를 수도 있는 개념을 설명하기 위해 여기저기 흩어져 있는 설명과 함께 긴 튜토리얼이 될 것입니다. 그러니 미리 양해해 주셔서 감사합니다. 설명은 최대한 간략하게 요점으로 유지하겠습니다.

비정상 데이터에는 데이터에 있는 추세가 있습니다. 벡터 자기회귀(VAR) 모델에서는 데이터가 고정되어 있어야 하므로 이 속성을 제거해야 합니다.

고정 급수는 평균과 분산이 시간에 따라 변하지 않는 급수입니다.

정상성을 확인하는 방법 중 하나는 ADF 테스트입니다. ADF 테스트는 8개의 모든 센서 판독값 열에 대해 구현되어야 합니다. 또한 데이터를 학습 및 테스트 하위 집합으로 분할합니다.

#다변수 분석 #시계열 예측 #데이터 과학 #머신 러닝 #시계열 분석 #데이터 분석

로데이터사이언스닷컴

단순 다변수 시계열 예측

이 튜토리얼은 지난 주에 게시될 예정이었습니다. 작동하는(그리고 괜찮은) 모델을 제 시간에 준비하여 이에 대한 기사를 작성할 수 없다는 점을 제외하고는.