Statistics

Prediction


2017.10.03: editing started by
Japanese English

過去のデータから未来を読む

時系列のデータは、

いろいろな変動が合成された結果として得られる。

データが凸凹するのは誤差変動に由来するが、これを取り除くために移動平均法を使う。 奇数個のデータを平均することがよく行われている。 $ xaverage_{i} = (x_{i-1}/2 + x_i + x_{i+1}/2) /2 \quad\quad\quad (前後の半分との平均で、3個のデータを扱うが、2時点移動平均)$
$ xaverage_{i} = (x_{i-1} + x_i + x_{i+1}) /3 \quad\quad\quad (前後との平均で、3個の平均。3時点移動平均)$
$ xaverage_{i} = (x_{i-2}/2 + x_{i-1} + x_i + x_{i+1} + x_{i+2}/2) /4 \quad\quad\quad(前2個、後2個との平均だが遠いデータは影響を減らしている、これは4個の平均とみなせる。4時点移動平均)$
$ xaverage_{i} = (x_{i-2} + x_{i-1} + x_i + x_{i+1}+ x_{i+2}) /5 \quad\quad\quad (前後2個ずつとの平均で、5個の平均。5時点移動平均)$

データをグラフにしたときの、山頂(ピーク)から山頂への距離を測ると周期がわかる。 谷底から谷底への距離でも周期が確認できる。 周期変動の大きさは山頂と谷底の間の振幅を調べることでわかる(移動平均なので最大・最小のデータは丸められているので補正が必要なことに注意すべき)。

周期ごとの振幅の変化を調べることで、傾向変動がわかる。 これを「トレンド解析 (= 傾向解析)」と呼ぶ。


トレンド解析

$n$時点移動平均での、
$\displaystyle 誤差 = \begin{cases} \frac{1}{\sqrt{n}} \quad\quad\quad (nがoddの時)\\ \frac{1}{n} \sqrt{n - \frac{1}{2}} \quad\quad\quad (nがevenの時)\\ \end{cases}$

相関係数 $\displaystyle r = \frac{\sum (x_i - \bar{x}) (y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \ cdot \sum (y_i - \bar{y})^2}} $

コレログラム (correlogram)


Yoshihisa Nitta

http://nw.tsuda.ac.jp/