新・風の谷の生活

食糧自給率の向上を目指して!

カテゴリ: 気象予測

サクラの開花予想2018も、第29弾から再開し、気温の予想プログラムについて
書いてきましたが、気温の予想プログラムはこれくらいにして、サクラの開花条件に
ついて、調べていくことにしましょう。


2017年のサクラ開花予想は、-10℃を基準に、札幌と東京の開花日までの積算気温を
計算して、開花条件を推定しました。

累積気温(最高気温+絶対温度)

しかし、この計算方法による計算結果と実際の開花日との間には、標準偏差で3日程度の
誤差がありました。

単に開花日の振れ幅をみると、標準偏差で6日を超えていましたので、前述の計算方法は
多少なりとも有効性が認められます。

ただ、まだまだサクラの開花条件に迫れていないのも事実です。

サクラの開花予想 2018 では、気温予測の改良と合わせて、サクラの開花条件に迫って
いこうと考えています。
 

サクラ開花予想2017の反省の通り、今回は休眠打破にも迫ってみたいと考えています。

因みに、休眠打破に迫るには、関東ならちょうど今頃の気温が鍵になると考えています。

 

詳細は、次回から少しずつ書いていこうと思います。



前回も述べたように、東京には150年近い気象データがあります。

つまり、最長150年周期の変化を炙り出せる可能性があります。


でも、もう少し考えておく必要があります。



炙り出す周期は、長周期と短周期のどちらを先に計算するべきでしょうか?

どう考えても、年較差は他よりも変化の幅(振幅)が大きいことは間違いありません。
となれば、周期の長短に関係なく、1年周期について計算すべきでしょう。
そして、データから1年周期の変動を取り除いた上で、他の周期を炙り出すようにします。

ですが、長周期と短周期のどちらを先に計算するべきか、結論は出ていません。
ここで考えるべきは、具体的なデータの扱いです。
2014年7月18日から今日(2017年10月29日)までの1200日分のデータがあるとします。
長周期の炙り出しを行う場合、この全てのデータを使用する事になります。
ですが、最短周期の炙り出しを行う場合、2017年6月2日から今日までのデータしか使いません。
なぜ、2017年6月1日以前のデータを使わないのか。

「サクラの開花予想 第29弾」でも書いているように、短周期のデータはデータの間隔が荒いために精度が低く、また何周期も繰り返していくうちに僅かな周期のズレでも大きなブレになってしまいます。
従って、短周期を炙り出しても、そのデータを基にして計算外の領域に展開することはできません。

なので、長周期から炙り出していくことにします。



計算の順序は、以下のようにします。

1.1年周期を計算し、1年周期の変動をデータから取り除く。
2.データの許す限り最長周期から計算し、その結果を基に変動分をデータから取り除く。
3.上記を繰り返しながら、最短周期の6日までを計算していく。


これでも、まだ問題が残っています。
それは次回に・・・

対象とする最短周期は6日。
それを基準に、計算に用いるデータは150日間程度と決めました。
でも、まだ問題があるのです。


150日のデータから炙り出す最長周期は、どうしましょうか。

データ期間を超える周期は、精度を落とす原因となります。

そうなると、150日を超える周期を炙り出すことはできないことになります。

予め周期が分かっている1年周期は計算できないこともありませんが、1周期の半分にも満たないデータ量で計算するので、計算精度は低下します。
150日を超える周期は、周期自体が不明なので、まともな計算は難しいと思います。


そこで、周期を倍々にしながら、より長い周期を炙り出すことにするつもりです。

具体的には、下記のようにします。
 データ量: 150日分   対象周期:  6~ 150日
 データ量: 300日分   対象周期: 12~ 300日
 データ量: 600日分   対象周期: 24~ 600日
 データ量:1200日分   対象周期: 48~1200日
 データ量:2400日分   対象周期: 96~2400日
 データ量:4800日分   対象周期:192~4800日
 データ量:9600日分   対象周期:384~9600日



サクラ開花予想は、今年も東京のみで行います。

東京は、150年近い気象データがあります。

後日、問題にするつもりですが、データ量が多いと計算が大変になるので、その辺りも考えなければなりません。

でも、その前に解決しなければならない問題が残っています。
次回は、そちらから解決していきます。

前回は、データが1日単位なので、1ラジアン=1日となる6日を最小周期として計算することを決めました。

単純に考えるなら、データが多くなれば精度が高まりそうですが、データは多ければ多いほど良いのでしょうか?

どうも、そう単純ではなさそうです。

気象の周期は、地球の自転や公転周期ほどは安定していないので、データが多いほど周期のブレの影響を受けやすくなると考えられます。

しかし、ブレを予測する方法を、私は持ち合わせていません。

私にできることは、ブレが結果に影響しないようにすることです。
そこで、ブレが周期の1%だと仮定し、累積誤差が4分の1波長を超えないように、データの最大量を制限することにします。

つまり、推定周期の25倍までのデータを基本として、周期を炙り出すことにします。

前述の最短周期の6日から、データは150日程度とします。



これで、また新たな問題に気付いてしまいました。
それは、次回に・・・ 

本日より、本格的にサクラの開花予想を再開します。


昨年は、一年周期の気温変化を三次式で近似する手法を用いていました。

これは、計算を容易に行うための手段でした。

しかし、変曲点に当たる5月上旬や11月上旬を境に、それより外側の時期は、
データとして取り込むことも、データから推測することも、理論的に不可能でした。

 

そこで、今年からは三次式をやめ、正弦曲線で近似するように変更します。

これにより、長期のデータから気温の周期変化を計算することが可能になります。

 

ただ、これだけで解決するわけではありません。

まず、周期の短い気温の変化を計算する際、誤差が出やすいのです。

世の中では、「三寒四温」が知られていますが、
実際に、1週間程度の周期で天気が変わる傾向があります。

「ここのところ、週末はいつも雨!」なんて経験もあると思います。


固定の周期としては、地球の自転による1日周期と、公転による1年周期がありますが、
1日周期はデータ量が増える割には天気の影響で崩れやすいので、私は使用していません。

そのため、1週間程度の周期を計算する際に、
約1ラジアン刻みの荒いデータで計算しなければなりません。

これが、1日周期のデータで炙り出せる下限になると思います。

今回は、1日≒1ラジアンとして、炙り出す周期の下限を6日とすることにします。



これだけでは、問題は解決しません。
むしろ、問題を増やす事になります。
解決には時間が掛かりそうなので、少しずつ紹介していくことにします。
 

↑このページのトップヘ