ドコモの気象データから鉄道の遅れを予測する(コンペ、賞金あり)

データサイエンスラボさんより賞金付きのコンペが発表されました。

・コンペ名:気象データによる鉄道支障予測
・期間:2014/06/20~2014/08/31
・懸賞総金額:¥350000
・スポンサー:株式会社 NTTドコモ
https://datasciencelab.jp/compe/2

予測スコアで競うものですが、ZIPファイルを展開させると1GB以上あるものもあり、データ処理に工夫が必要です。そのままHadoopやMahoutに流しこむのもよし、環境が整っていないならランダムサンプリングをするのもよし、といった感じでしょうか?

データの中身は詳しくは見ていないのですが欠損データなどもあるはずです。その場合はどう穴埋めするか、どの変数が使えそうか等々。

分析手法は?オーバーフィッティング覚悟でランダムフォレスト?それともSVMで汎化?はたまたロジスティック回帰?状態空間モデル?この辺りもキモになってきそうです。

期間も2ヶ月ほどなので時間ができたら集中してやってみるのも良いかもしれません。

Stellariumの星雲星団の写真を増やす方法その1

さていつも大変お世話になっているオープンソースのステラリウムですが、メシエ天体などを拡大するとその本体がクローズアップされて閲覧ができます。それらはPNG写真ファイルとリストのjson, その他の設定ファイルから構成されているのですが、こちらからバージョンアップができますので参考まで。

http://stellarium.org/wiki/index.php/Nebula_images のページにある modified and additional textures for version 0.10.6.1のリンクをクリックする。

hpNebulaImages
このHPの文章の最初、 modified and additional textures for version 0.10.6.1 をクリック。

ZIPファイルでダウンロードが始まり、解凍ソフトがお手持ちのPCにある場合は自動解凍します。

それをC:\Program Files\Stellarium\nebulae\default の中の写真ファイルを破棄してダウンロードした写真ファイルとその他ファイルをそのまま置換します(お手持ちのPCのスペックによりフォルダが異なる場合がありますが、取り敢えずプログラムファイル中のdefaultフォルダを目指してください)。

サムネイルから綺麗です。
サムネイルから綺麗です。

 

ステラリウムを起動。無事にこれまでなかったNGC55などの天体が表示されます。

NGC55。従来のデフォルトフォルダは拡大しても何も得られませんでした。
NGC55。従来のデフォルトフォルダは拡大しても何も得られませんでした。

ということでお試しあれ。マニュアルで増やすにはファイル設定とそれに対応した天体のPNGファイルが必要かと思われます。