スマホでもRで統計解析

こんなのが出ています。

RConsole RconsoleAndroidiphone, android 端末両方でFree, Premiumバージョンが有ります。Premiumバージョンの方は広告が出ないバージョンでそれ以外の機能の差はありません。ので、広告が気にならない方はFreeバージョンでも問題ないでしょう。スマホでもRですか、しかも無料です。

パッケージはプレインストールされているものだけで新たなパッケージはインストール不可となっています。が、とりあえずglmとか時系列とかクラスタリングはできそうですし生存時間分析も入っていますのであらかた出来るんじゃないでしょうか。グラフ昨日はナシ、Stanとかjags, bugsは無理です。あまり多くを求めてはいけません。

 

まあいずれにしてもスクリプトも書けそうですし統計解析もできる高機能な関数電卓と思っていればなかなか使えるんじゃないでしょうかね。Bon appétit!

 

一家に一台Hadoopでビッグデータ解析のススメ

タイトル少し盛ってます。そんなには必要ないですが…。

大規模データの分散処理を支えるJavaソフトウェアフレームワークであり、フリーソフトウェアとして配布されているHadoop分散ファイルシステムは、アメリカYahoo、IBM、Apacheなどがディストリビュートしています。中でもClouderaディストリビューションのパッケージが豊富で汎用性の高いものになっています。

Windowsネイティブでも出始めたようですが、やはりLinuxが最も汎用性が高いです。Windows + Cygwin (Windows上でUnix環境が試せる)という選択肢もなくはないですが、Hiveが使えない(はず、シッタカだったら指摘してください)のでちょっとおすすめできないです。

Windowsで行う場合は、VM(ヴァーチャルマシン)を走らせた上でCentOS(Linux各種、Ubuntu, DebianでもOK)をインストールし、そこにCloudera社のCDH(Hadoop)パッケージなどをインストールするのが現状としてベストと思います。64ビットマシンならばVMバージョンがそのまま使えたり、Cloudera Standardなどオールインワン的な簡単にインストールできるものもありますので、環境が揃っている人は是非試してみてください。CDHはバージョンが4.3、一昔前よりインストールや設定が楽になっています。余って転がっている古いXPマシン等がご家庭にあればLinuxマシンにして練習用にしても良いかもしれません。Linuxの良い勉強になるかと思います。

要求される知識としてはRDBMS、Java、Unixなどの知識が必要でしょうか(取り敢えず一通りか)。広く浅くでもなんとかなるかどうか…やる気次第かと(自戒)。

インストール方法などのおすすめサイトはまた次の機会にでも紹介したいと思いますので乞うご期待。