The DATA Web版 20140509 サッカーオンライン分析他

最初のリストの特別対談は凄い方々なのですが、内容がいまいちインパクトに欠けるというか、使い古されているというか、まああくまで印象論で恐縮ですがもっとディープな会話もしてほしいですね。

サッカーのオンラインデータ分析サービスはOPTAとの違いを明確にしないとだめなのではないでしょうか。これではせっかくの新規性がわからないですね、これは書いた方がもう少し調べるべきだったのではと思います。

本日は8件です。

 

特別対談 脳科学の視点で読み解くビッグデータの意外な構造 領域を超える発想で、より深い理解にたどり着く 【ヤフー株式会社CSO・安宅和人×琴坂将広】|領域を超える経営学|ダイヤモンド・オンライン http://diamond.jp/articles/-/51526

Clouderaで作るデータ分析環境 – 科学と非科学の迷宮 http://shiumachi.hatenablog.com/entry/2014/05/07/081657

ゼロから始めるDeepLearning_その1_ニューラルネットとは – 分からんこと多すぎ http://rishida.hatenablog.com/entry/2014/02/25/110643

ビッグデータサービス群のおさらい & AWS Data Pipeline http://www.slideshare.net/AmazonWebServicesJapan/aws-data-pipeline-32647719

伊サッカー界を変える25歳:提供するのは「オンラインデータ分析サーヴィス」 http://wired.jp/2014/05/06/project-calcio/

【書評】コンパクトな統計学史:『マンガ 統計学入門―学びたい人のための最短コース』 – Interdisciplinary http://d.hatena.ne.jp/ublftbo/20140505/p1

クラスター分析の手法1(概要)|分析力をコアとするマーケティングソリューションカンパニー・株式会社ALBERT(アルベルト) http://www.albert2005.co.jp/technology/mining/method3_1.html

installr パッケージで R のバージョンアップ – Data science & Software development http://hiratake55.hatenablog.com/entry/2014/05/05/183113

 

OPEN METIのサイトが凄い、ウィスキーのクラスタリング他

今回は個人的に気になる記事満載です。まずはウィスキーのクラスタリング、中身のテキストファイルを見てみましたがあまり変わったパラメーターはないようなのでまあ妥当なクラスタリングになるのでは、という印象でした。しかし興味深いのは確かです。

データヴィジュアライゼーションで2点、日本のOPEN METIでは日本初のオープンデータ活用を目論んだ経産省のサイトです。これはかなり気合い入ってます。すごいですよ。ちょっとしばらく見てみたいですね。間違いなくオススメです。でもすぐ公開中止になったサイトもありましたがここはそんなことはないですよね?ね?

次はSCOOP IT!のGEO VISUALIZATION,見ているだけで楽しくなるサイトでした。温度アノーマリーは興味深いです。

本日6点です。ENJOY!

 

Hierarchical Clustering of Whiskeyhttps://rpubs.com/seaneff/HierarchicalWhiskey

Rの中で環境を使い分ける – Qiita http://qiita.com/rai_suta/items/b24ec8e742c5b9e9d35e

複数のクラスタリング手法を組み合わせる – langstat blog http://langstat.hatenablog.com/entry/20140503/1399081962

インターネット広告の目標設定における統計学の活用例:ライフタイムバリュー(LTV)|インターネット広告代理店で働くデータサイエンティストのブログ http://ameblo.jp/cyberanalyst/entry-11819955628.html

OPEN METI http://openmeti.go.jp/

Geo-visualization | Scoop.it http://www.scoop.it/t/geo-visualization

The DATA Web版 20140507 数学記号まとめ,個人属性なしで解析他

数学記号リストは個別で自分も調べていますが、あるとやはり便利ですね。数理を理解するのは記号リストだけではだめですが、良い助けになります。

年齢や性別使わない顧客データ分析は他のデータで補間や推測ができるっちゃーできるかと。それでも個人情報云々叫ばれていますから方向性としては良いかと思われます。

本日は5件です。

 

バッチ処理とリアルタイム分析を融合する次世代ビッグデータ活用基盤とは - TechTargetジャパン データ分析 http://techtarget.itmedia.co.jp/tt/news/1403/11/news02.html

ニュース – 年齢や性別使わない顧客データ分析、東急エージェンシーと産総研:ITpro http://itpro.nikkeibp.co.jp/article/NEWS/20140502/554622/

統計学・機械学習でよく使われる数学記号リスト(主に自分用) – About connecting the dots. http://smrmkt.hatenablog.jp/entry/2014/05/01/112618

銀行 ビッグデータ活用の動き NHKニュース http://www3.nhk.or.jp/news/html/20140504/k10014217701000.html

Rで一行でディープラーニング – BOD http://d.hatena.ne.jp/dichika/20140503/p1

 

データサイエンティストと発達障害関連その2

昨日クローズアップ現代で統計学、ビッグデータ、データサイエンティストに関するテーマの番組が放映されていました。こちら

ノイズとシグナルの狭間で | クローズアップ現代 スタッフの部屋:NHK http://www.nhk.or.jp/gendai-blog/100/160827.html

ちょっと誇張していたのかな、と思います。なんでも魔法のように解決するかのような文言でしたが魔法ではなくてサイエンスですのである確率を持っています。また成果が出ないことも当然科学ですからありうるわけで、そのあたりの理解は必須です。

それともう一つ高機能自閉症スペクトラム(現在はアスペルガー症候群の名前から変わったらしい)に関する番組があさイチ!で去年放映されていたようです(知りませんでした)。この模様がYoutubeにアップされていますので御覧ください。1時間あるのでそれほど興味のある人ではない限りは、端折りながらでいいと思いますが。

統計解析に関する啓蒙サイト2つ

東京都のHP内にある”「小学生のための統計学習」まなぼう統計 ” です。

小学生向けの優しい解説であったり、自動販売機を何処に置くと最適化されるか、統計解析ポスターコンクール入賞者の発表があったりなどなかなか充実したウェブサイトです。是非お子様にも。と言うか子供の頃からこのような科学的に評価する、という行為は非常に重要であると考えています。是非親子でお試しください。オススメ!

「小学生のための統計学習」まなぼう統計
http://www.toukei.metro.tokyo.jp/manabou/syou/ma1204s001.htm

 

次はもう少し高学歴向けのウェブサイト。基本的な統計パラメーターの解説ですが、非常にわかりやすくなっています。静岡理工科大学総合情報学部人間情報デザイン学科・知能インタラクション研究室 金久保正明博士のウェブサイトで、高校~大学教養程度の数学の素養が求められます。

統計の基本事項
http://www.sist.ac.jp/~kanakubo/research/statistic/basic.html

暫く統計解析から遠ざかっていて思い出したい方などに最適です。

 

お薦め統計解析書 医学・生物学のためのデータ解析入門

ビッグデータ花盛りですが、一方で医学や生物学方面でもその大きな必要性から、パラメトリックな多変量解析、ノンパラメトリック手法であるロジスティック回帰分析や、コホート分析で重宝されるCox比例ハザードモデルなどが発展され続けてきました。

そんな医学、生物学関連の統計学ですが、難解な数式を使うことなしにストーリー性を持たせて理解を促したのがこの、

医学・生物学のためのデータ解析入門―統計学からわかる現代医療の問題点

 



という書籍です。無敵(と本書では述べているが、違うでしょ)とされるCox比例ハザードモデルまでの誘導が受け入れやすく書かれています。また統計解析における現代医療の問題点も、アカデミアの視点から中立的に書かれており、良書だと思います。少し統計解析を行ったことのある方は2,3日で読めると思います。初学者の人で全体像を簡単に知りたい方に最適です。是非お手にとって読んでみてください。