ビッグデータは「あなたに興味はない」、他記事紹介

Sparkの次はJubatusです。記事を2件ピックアップしてみました。情報処理学会デジタルプラクティス – 大規模リアルタイム解析エンジンJubatusの創り方:ITpro http://itpro.nikkeibp.co.jp/article/COLUMN/20140617/564701/ Jubatus Casual Talks #3 ビジネス応用編を開催しました | Jubatus Blog http://blog.jubat.us/2014/07/jubatus-casual-talks-3.html

 

それともう一つ「ビッグデータは「あなたに興味はない」」です。この表題のとおりです。データ分析者やマネジャーはそんな一人ひとりの人となりをいちいち見てはいません。それを見たところでどうにもなりませんし何百万人とあるマスタデータですからね。まあ悪意のある人に対する情報漏洩がまあ怖いわけですが。あとデータ分析では個人属性は除くと書いてありますが、それはないですね。ちゃんと個人属性入れないとキビシイのでは。 ビッグデータは「あなたに興味はない」–(1)匿名提供を考える – CNET Japan http://japan.cnet.com/news/business/35049896/

 

ほか、今回はトータル7件の記事を紹介します。

ビッグデータのリアルタイム分析に勝機を見出す、TSG1899ホッフェンハイムとドイツ代表チーム | 超リアルタイムビジネスが変える常識[SAPジャパン ブログ] http://www.sapjp.com/blog/archives/6932

ESJ57 シンポジウム S06-6 http://www.esj.ne.jp/meeting/i-abst/57/S06-6.html

【連載】なぜ進まない? ビッグデータ活用:第1回 現場を知るコンサルタントが伝授する、「データドリブンマーケティング実現のための4つのステップ」 (1/3) – ITmedia マーケティング http://marketing.itmedia.co.jp/mm/articles/1406/16/news018.html

R – Stan で相関係数を推定する – Qiita http://qiita.com/hoxo_m/items/0f1b05681f5d6c4b560a

 

MapReduceの100倍高速な”Spark”本格リリース、他

機能はCloud Dataflow: MapReduce後継の機能が続々と、などと紹介しましたが、Sparkも負けてはいません。Hadoopにおける処理方式の一つである「MapReduce」を用いた場合と比べて最大で100倍以上、分析処理を高速化できる…という謳い文句、まさに鳴り物入りでのリリースという群雄割拠状態であります。本日はSpark関連の記事を2本。

Java 8 & 機械学習の視点でみる Spark 1.0 リリース – ALBERT Engineering Blog http://tech.albert2005.co.jp/blog/2014/06/06/spark-1.0

News & Trend – 次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム:ITpro http://itpro.nikkeibp.co.jp/article/COLUMN/20140623/565972/

 

その他Hadoop関連記事など3本でトータル5本の記事を紹介します。

ビッグデータはビッグブラザーにはならない〜超管理社会のゆくえ(上) http://blogos.com/article/89164/

記者の眼 – 進化するHadoop、戸惑うユーザー:ITpro http://itpro.nikkeibp.co.jp/article/Watcher/20140623/565942/

逆変換法 – 人工知能に関する断創録 http://aidiary.hatenablog.com/entry/20140622/1403403301

 

 

The DATA Web版 20140626 プロチームにもデータサイエンティスト

巷はワールドカップで盛り上がってますが(日本は勝利がないのでいまいちですが…)スポーツのデータサイエンスに関する記事が多い印象です。MLB, NBAなどのスポーツデータに関する紹介ですが、もう少し詳しい説明がほしいところ。記事中にもありますが意思決定者になかなか伝わらないのはデータを扱う人たちにとっては宿命のようなものです。如何に良い具体例が示されるかが肝要なのではないでしょうか。 野球、バスケチームがデータサイエンティスト確保へ――スポーツデータ分析最前線 - TechTargetジャパン データ分析 http://techtarget.itmedia.co.jp/tt/news/1404/18/news04.html

W杯の試合分析データは、こうしてつくられる:イタリアの統計分析企業 « WIRED.jp http://wired.jp/2014/06/21/fifa-statistics/

 

ほか合計5件です。

ビッグデータ活用で「バンキング2.0」を掲げるスコットランド銀行 - TechTargetジャパン データ分析 http://techtarget.itmedia.co.jp/tt/news/1406/11/news01.html

ビッグデータに対する10の幻想–適切な取り組みなくして実現せず http://japan.zdnet.com/cio/sp/35049490/

団地再生にオープンデータ生かす NHKニュース http://www3.nhk.or.jp/news/html/20140621/t10015404151000.html

 

The DATA Web版 20140625 World Cup予選決勝予想,Twitterで株価予想

少し前に発表されたこの記事ですが、現在の結果も含めて更新されています。懸賞もやって欲しいところですね。FiveThirtyEightなら多分そのうち出るでしょう。 FiveThirtyEight’s World Cup Predictions | FiveThirtyEight http://fivethirtyeight.com/interactives/world-cup/

ほか、本日合計4件です。

チェビシェフの不等式について発表しました – ほくそ笑む http://d.hatena.ne.jp/hoxo_m/20140616/p1

生存戦略としてITエンジニアが35歳までに考えておくべき3つの事 – paiza開発日誌 http://paiza.hatenablog.com/entry/2014/06/17/%E7%94%9F%E5%AD%98%E6%88%A6%E7%95%A5%E3%81%A8%E3%81%97%E3%81%A6IT%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%8B%E3%82%A2%E3%81%8C35%E6%AD%B3%E3%81%BE%E3%81%A7%E3%81%AB%E8%80%83%E3%81%88%E3%81%A6%E3%81%8A%E3%81%8F

株価予想もビッグデータで Twitter分析、市場の“ムード”予測 (1/3) – ITmedia ニュース http://www.itmedia.co.jp/news/articles/1406/13/news046.html

 

The DATA Web版 20140623 ナイトライダーが現実に

アクセスログ解析ではどのようなものを扱えばよいかはゴールとなる目的変数にもよりますが、ではそのプロセスをどのように設定すればよいかはわかりづらいところでもあるかと思います。このサイトではあくまで一企業の広告なのですが、上記解決を示唆するものであることを考えると、有用なものと言えそうです。 トレジャーデータ事例集 3.「ECログ分析」 – トレジャーデータ(Treasure Data)公式ブログ http://treasure-data.hateblo.jp/entry/2014/06/18/165538

昔ナイトライダーというアメリカの人気テレビ番組がありました。主人公のマイケル・ナイトと人工知能を有したKITと呼ばれる自動運転をする車で世の悪と戦うものです。これが今まさに実現するかもしれません。自動運転はまもなく実現しようとしています(さすがにターボブースト(ジャンプ)は厳しそうですが)。またロボット技術でも会話可能なものが実現目前です。そんな車に関する記事です。 車のビッグデータ 2020年までに実用化 NHKニュース http://www3.nhk.or.jp/news/html/20140618/k10015301291000.html

ほか、本日4件です。

クリーンエネルギーの安定供給を支えるビッグデータ分析の舞台裏 - TechTargetジャパン ホワイトペーパー ダウンロードセンター http://wp.techtarget.itmedia.co.jp/contents/?cid=14467&spath=1

データサイエンスをビジネスに生かす際の盲点とは? ガートナー リサーチ リサ・カート氏が解説(1/3):企業のIT・経営・ビジネスをつなぐ情報サイト EnterpriseZine (EZ) http://enterprisezine.jp/iti/detail/5939

 

The DATA Web版 20140618 データ解析で割安賃貸物件探索他

やはり今回のヒットはこれでしょう。RStanによる線形重回帰ですね、その解析結果です。スペースがピリオドに変換されている変数が特徴的ですw。このようにすればお得物件が一目瞭然なわけですが、まあ住みたい土地、条件は人によって異なるので最低条件を加味した上でお得物件を探すのが良い方法と言えるのではないでしょうか。 データ解析で割安賃貸物件を探せ!(山手線沿線編) http://heartruptcy.blog.fc2.com/blog-entry-153.html

今回はトータルで6件の記事を紹介いたします。

The History of the World Cup in 20 Charts | FiveThirtyEight http://fivethirtyeight.com/features/the-history-of-the-world-cup-in-20-charts/

情報処理学会デジタルプラクティス – 楽天におけるビッグデータとその収集・解析基盤の構築:ITpro http://itpro.nikkeibp.co.jp/article/COLUMN/20140404/548423/

ニュース – IoT分野でのビッグデータ活用促す、米トレジャーデータが事業戦略を発表:ITpro http://itpro.nikkeibp.co.jp/article/NEWS/20140612/563623/

個別の顧客に最適化したマーケティングを実現、日本オラクルが支援ツールを提供 - TechTargetジャパン データ分析 http://techtarget.itmedia.co.jp/tt/news/1406/10/news06.html

ヤフーやEMCも注目、「医療ビッグデータ」がビジネスになる – 「人体こそが最大のビッグデータ」、ストレー…:ITpro http://itpro.nikkeibp.co.jp/article/COLUMN/20140602/560999/

 

The DATA Web版 20140616 アクセス解析,R入門講座他

Rをインストールしたけど何から手をつけたら良いのかわからない、という初心者の方はオススメです。 Rで本格的に分析を始める前に「必ず」確認しておきたいこと【R入門講座】 (1/4):MarkeZine(マーケジン) http://markezine.jp/article/detail/20069

結局何が好きになるとか嫌いとかは実生活にどれだけ体験として落とし込めるかがキモの一つと考えます。ただあくまで要因の一つであり、嫌いな人は嫌いのまま、それで良いのだと思いますが。 「生活の科学」としての数学教育で、論理的思考力とコミュニケーション力を育成 和洋国府台女子中学校・高等学校 数学科  室岡正義|Education DIAMOND スペシャルインタビュー|ダイヤモンド・オンライン http://diamond.jp/articles/-/53502

これはわかりやすいですね。オススメです。このストリームレポートはどのように出すのでしょうか?どなたか教えてもらえますか? 【セミナーレポート】gloops山本氏がソーシャルゲームにおける大規模データの分析手法と活用手法を紹介…要諦はわかりやすく表現し改善に活かすこと | Social Game Info http://gamebiz.jp/?p=131227

ゼロから学ぶにはオススメです。 アクセス解析の完全な初心者です。何からやるべきですか? | Web担当者Forum http://web-tan.forum.impressrd.jp/e/2014/06/09/17601

 

他、ホワイトペーパー記事など全部で9件です。

 

アナリティクスは“デジタルホウキの悪夢”を見るか–ビッグデータの3つの論点 – ZDNet Japan http://japan.zdnet.com/cio/sp_13dataeverywhere/35049087/

【ベイズ推定WS】 MCMCでマルチレベルモデル | Sunny side up! http://norimune.net/2050

【セミナーレポート】gloops山本氏がソーシャルゲームにおける大規模データの分析手法と活用手法を紹介…要諦はわかりやすく表現し改善に活かすこと | Social Game Info http://gamebiz.jp/?p=131227

ホワイトペーパー:事例に学ぶ、ビッグデータ活用に向けたデータ統合のアプローチ – ITmedia エンタープライズ http://www.itmedia.co.jp/enterprise/articles/1406/12/news040.html

ホワイトペーパー:ビッグデータインフラに関する読者調査(2013年11月) – ITmedia エンタープライズ http://www.itmedia.co.jp/enterprise/articles/1406/13/news005.html