ビジネスにおいてデータを活用するプロセスは、以下の3段階で行われると考えられる。 (1)データ収集 (2)アナリティクス:データの分析による仮説の検証や新たな知見の創出 (3)価値創出:獲得した知見に基づく事業の最適化や新規サービスの創出 現在ビッグデータが注目されている理由は、このうち最初のデータ収集の段階において、データの量が増大したこと、データの蓄積速度が向上したこと、データのソースや種類の多様性が上がったことが要因と言われている。 しかし、データの量がいくら増えても、2段階目のアナリティクス、すなわちデータの背後に潜むパターンを見出す能力が低ければ、データの量を質へと転化し、3段階目の価値の創出につなげることは出来ないことは言うまでもない。 そのアナリティクスの分野で、2012年、大きなブレークスルーとなったディープラーニング(深層学習、Deep Learning)という技術がある
ITエンジニアがデータサイエンティストを目指すには?:ITエンジニアのためのデータサイエンティスト養成講座(1)(1/2 ページ) それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。 連載バックナンバー はじめに:分析スキルの課題をどう乗り越えるべき? 昨今では、IT系のメディアのみならず一般雑誌や新聞なども“ビッグデータ”というキーワードを見出しに使っています。この文字を目にしない日がないくらいに多用されていて“バズワード”としてとらえられるケースも少なからずあるようです。 しかし、世界の至る所で――もちろん日本でも、ビッグデータを分析することで新たな知見を見つけて利益を増大した企業や、顧客の購買行動を予測するこ
前編の「開発者編」では、Apache Hadoop(以降Hadoop)の歴史と概要に加え、開発者に必要な知識を客観的に証明できる認定資格、CCDH(Cloudera Certified Developer for Apache Hadoop)を紹介しました。後編では、Hadoopの管理者に求められる知識に加え、Hadoopの管理者向け認定資格、また最近のHadoop関連の話題とカラム指向分散データベースであるApache HBaseの紹介、およびHBaseの認定資格を紹介します。 Hadoopの管理者に求められるもの 前編で紹介したように、Hadoopでは一台から数千台規模のクラスタを構築することが可能であり、必要に応じてスケールアウトさせることができます。Hadoopは非常に強力ですが、管理するのはそれほど簡単ではありません。言い換えると、正しい知識を持たずに運用すると、大きなトラブルが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く