Apache / Giraph / Welcome To Apache Giraph! Last Published: 2020-08-11 | Version: 1.4.0-SNAPSHOT Welcome to Apache Giraph! Apache Giraph is an iterative graph processing system built for high scalability. For example, it is currently used at Facebook to analyze the social graph formed by users and their connections. Giraph originated as the open-source counterpart to Pregel, the graph processing a
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
COMPUTER scientists have long tried to foist order on the explosion of data that is the internet. One obvious way is to group information by topic, but tagging it all comprehensively by hand is impossible. David Blei, of Princeton University, has therefore been trying to teach machines to do the job. He starts with defining topics as sets of words that tend to crop up in the same document. For exa
人工知能学会 データマイニングと統計数理研究会 (SIG-DMSM) 討論会「データ分析からうまれる、広がる研究と交友の輪」 「データに関わる人たちのすれちがい」神嶌 敏弘 (産業技術総合研究所) 発表資料のダウンロード 手法を作る人の間のすれちがい 機械学習(有用性)統計(妥当性)データベース(効率性)をそれぞれ重視 実用的なデータ解析にはどれも重要な要素なので,あまり一つの要因にはこだわりすぎない 手法を作る人と使う人のすれちがい データ分析のときに何を重視するか? 作る人:分析手法に思い入れがあるので,解析手法が正しく使われ,結果が妥当であることを重視 使う人:データに思い入れがあるので,データから期待した結果がでることを重視 データ分析はデータのモデリング次第で結果が変わる 「あるモデルという見方の下では,こういうことがいえる」ということしか帰納的にはいえない 作る人:そん
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く