[B! statistics] river2470のブックマーク

river2470 id:river2470

statisticsに関するriver2470のブックマーク (4)

東京大学出版会『統計学入門』は入門を一通り終えた人におすすめ｜Colorless Green Ideas
東京大学出版会から出ている﹃基礎統計学I統計学入門﹄という本がある。東京大学教養学部統計学教室︹編︺ (1991). ﹃基礎統計学I統計学入門﹄東京‥東京大学出版会．この本は、統計を学ぶ際によくすすめられる一冊である。例えば、ウェブ上にある記事で、﹃統計学入門﹄を挙げているものに以下のようなものがある。 2014年春版‥ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊︵銀座で働くData Scientistのブログ︶一年で身に付ける！Rと統計学・機械学習の4ステップ︵iAnalysis ～おとうさんの解析日記～︶統計分析を学ぶための書籍20選︵XICA-Labs データ・統計分析研究所︶それでは、なぜこの本はすすめられるのだろうか？そして、どういう人がこの本を読むべきなのだろうか？タイトルに﹃統計学入門﹄とあるように、統計の初心者にとって良い本なのだろう
river2470 2014/12/31
statistics

study

book
リンク
バイオ系研究室PC管理担当のメモ
バイオ系研究室PC管理担当のメモ
river2470 2014/06/30
statistics

study
リンク
高次元データの外れ値検出 - sfchaos's blog
高次元データの外れ値検出についてのメモ．高次元データと次元の呪い次元が大きくなるほど，点の間の距離は均一になっていく．例として，2000個の点の各座標を一様乱数で発生させて，次元を変えながら点の間の距離の平均値，最大値，最小値，平均値±1σ，平均値±2σをみてみよう． library(ggplot2) set.seed(123) # 次元のリスト dims <- c(1:9, 10*(1:9), 100*(1:10)) # 算出する統計量 stats <- c("min", "mean-sd", "mean", "mean+sd", "max") # 発生させる点の個数 N <- 2000 # 各次元に対して算出した統計量を格納する行列 ans <- matrix(NA, length(dims), length(stats), dimnames=list(dims, stats))
river2470 2014/05/19
data

statistics

bigdata
リンク
データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
river2470 2014/04/16
datamining

statistics
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx