![【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート](https://cdn-ak-scissors.b.st-hatena.com/image/square/6fc77629472f0ed40cf9d3ed2d5387137c85c188/height=288;version=1;width=512/https%3A%2F%2Fmath.nakaken88.com%2Fimg%2Fglobal%2Fmath.png)
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
赤ちゃんに保湿剤を塗るとアトピー性皮膚炎が減るらしい。 赤ちゃんに毎日保湿剤 アトピー減 生後まもない赤ちゃんの皮膚に保湿剤を毎日塗ると、アトピー性皮膚炎になるリスクを30%減らすことができたとする研究成果を、国立成育医療研究センターのグループが発表しました。 特定の方法にアトピー性皮膚炎の予防効果があると証明できたのは、これが初めてだということです。 この研究を行ったのは、国立成育医療研究センターの斎藤博久副研究所長らのグループです。 グループでは、アトピー性皮膚炎になった家族が1人以上いる、生後まもない赤ちゃん118人を無作為に半分に分けました。 そして、一方のグループの赤ちゃんには、一般の薬局などで売られている保湿剤を毎日、全身に塗り、もう一方のグループでは皮膚の乾燥している部分にのみワセリンを塗りました。 そして8か月後に調べたところ、保湿剤を塗った赤ちゃんのグループでは19人がア
各章のサブタイトルがアニメや時事ネタのパロディーになっていると話題の『実証分析入門 データから「因果関係」を読み解く作法』だが、法学セミナー連載「法律家のための実証分析入門」をまとめたもので、連載時の原稿が著者の森田果氏のページに微妙な形(dvi形式)で公開されていたので幾つかの章を拝読してみた。面白いし、ミクロ計量分析の常識が身につきそうで、分野外の人や学部生が読むと丁度よさそうな感じになっている。 常識と言うのは、専門用語と分析上の注意点のことだ。ミクロ計量分析をする人々は専門用語をそうではないように気軽に使うし、分析上の注意点も大雑把には共有している。この共有レベルが高いので、計量分析者の中には「クロスセクションではなくパネルでやってみたら・・・」「弱相関テストの結果・・・」「同時性が考えられるため・・・」のような事を、一般人にも容赦なく言うコミュニケーション障害者がよく稀に存在する
元官僚の高橋洋一氏が時系列データの相関係数が高い事を論拠にしているが、この論証方法は全くもって厳密ではない。 計量経済学では時系列データの相関係数はあてにならない事は80年代から良く知られており、これに関連した業績でエングルとグレンジャーは、2003年にノーベル経済学賞を受賞している。 高橋氏のトリックを説明したい。世の中には時間とともに変化していくトレンド*1と言うのが多くある。このトレンドがあるデータを二つ比較すると、どちらも時間に対して相関しているため、相関があるように見えてしまう。 例えば戦後、一人あたりの米の消費量は減少し、コンピューターの普及台数は飛躍的に伸びたが、この二つの現象を結びつけて考える人はいない。しかし、米の消費量とコンピューターの普及台数は、高い相関を持つ事になる。 実データの場合は屁理屈をつける事も可能かも知れないので、シミュレーションして確かめてみよう。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く