機械学習とgraphに関するblueribbonのブックマーク (2)
-
データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう! ビッグデータ、データサイエンス、人工知能など、統計学を主軸においた分野が隆盛ですが、統計学には高いハードルを感じる方も少なくないでしょう。k平均法を実際に手を動かしながら理解することで、データ分析を身近に感じることができます。 はじめまして、藤井健人︵@studies︶と申します。イタンジ株式会社でデータ基盤周りの運用を担当しています。 ﹁ビッグデータ﹂﹁データサイエンス﹂﹁人工知能﹂といったバズワードに代表されるように、統計学を主軸においた分野の隆盛が日常となって久しいです。 しかし﹁統計学は学問的な要素があり難しい﹂という印象を持たれやすく、﹁実務に活かすのはハードルが高い、怖い﹂と感じる方も少なくないのではないでしょうか。 そういった方を対象に、今回は統計学の手法の一つであるk平均法を学んでいただ
-
さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub︵https://github.com/ShoKosaka/Suumo︶に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを
-
1