2022年8月28日に実施された統計思考院 オンラインワークショップ「探索的ビッグデータ解析と再現可能研究」https://sites.google.com/view/ws-ebda-rr-2022/ の発表資料です。 スライドの中のRコードは https://github.com/uribo/220828ism_ws にあげています。
![Rによるデータ可視化と地図表現](https://cdn-ak-scissors.b.st-hatena.com/image/square/f0afb7ceb838a591ca5c9e27904cac9029cfda01/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2Fdedef953150148ecaae7e7c2a493529b%2Fslide_0.jpg%3F22471815)
前回(Rで緯度経度から都道府県を求める - Qiita)のやり方でも行政区域まで10ms程度で検索できるが、たくさん検索したかったのでRcppで高速化を試みた。結果は 前回のやり方の概要 行政区域のセントロイドと目標座標の間の距離を求めておいて、最も距離の短かった行政区域の情報を参照する。 library(sf) # 日本地図のシェープファイルを読み込む f <- "data_source/N03-160101_GML/N03-16_160101.shp" japan <- st_read(f) jpn_cent <- st_centroid(japan) # セントロイド計算 cent_mat <- t(matrix(unlist(jpn_cent$geometry), nrow=2)) # 地点をmatrixに find_admin_old <- function(point){ #
shapefileを入手する 以下のような場所からライセンス的にも使い勝手の良いシェープファイルが入手できる。 国土数値情報 行政区域データの詳細 政府統計の総合窓口 「地図で見る > 境界データダウンロード」から検索してダウンロード 例では「境界データ > 小地域 > 国勢調査 > 2015年 > 小地域(町丁・字等別) > 世界測地系緯度経度・Shape形式 > 新潟県」と辿ってダウンロードしたファイルを使用している。 今回はe-statのものを利用した。以下では、シェープファイルがshpディレクトリ以下に展開してあることを想定している。 必要パッケージ sfと開発版のggplot2を使う。ggplot2開発版にはsfオブジェクトのためのgeom_sf等が入っている。
文字のインプットに対して、緯度経度のデータを取得する方法の一つで、自分が普段使う方法を記録しておきます。 自分が用いいるのは、CRANにも上がっていて、使い方が非常に簡単な、ggmapパッケージです。 ggmap公式ドキュメント ggmap開発(GitHub)ページ セッティング # install.packages("ggmap") # まだインストールしていない人用に # devtools::install_github("dkahle/ggmap") #開発版をインストールしたい場合 library(ggmap) register_google("XXXXXXXXXXXXXXXXXXXXXXXXXXX") # 個人で取得したgoogle apiの登録が必要 これで設定が完了。 住所より緯度経度を取る方法 ggmapパッケージではgeocode()という関数が提供されており、第一引数の
目的 地点から半径Xmのバッファー作って、それでラスタを切り抜く。(バッファーが丸くなくてもできるよ) 環境 R version 3.6以上 手順 国土数値情報の土地利用細分メッシュ(ラスタ版)の"L03-b-14_5339"を使ってやってみました。 1.バッファーをつくる library(sf) library(dplyr) library(raster) #地点の緯度経度(ここでは座標参照系JSD2000) p0=c(139.25,35.75) #平面直角座標系に再投影(epsg:4126→3100) p1=st_point(p0) %>% st_sfc() %>% st_set_crs(4126) %>% st_transform(3100) #地点p1を中心に半径1000mのバッファーを作成して、座標系をp1と同じに設定。 buf0=st_buffer(p1,dist=1000,e
はじめに この記事は R Advent Calendar 2021の20日目の記事です。 よろしくお願いします。 概要 今回の記事はR Advent Calendar 2021 3日目の記事である都道府県の人口密度と相関が高いコンビニはどこだ!!!(R言語、無相関検定)の派生です。 前回はコンビニ各社の中で人口密度を相関の高いコンビニを見つけましたが、今回は各コンビニの店舗数から都道府県を分類するクラスター分析を行います。 クラスター分析とは クラスター分析(cluster analysis)とは、「類似のデータをいくつかのグループに分類する」多変量解析です。クラスター分析でデータを分類する難易度は、明確な分類基準の有無に依存します。 クラスター分析では、分類基準となる変数の数値(今回はコンビニ店舗数)を用いて、各都道府県が「どの程度似ているか」という類似度(similarity)または、
動機 太平洋に関するデータをプロットする機会があったのですが、Rを用いてggplotで普通にプロットをすると常にグリニッジ中心の地図がプロットされてしまいます。東経(西経)180度をまたがない地図なら普通にプロットできるのですが、跨いだ途端に扱いが厄介になるので困っていました。 ちなみにPythonとMatplotlibでは、 import matplotlib.pyplot as plt import cartopy.crs as ccrs projection = ccrs.PlateCarree(central_longitude = 180) ax = plt.axes(projection = projection) ax.set_extent((-100, 100, 0, 70))
気象庁では概ね最大震度5弱以上の地震が発生すると震度観測と地盤状況などを考慮した推計震度分布を約1km格子で発表しています。 その推計震度分布をWebブラウザで表示したいので、比較的簡単にできるGeoJSONで出力したいと思います。 入手 推計震度分布の生データは普通無料では手に入りません。 素直にJMBSCから入手するか気象情報会社、持っている人に頼んで手に入れましょう。 仕様 推計震度分布はWMO(世界気象機関)によって仕様化されたBUFR形式をもとに作成されています。 バイナリデータなので、人では読めません。 詳しい仕様は気象庁が公開しているPDFをご覧下さい。 https://www.data.jma.go.jp/suishin/shiyou/pdf/no40102 電文の分割 推計震度分布で使われている仕様(一昔前)では1つの電文につき15KiB以下しか送信できません。 広い範囲
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く