タグ

DataとKnowledgeに関するkohkumaのブックマーク (4)

  • 「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに


    67Twitterinuronote64AI使  2A132A12342222 
    「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
    kohkuma
    kohkuma 2024/04/24
    “「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっ…”
  • とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro

    「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが(2023年6月6日)、この手の騒動は周期的に起こってる印象です。 ということはつまり いつまで経っても解消されない、解決が困難な課題である その困難さが界隈以外に共有されていない であるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。 なおこの件については既にQiitaにGeoloniaの宮内さんが鼻血の出そうな良エン

    とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro
    kohkuma
    kohkuma 2023/11/13
    “「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や…”
  • 逗子駅での客待ちタクシーの意外なデータ構造 ~年月が磨くデータ形式


    OS         
    逗子駅での客待ちタクシーの意外なデータ構造 ~年月が磨くデータ形式
    kohkuma
    kohkuma 2020/03/24
    “OSやアルゴリズムの授業で必ず学習する「データの構造」や「データの編成方式」。今回は、実社会で自然発生的に、経験的に出来上がったデータ構造を考えます。意外にスゴイことをやっています。”
  • 銀座線や井の頭線…「稼げる路線」の共通点

    これらの路線を同じ尺度で比べることは難しいが、輸送規模の面では旅客または貨物の「平均通過数量」が役に立つ。平均通過数量とは、旅客人キロまたは貨物トンキロを年間の営業キロで除して求めた数値を指し、輸送密度ともいう。 路線ごとの収支を比較するには営業係数が向く。100円の収入を得るに当たって何円の費用を要するかという営業係数は売上高営業利益率の逆数ともいえ、鉄道業界ではこちらの数値が一般的だ。 営業係数で知る路線の特徴 多くの路線で平均通過数量は明らかにされているものの、営業係数は鉄道事業者または軌道経営者に一つの路線しか存在しない場合を除いてほぼ明らかにされていない。それでも、大手私鉄や地下鉄などでは路線ごとの収入が公表されるケースが多く、あとは路線ごとの費用がわかれば求められる。 収入、費用を推測する手段として挙げられるのは、営業キロや旅客人キロの比率に基づいた配分法だ。基的な考えとして

    銀座線や井の頭線…「稼げる路線」の共通点
    kohkuma
    kohkuma 2018/05/20
     2017331763JR267JR496JR496  



    Railway

    Knowledge



    Ranking

    Data
     
  • 1