![](https://cdn-ak-scissors.b.st-hatena.com/image/square/04ee38d9c4bf7887813a1c15863e4c79f0cc180a/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUU2JTk3JUE1JUU2JTlDJUFDJUUzJTgxJUFFJUU0JUJEJThGJUU2JTg5JTgwJUUzJTgxJUFFJUU2JUFEJUEzJUU4JUE2JThGJUU1JThDJTk2JUUzJTgxJUFCJUU2JTlDJUFDJUU2JUIwJTk3JUUzJTgxJUE3JUU1JThGJTk2JUUzJTgyJThBJUU3JUI1JTg0JUUzJTgyJTkzJUUzJTgxJUE3JUUzJTgxJUJGJUUzJTgxJTlGJUUzJTgyJTg5JUU1JUE0JUE3JUU1JUE0JTg5JUUzJTgxJTk5JUUzJTgxJThFJUUzJTgxJUE2JUU5JUJDJUJCJUU4JUExJTgwJUUzJTgxJThDJUU1JTg3JUJBJUUzJTgxJTlGJUUzJTgwJTgyJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz0xMmE3NDk3ZTYwMWEwZDUwNzQwMGM1MWZlOGFiMjI1ZA%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBtaXlhMDAwMSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YzEwNTBiMTJkMzIzZjA3ZWM1ZjVmMjUxOWRiOTY2ODM%26blend-x%3D142%26blend-y%3D436%26blend-mode%3Dnormal%26txt64%3DaW4gR2VvbG9uaWE%26txt-width%3D770%26txt-clip%3Dend%252Cellipsis%26txt-color%3D%2523212121%26txt-font%3DHiragino%2520Sans%2520W6%26txt-size%3D36%26txt-x%3D156%26txt-y%3D536%26s%3Dcc2c3a398dc57a380c0d6f2dc75e4135)
エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント179件
- 注目コメント
- 新着コメント
![IthacaChasma IthacaChasma](https://cdn.profile-image.st-hatena.com/users/IthacaChasma/profile.png)
IthacaChasma
顧客データベース管理やってたことあるから激しく頷きながら読んだ。長野県の郡部は漢字列のどこが切れ目か分かりにくかったな。なおgoo地図が案外頑張ってて参考になった思い出(GoogleMapは不明部分の切り捨てが多い)
![sisya sisya](https://cdn.profile-image.st-hatena.com/users/sisya/profile.png)
sisya
京都の住所は、例え正しくは「上ル」だとしても、北の道名から「下ル」と書いても届き、同様に東西の道から「東入ル」「西入ル」と書いても届くので、非正規に4つ住所を使える。多分記事中の正規化では捕捉できない
![lorenz_sys lorenz_sys](https://cdn.profile-image.st-hatena.com/users/lorenz_sys/profile.png)
lorenz_sys
大阪は魔窟「大阪市中央区久太郎町4丁目渡辺」「大阪市鶴見区諸口5丁目浜6」(渡辺・浜6が番に相当)なんてのもある。岩手県の地割や北海道の線とか詳しくなればなるほど悲壮感が増す。IMIの住所変換コンポはどう?
![vamview vamview](https://cdn.profile-image.st-hatena.com/users/vamview/profile.png)
vamview
やめいやめい、住所は今も常に変わりよるんやぞ。書き方もローカルルール多すぎるし、随時メンテされるマスタと連動しないと無理無理。ただこれできないと完璧なカスタマバーコードとか出せないのよね
![YassLab YassLab](https://cdn.profile-image.st-hatena.com/users/YassLab/profile.png)
YassLab
“「通り名」で区別してる問題はやはりラスボスになるかもですね。すべての Issue を完全に解決することはできないかもですが、積み重ねて徐々に育てていけるとは思います。 ほんとうにありがとうございます!”
![BUNTEN BUNTEN](https://cdn.profile-image.st-hatena.com/users/BUNTEN/profile.png)
BUNTEN
普通は何々県蟹可児郡何とか町中田1難癖団地1-23-45あたりの表記になると思うが、うちの団地は郡内の町名の直後に○○団地×番△号。おかげで某フォーマットに正しく入力できずに苦労したことが。
![akymrk akymrk](https://cdn.profile-image.st-hatena.com/users/akymrk/profile.png)
akymrk
“特に 丁目 がやばい。 一番大きい 丁目 は 万丁目”"大阪市中央区上町は 丁目 のかわりに A番 とかはいる""堺市は 丁目 じゃなくて 丁 ですから!""「八幡平市大更第35地割62番地」とか「東京都青ヶ島無番地」"
![nankichi nankichi](https://cdn.profile-image.st-hatena.com/users/nankichi/profile.png)
nankichi
お仕事で住所を触っているものとして:企業の住所には「土地区画整理事業地内」ってのがあるよ。http://www.city.hitachinaka.lg.jp/matizukuri/5/1/4646.html 後銀座Inz とかの境界未定も。https://style.nikkei.com/article/DGXNASFK1902X_Z11C11A0000000/
![kuippa kuippa](https://cdn.profile-image.st-hatena.com/users/kuippa/profile.png)
kuippa
上のほうは郵便番号辞書から引くといいよ。日本語入力できなくて全部アルファベットで入れる人とかいるし。問題は住居表示に関する法律に従わなかった自由表記な地域とか様方とかフランス語なマンション名
![deep_one deep_one](https://cdn.profile-image.st-hatena.com/users/deep_one/profile.png)
deep_one
まぁ郵便番号の公式データを見た時よりはやる気になるって。/京都では﹁何々通上がる﹂の部分が違うが同じ名前の町というのがたまにある。郵便番号は違う。/コメントを見て。予想よりもさらに多かった…
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
いまの話題をアプリでチェック!
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita
先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 ...
先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを﹁大字町丁目コード﹂という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得するということをやっています。 つまり、住所の正規化からコードに変換する部分がとても重要で、そもそも正規化に失敗してしまうとどうしようもないという仕様なんです。 さいわい先日経産省が公開した IMI コンポーネントツール である程度のことをやってくれるのですが︵というかそうであることを期待したのですが︶、いろいろ調べ始めると住所という仕組みはほんとに複雑で、Facebook で絡んでくださった @hfu さんいわくまさに﹁自然言語処理そのもの﹂であ
2020/06/04 リンク