![](https://cdn-ak-scissors.b.st-hatena.com/image/square/46d8c7fbdd5d651cb8dd96564652bf7b815fd63d/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--Ss79NG6d--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E3%252582%2525A2%2525E3%252582%2525A4%2525E3%252583%25258C%2525E8%2525AA%25259E%2525E4%2525BB%2525AE%2525E5%252590%25258D%2525E3%252580%25258C%2525E3%252587%2525B7%2525E3%252582%25259A%2525E3%252580%25258D%2525E3%252581%2525AB%2525E5%2525AF%2525BE%2525E3%252581%252599%2525E3%252582%25258B%2525E6%2525AD%2525A3%2525E8%2525A6%25258F%2525E8%2525A1%2525A8%2525E7%25258F%2525BE%2525E3%252581%2525AE%2525E7%2525BD%2525A0%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3Amkpoli%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzhhNjVjYTVjMTAuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)
エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント44件
- 注目コメント
- 新着コメント
![atsushieno atsushieno](https://cdn.profile-image.st-hatena.com/users/atsushieno/profile.png)
atsushieno
C#/.NETは環境次第なところがあるので明記したほうがいいと思う(Windows .NET Core / non-Windows .NET Core / Monoで実装が違う、というかmonoでは自分がそんな新しい文字まで実装していない)
![victoriaxxx victoriaxxx](https://cdn.profile-image.st-hatena.com/users/victoriaxxx/profile.png)
victoriaxxx
夏休みにウポポイでアイヌ語発音を学んで「日本文字よりアルファベットのほうが向いてるな」と思ってたけどシステム上もややこしいのね/id:blueboy 表記整備した当時のアイヌ人が日本語話者だったから仕方ないのでは
![yarumato yarumato](https://cdn.profile-image.st-hatena.com/users/yarumato/profile.png)
yarumato
“この半濁点はU+309Aという結合文字。正規表現エンジンには、カタカナと見なす実装とそうでない実装がある。Perl/Ruby/Python/JavaScript/C#/Java/Golang/Rust などバラバラ”
![BigHopeClasic BigHopeClasic](https://cdn.profile-image.st-hatena.com/users/BigHopeClasic/profile.png)
BigHopeClasic
金田一京助と知里真志保のアイヌ語カナ表記に関する発明についてはこちらが詳しい http://www.aa.tufs.ac.jp/~asako/unwritten/01-nakagawa.pdf / id:blueboy みたいなのは特にこれを読む必要がある(言うまでもなく知里はアイヌ人)
![narwhal narwhal](https://cdn.profile-image.st-hatena.com/users/narwhal/profile.png)
narwhal
欧語は日本語と異なり閉音節も存在するので、表記の際音素文字であるラテン文字なら何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際 (以下略
![mas-higa mas-higa](https://cdn.profile-image.st-hatena.com/users/mas-higa/profile.png)
mas-higa
結合文字は 1文字という理解で正しければ、正規表現で 1文字を正しく扱えていないという話かな? 昔マルチバイト文字に対応してないプログラムが Shift JIS や EUC の文字の途中で分割して文字化けしたりしてたのと似てる
![lyiase lyiase](https://cdn.profile-image.st-hatena.com/users/lyiase/profile.png)
lyiase
Unicode のブロック指定( \p{InKatakana} と \p{InKatakana_Phonetic_Extensions} )すればいいやん…って思ったんだけど何か問題があるのだろうか。
![BigHopeClasic BigHopeClasic](https://cdn.profile-image.st-hatena.com/users/BigHopeClasic/profile.png)
BigHopeClasic
金田一京助と知里真志保のアイヌ語カナ表記に関する発明についてはこちらが詳しい http://www.aa.tufs.ac.jp/~asako/unwritten/01-nakagawa.pdf / id:blueboy みたいなのは特にこれを読む必要がある(言うまでもなく知里はアイヌ人)
![victoriaxxx victoriaxxx](https://cdn.profile-image.st-hatena.com/users/victoriaxxx/profile.png)
victoriaxxx
夏休みにウポポイでアイヌ語発音を学んで「日本文字よりアルファベットのほうが向いてるな」と思ってたけどシステム上もややこしいのね/id:blueboy 表記整備した当時のアイヌ人が日本語話者だったから仕方ないのでは
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
いまの話題をアプリでチェック!
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
アイヌ語仮名「ㇷ゚」に対する正規表現の罠
導入 アイヌ語は日本語と異なり、閉音節︵子音で終わる音節︶も存在するので、表記の際音素文字であるラ...
導入 アイヌ語は日本語と異なり、閉音節︵子音で終わる音節︶も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際、鼻音nは﹁ン﹂でなんとかなる︵実はそれでもまずい事になっているけどここでは割愛する︶が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名︵小書き仮名文字︶を利用することになっている。 具体的には以下のような特殊仮名文字︵通称 アイヌ語仮名︶である。 ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題r
2023/09/01 リンク