タグ

文字コードに関するindicationのブックマーク (16)

  • 文字コード | 衆議院議員 河野太郎公式サイト


    2023.05.10 使   JIS X 0213 使55  58 
    文字コード | 衆議院議員 河野太郎公式サイト
    indication
    indication 2023/05/12
    職権修正という大変な仕事を地道に続けたおかげかも。現存しなくても維持しないといけなものは、どうするのだろう。
  • ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita

    はじめに これらの横棒、コンピュータにとっては全て違うのですが 見分けがつくでしょうか? -˗ᅳ᭸‐‑‒–—―⁃⁻−▬─━➖ーㅡ﹘﹣-ー𐄐𐆑 郵便番号、住所、電話番号など、横棒が使われているデータを扱うとき、 人が入力したデータや購入したデータであると、同じ記号が使われていないことはよくあることです。 090-1234-5678 090᭸1234᭸5678 090‑1234‑5678 090−1234−5678 これらの電話番号の文字列も phone_no_list = ['090-1234-5678', '090᭸1234᭸5678', '090‑1234‑5678', '090−1234−5678'] # 文字をUnicodeコードポイントに変換 for n in phone_no_list: # 文字列の4番目の横棒の文字コードを見てみる print(n[3], ord(n[3]

    ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita
    indication
    indication 2021/11/04
    正規表現に持って行きやすそう。さすがにサロゲートペアはないよね
  • Unicode 版美乳テーブルを探せ

    美乳テーブルとは 「美乳テーブル」という物がある。 「EUC-JP の文章を Shift_JIS だと誤認識されない様に、EUC-JP 固有のバイト値を文章先頭付近に埋め込んでおく」という物。 具体的に、Shift_JIS には 0xFD と 0xFE が現れず、EUC-JP にはそれが現れるので、その値を含む文字コードを書いておこうという事で、その文字の集合に付いた名前。 “美” = 0xC8FE、“乳” = 0xC6FD。 各文字エンコーディングの事情 但し、これは EUC-JP での話。 一応、文章の先頭付近に日語の文字を書いておくのは、他の文字エンコーディングでも認識のヒントにはなるけど。 逆に「Shift_JIS の文章を EUC-JP だと誤認識されない様にする」には、EUC-JP にはないバイト値の 0x80〜0xA0 を書けばいいんだろうけど、これは沢山ありそうだから、慎

    indication
    indication 2021/04/04
    先頭から読まないといけない事にはじめて気づいた(テーブルを必死に探した)
  • [PDF]新元号名で使用する文字コードについて(周知)(平成31年4月5日経済産業省事務連絡)

    indication
    indication 2019/04/16
    せめて一週間早くほしかったな →4/5交付で気付くのが遅かったorz
  • char8_tによせて - なるせにっき


    C++: char8_t  glyph  CJK WikipediaCJK
    char8_tによせて - なるせにっき
    indication
    indication 2018/12/24
    utf8_tがあれば解決(ちがう)
  • 文字コード - Global Wiki


     便 nkf UnixWindows iconv    charmap.exe Windows    notepadWindows ASCII (SJIS) Unicode (UTF-16)  UTF-8  Stiring Windows 
  • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース


    使61156 2 14611
    コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
    indication
    indication 2017/12/25
    外字で印刷失敗したり、連携がコケて穴掘って謝ったりしなくてよくなる世界は...先が長そう。マイナンバーの賜物かもしれない。MS社に懸ってる。字形マジわからんし、プレビューと印刷で字形が違う
  • utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる

    RailsMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト

    utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
    indication
    indication 2015/03/09
    覚えておかないと人生を無駄にしそう
  • 全角チルダ問題

    JenkinsとDockerって何が良いの? 〜言うてるオレもわからんわ〜 #jenkinsstudyKazuhito Miura

    全角チルダ問題
    indication
    indication 2014/07/07
    誰かが、文字コードで人生が無駄になると言っていたように思う。しかしながら、よい資料。
  • 第2回 住民基本台帳ネットワーク統一文字


    2002821170 使使416稿J+xxxx21170
    第2回 住民基本台帳ネットワーク統一文字
    indication
    indication 2014/07/01
    このおかげて何度も朝日を拝んでいる人たちもいるから、減ってほしいと心底願ってる。
  • ものかの » UTF-8-MAC なんていう文字コードはありません


    OS X  UTF-8-MAC  OS X  HFS+...UTF-8-MAC  OS X  UTF-8-MAC  OS X  HFS+HFS+ 
    indication
    indication 2013/07/11
    iconvの中の人も大変そう
  • 最近の mbstring 動向について(PHP 5.4〜) - t_komuraの日記


    PHP 5.4  PHP  mbstring  PHP 5.4.0     UTF-8   mbstring/libmbflUnicode 6.0 mbstring/libmbfl UTF-8   PHP-5.4.0alpha3 SJIS-Mobile#DOCOMO SJIS-Mobile#DOCOMO-PUA SJIS-Mobile#KDDI SJIS-Mobile#KDD
    最近の mbstring 動向について(PHP 5.4〜) - t_komuraの日記
    indication
    indication 2011/08/19
    携帯絵文字対応等
  • RedmineでCVSとSVNのコミットコメントの文字コードが違う場合の対処 - maru.cc@はてな


    使 SVN(Subversion)  CVS 使  SVN  CVS  SVN GIT 使SVN+Trac Redmine  Redmine  CakePHP  candycane   Redmine CVSCVS Redmine 
    RedmineでCVSとSVNのコミットコメントの文字コードが違う場合の対処 - maru.cc@はてな
    indication
    indication 2011/07/19
    トラブルシューティング
  • SQL Server の LEN 関数は文字列の長さを正確に取得出来ない・・・だけじゃない - ぐるぐる~


    *1LEN  -- SQL12 SELECT LEN(N'𠮷');  ()    LEN   nchar(1)  nvarchar(1) 𠮷*2nchar(1)  nvarchar(1) 1 10 nvarchar(10)  
    SQL Server の LEN 関数は文字列の長さを正確に取得出来ない・・・だけじゃない - ぐるぐる~
  • Perlクイックリファレンス - 1部 Perl入門 - [SMART]

    変数は以下のように値を代入したり出力することができます。 # 変数に文字列を代入 $value = "テストです"; # 変数を出力 print $value; 【参照ページ】 変数 配列 複数の値を1つの変数で管理したい場合は、『配列』という変数が最適です。 配列を初期化する場合は、要素をカッコで囲み、各要素毎にカンマで区切ります。 @week = ('日曜', '月曜', '火曜', '水曜', '木曜', '金曜', '土曜'); 配列はインデックスを使って参照します。インデックスは 0から始まるので注意してください。たとえば1番目のデータ "日曜" を呼び出すときは、$week[0]、"月曜"なら $week[1] とします。 # 配列 @week の1番目の要素を表示 print $week[0], "\n"; > 日曜 # 配列 @week の2番目の要素を表示 print $

    Perlクイックリファレンス - 1部 Perl入門 - [SMART]
  • Escape Codec Library: ecl.js


        
  • 1