タグ

unicodeに関するmakoto15のブックマーク (79)

  • 端末の文字幅問題の傾向と対策 | IIJ Engineers Blog


    Rubyist CLI TUI 使 TUI   使  Ctrl-l  Ctrl-l    w3m  less  Wander
    端末の文字幅問題の傾向と対策 | IIJ Engineers Blog
  • Python で Unicode 正規化 NFC/NFD の文字列を扱う - forest book


     Python  t2y.hatenablog.jp 稿Py Amazon  python3.7 pathlib 使python NFD Amazon CAPTCHA   NFD Unicode 
    Python で Unicode 正規化 NFC/NFD の文字列を扱う - forest book
  • Unicodeの闇

    How Race, Age and Gender Shape Attitudes Towards Mental Health

    Unicodeの闇
  • ニホニウムの簡体字 | karak


       Google Chrome Firefox FirefoxChrome  Firefox  Source Han Sans SourceHanSansSC.zipSourceHanSansTC.zip UnicodeSource Han SansChrom
  • Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?


    Windows10TipsWindows10使 UTF-8 Windows10Shift_JISUTF-8ANSIShift_JISBOMUTF-8 1903使UTF-8 UTF-8Windows1803Shift_JISUTF-81803190
    Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?
  • 12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア

    Androidのテキスト処理を担当しているのなさんと、UnicodeやUnicode絵文字、テキスト処理の複雑さ、文字トリビアなどについて話をしました。出演者: のな (@ttuusskk)、Rui Ueyama (@rui314) https://turingcomplete.fm/12 ハッシュタグは#tcfmです。 TCFMはサポーターの投げ銭によって収益を上げています。このコンテンツに課金してもいいよという方はぜひクリエイター支援サイトPatreonから登録してご協力ください。 イントロ (0:00) 自分の読めない言語のテキスト処理は大変 (1:28) MMDDYYYYとDDMMYYYYの違いによる国際化バグ (3:07) Left-to-right言語とright-to-left言語 (5:23) アラビア語と英語のハイフネーション (6:15) 日語の禁則処理 (7:19)

    12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア
  • 現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ


    *1 使使 Unicode 3.0UnicodeUnicode 2017Unicode Te
    現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ
  • Unicode in the Windows API - Win32 apps

  • Code Pages - Win32 apps

    Each code page is represented by a code page identifier, for example, 1252, and is handled by the Unicode and character set API functions. For a list of supported code page identifiers, see Code Page Identifiers. The "Code Pages" reference on the Microsoft Go Global Developer Center gives full descriptions of many code pages. Windows code pages, commonly called "ANSI code pages", are code pages fo

    Code Pages - Win32 apps
  • Character Sets Used in File Names - Win32 apps

  • Unicodeで「漢字」の正規表現 – ものかの


    2017/07/22 Unicode 10.0 2023/03/21 U+30000InDesign Unicode Unicode [-] JIS X 0208UnicodeWindowsJISCP932JIS X 021334𠮟 Unicode
    Unicodeで「漢字」の正規表現 – ものかの
  • 新絵文字56種類が追加された「Unicode 10.0」が発表される


    2017620Unicode Consortium56Unicode 10.0 The Unicode Blog: Announcing The Unicode® Standard, Version 10.0 http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html Unicode 10.0Mage(使)Fairy()Vampire()Merperson()Zombie()Person in Lotus Position()Giraffe()Hedgehog()T-Rex()Broc
    新絵文字56種類が追加された「Unicode 10.0」が発表される
  • Apple、世界絵文字デーに年内リリースの新絵文字を披露 - iPhone Mania


    Apple717iOSmacOSwatchOS  T 6Unicode 10  AppleApp StoreWorldEmojiDayiTunes Movies 
    Apple、世界絵文字デーに年内リリースの新絵文字を披露 - iPhone Mania
  • Python3でUnicodeDecodeErrorに遭遇したときのTODOリスト - Qiita


     Fuxk!!!!  UTF-8UTF-8  UTF-8UTF-8 LANG
    Python3でUnicodeDecodeErrorに遭遇したときのTODOリスト - Qiita
    makoto15
    makoto15 2017/06/21
    “Python3でUnicodeDecodeErrorに遭遇したときのTODOリスト”
  • Unicode の嫌なところを触ってしまった Python - yanok.net


    Pythonlibiconv, nkf, Java  EUC-JIS-2004, Shift_JIS-2004  Unicode  ASCIIJIS X 0201UnicodeFTP ()Python Python()U+FFxxU+29xx JISU+FFxxFULLWIDTH {LEFT|RIGHT
  • MySQL 8.0.1でutf8mb4_ja_0900_as_csが導入された


    Sushi = Beer ?! An introduction of UTF8 support in MySQL 8.0 | MySQL Server Blog: 寿= : MySQL 8.0UTF8 (MySQL Server Blog) | Yakst utf8mb4_ja_0900_as_cs  mysql80> SHOW COLLATION LIKE 'utf8%ja%'; +-----------------------+---------+-----+---------+----------+---------+ | Collation | Charset | Id | Default | Compiled | Sortlen | +-----------------------+-
    MySQL 8.0.1でutf8mb4_ja_0900_as_csが導入された
  • Unicode 10、変体仮名と縦書きレイアウト導入へ

    Unicode is a computing industry standard allowing computers to consistently represent and manipulate text expressed in most of the world's writing systems. Unicode Consortiumは3月9日(米国時間)、「The Unicode Blog: Unicode 10.0 Beta Review」において、次のバージョンのUnicode 10.0で実施される変更点や新しく追加される機能などについて伝えた。Unicode 10.0ではいくつかの変更が行われることになっており、Unicode Line Breaking Algorithmn、Unicode Text Segmentation、Unicode Identifier an

    Unicode 10、変体仮名と縦書きレイアウト導入へ
  • 「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記

    自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。 上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。 意味論的に等価な異なる字形の集合 同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの 例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ

    「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
  • http://rishida.net/blog/?p=1696

  • モンゴル文字とUnicode - にせねこメモ


    調 使使   ()() ()(10) ()  *1
    モンゴル文字とUnicode - にせねこメモ