タグ

charsetに関するsuVeneのブックマーク (26)

  • Shift_JISにおける危険な文字まとめ

    今時Shift_JISでプログラミングするバカな奴はいないだろうけど折角まとめたので公開 2バイト目がアスキーコードど丸被りしているものを列挙する@[\]^_`{|}~405B5C5D5E5F607B7C7D7E81 ー―‐/\??+??±×82・・・・・・A・・・・83ァゼソゾタダチボポマミ84АЪЫЬЭЮЯклмн85・・・・・・・・・・・86・・・・・・・・・・・87????????・????・・・??88・・・・・・・・・・・89院閏噂云運雲荏閲榎厭円8A魁骸浬馨蛙垣柿顎掛笠樫8B機擬欺犠疑祇義宮弓急救8C掘啓圭珪型契形鶏芸迎鯨8D后梗構江洪浩港砿鋼閤降8E察纂蚕讃賛酸餐施旨枝止8F宗充十従戎柔汁旬楯殉淳90拭深申疹真神秦須酢図厨91繊措曾曽楚狙疏捜掃挿掻92叩端箪綻耽胆蛋畜竹筑蓄93邸甜貼転顛点伝怒倒党冬94如納能脳膿農覗倍培媒梅95鼻票表評豹廟描府怖扶敷96法房暴望某棒冒翻凡

    Shift_JISにおける危険な文字まとめ
  • http://openblog.meblog.biz/article/61959.html

  • Unicode に関する誤解の誤解 - odz buffer


    ref:Open :  JIS  unicode via:Matz(2007-03-12)   Encode.pm maintainer  dankogai   unicode  unicode 使 unicode UTF-8
    Unicode に関する誤解の誤解 - odz buffer
    suVene
    suVene 2007/03/18
    『Encode.pm の maintainer である dankogai 氏を素人呼ばわりするのもなかなか勇気があると思うが』 わろた
  • UTF-8 エンコーディングの危険性 - WebOS Goodies

    的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。 例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです(昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

  • VistaをXPの字体に戻すというjp90タグの罠


    JIS C 622619786802JIS C 6226198330083JIS JIS C 62261987JIS X 0208199019831997 1990JIS X 0212
    VistaをXPの字体に戻すというjp90タグの罠
  • 槻ノ木隆の「BBっとWORDS」


      PC 使ASCIIEBCDICISO-8859使JIS X 0208/0212/0213JIS使ISO-2022-JP/Shift JIS/EUC使Unicode    
  • ウノウラボ Unoh Labs: 絵文字の相互変換リスト


    haruk23 3() Tab(TSV)使使  DoCoMo(i-mode) %i(1176)% %i(10011076)% au(EZweb) %e(1822)% SoftBank PAGE1(G)%s(190)% PAGE1(E)%s(101190)% PAGE1(F)%s(201290)% P
  • Vista で導入される JIS X 0213:2004(JIS2004) のまとめ(お勉強編)


    VistaITpro 3orz Windows VistaJISJIS X 0213:2004122900200  Unicode24 SJIS  UTF-8  SJIS 
  • Vistaで化ける字,化けない字


    1130Windows VistaVistaWeb MicrosoftWindows98Windows 2000WindowsMeWindowsXPCP932Windows Codepage 932MSJIS X 0212Windows VistaJIS X 0213CP932JIS X 0212JIS X 0213
    Vistaで化ける字,化けない字
  • それ Unicode で

    UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。

    suVene
    suVene 2006/12/13
    文字コードに絡むXSSの例が沢山
  • Unicodeは文字集合か符号化方式か : 404 Blog Not Found

    2006年11月24日12:30 カテゴリLightweight Languages Unicodeは文字集合か符号化方式か 以下は、電脳で文字を扱う場合の基礎中の基礎なのだが、肝心の記事に重大な誤りがいくつもある。 文字コード規格の基礎:ITpro そろそろ具体的な説明に入ろう。最初にはっきりさせておく必要があるのは次の点だ。一般に「文字コード」と言う場合, 文字の集合 エンコード方法 という要素がある。この二つを区別して考えることが重要だ。もちろん大きな関連はあるのだが,ごちゃごちゃのままでは「わからなく」なる大きな要因となる。ここだ。 これによると、Unicodeは明らかに「エンコード方法」であるが、これは間違い。ここで書かれているものはUCS-2という名前のUnicodeが定めるいくつかの「エンコード方法」の一つであり、しかもUTF-16によって陳腐化した方式である。 まずUnic

    Unicodeは文字集合か符号化方式か : 404 Blog Not Found
  • 文字コード規格の基礎:ITpro

    この記事は,日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。 文字コード規格の基礎を手早く理解したい場合などにお役立てください。 文字コードは間違いなく情報を交換するための「決まりごと」なので,正確を期すため厳密な仕様が規定されている。だが,その仕様そのものを実装するプログラムを作る場合を除けば,プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。 ここでは,通常のプログラミングをするうえで必要と思われる範囲のことを,なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが,多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ

    文字コード規格の基礎:ITpro
    suVene
    suVene 2006/11/23
    文字集合とエンコーディングについて、ビットコードの重複範囲などの説明など(概要的に)。http://blog.livedoor.jp/dankogai/archives/50696661.html
  • Passing Pictures 3rd: もはや死語?『機種依存文字』


     ()()JIS 使使) Windows123Mac 使使 blogWindows使Mac
    suVene
    suVene 2006/11/16
    本筋と関係ないが、『「私たちは素人だからそんなことは知らない」といわれてしまいます…。』これ、なめられてるだけだろw
  • [を] UTF-8 で半角カナを判定


    UTF-8  2006-11-09-3 [Programming] Perl  UTF-8  使  print if /[-]/;  utf8hankana-test.pl begin 755 utf8hankana-test.pl.gz M'XL("+7C4D4``W5T9CAH86YK86YA+71E<W0N<&P`1<_)2L-@$,#Q^SS%9[Q8 ML>0J1H1"]>K!>'()M48-U"A)BP<1M.[5NN];L>[[OFM]F"IXZROX5P\._&!F MF!F8XB(]X7MZB^/JW;87DV+UF4Y]'<SEDR?YP51)O5D3+`](PK>5'_><:-SX MS7L
  • OSXでは半角¥マークとバックスラッシュは区別される « ku

    suVene
    suVene 2006/09/13
    チェック。
  • 文字コードについて(シフトJISの問題)


    JISWindows WindowsMS932 CP932MS932 charset="Shift_JIS" MS932'? 'OC4JJBuildertomcatMS932  JavaUnicode
  • http://web.hc.keio.ac.jp/~fujimura/lang/page-8.html

  • http://www.rikai.com/library/kanjitables/kanji_codes.unicode.shtml

    suVene
    suVene 2006/07/24
    euc shift-jis あり
  • 文字コード最新リンク集2005

    正規表現/文字コード最新リンク2005 [3000URL最新人気リンク発表][お報せ][開発管理運営者][サイトマップ] ★リンク追加希望はホムペ紹介掲示板へ | 文字主体の高速表示リンク集 | 紹介文付き ■:最近行ってない | ■:最近行った | ●リンク切れ最終チェック:2003/10/26 NEWSだ!(^o^)/ : 台風 - 地図検索 Start is Hello world : HSP - C - Borland - VB - DLL&OCX - Web開発 - DB - 正規表現 コミュニティ : 掲示板 - 市場 - 出会い  トレンド : そよ風くん(風力発電機) メモ帳(M)あります : 小説 - 料理 - 占い - ? - 辞書&文例 - HARD - SOFT - 政 - 名スレ ◆文字コード表 ◆日はjp ◆Unicode時代のWeb開発 ◆Un

  • Ingrid.org

    Ingrid.org This Page Is Under Construction - Coming Soon! Why am I seeing this 'Under Construction' page? Related Searches: Best Penny Stocks Best Mortgage Rates Anti Wrinkle Creams Top Smart Phones Healthy Weight Loss Trademark Free Notice Review our Privacy Policy Service Agreement Legal Notice Privacy Policy

    suVene
    suVene 2006/07/24
    まっぴんぐ