Extensible HyperText Markup Language
拡張子 | .xhtml、.xht、.html、.htm |
---|---|
MIMEタイプ | application/xhtml+xml |
開発者 | World Wide Web Consortium |
種別 | マークアップ言語 |
派生元 | XML、HTML |
国際標準 | 1.0 (Recommendation), 1.1 (Recommendation), |
HTML |
---|
Extensible HyperText Markup Language︵エクステンシブル ハイパーテキスト マークアップ ランゲージ︶、略記・略称‥XHTML ︵エックスエイチティーエムエル︶は、SGMLで定義されていたHTMLをXMLの文法で定義しなおしたマークアップ言語である。その仕様はHTMLと同じくW3Cによって勧告されていた。しかし2007年にW3C HTML WGを設立するとWHATWGとの共同作業を行い、2009年、W3Cは開発を正式に中止した。HTML5はXMLの書式に従わずともMathMLやSVGなどを埋め込むことが可能である。
上述の通りXHTMLは開発が中止されており、この記事には古い内容を多分に含んでいる。しかしながら、HTMLを解釈するユーザーエージェント︵Webブラウザなど︶は、引き続きサポートしている。
なお、﹁eXtensible HyperText Markup Language の略である﹂とされることがあるが、これは間違いであり、XはExの発音を表している[1]。
HTMLとの相違点[編集]
XHTMLはXMLアプリケーションである。よって、XMLの文法に従うために、HTMLと異なる部分が存在する。以下は、主な文法上の相違点とソースのサンプルである。 XML宣言を書く XML文書であるため、文書の頭にXML宣言を書くことが奨励されている。文字コードについては、UTF-8ないしUTF-16の場合やHTTPなどのプロトコルで文字コードが指定されている場合は省略可能であるが、常に付与することが推奨される。<?xml version="1.0" encoding="UTF-8"?>要素名・属性名は小文字で書く XMLでは大文字・小文字が厳密に区別される。XHTML勧告の場合、要素名・属性名は全て小文字でのみ定義されていることから、要素名・属性名は共にすべて小文字で表記しなければならない︵なお、属性値はこの限りではない︶。
正: <p id="iroha">色は匂へど 散りぬるを</p> 正: <p id="IROHA">色は匂へど 散りぬるを</p> 誤: <p ID="iroha">色は匂へど 散りぬるを</p> 誤: <P id="iroha">色は匂へど 散りぬるを</P> 誤: <P ID="iroha">色は匂へど 散りぬるを</P>要素の終了タグを書く 要素は必ず開始タグと終了タグを備えていなければならない︵終了タグの省略は許されない︶。
正: <p>色は匂へど 散りぬるを</p><p>我が世誰ぞ 常ならん</p> 誤: <p>色は匂へど 散りぬるを<p>我が世誰ぞ 常ならん空要素の終了タグも書く 空要素についても同様に終了タグを付与するか、開始タグの末尾を﹁/>﹂としなければならない。 ●終了タグを付与する <br></br> という表記の場合は、タグの間に空白類文字すら含めてはいけない。また、後方互換性のために <br></br> ではなく、<br /> と表記することが推奨されている[2]。 ●XMLを解釈できない古いUAで <br/> という表記に対し、"br/" を要素名とみなし無視してしまう可能性があることを考慮し、XHTMLでは <br /> のようにスラッシュの前に半角スペースを先行させる表記が一般的である。
正: <em>色は匂へど 散りぬるを</em><br />(推奨) 正: <em>色は匂へど 散りぬるを</em><br/> 正: <em>色は匂へど 散りぬるを</em><br></br> 誤: <em>色は匂へど 散りぬるを</em><br> 誤: <em>色は匂へど 散りぬるを</em><br> </br>属性値はダブルクォーテーションで囲む 属性値はすべて " " ︵ダブルクォーテーション︶ないし ' '︵シングルクォーテーション︶で囲まなければならない。
正: <input type="text" size="8" /> 正: <input type='text' size='8' /> 正: <input type="text" size='8' /> 誤: <input type=text size=8 />属性名を省略せず書く 属性名を省略してはならない。なお、これらを属性値の省略という例が存在するが、SGMLやXMLの観点からは正しいとはいえない。
正: <input type="checkbox" checked="checked" /> 誤: <input type="checkbox" checked />推奨されるメディアタイプ 推奨されるメディアタイプが﹁text/html﹂から﹁application/xhtml+xml﹂に変更された[3]。また、HTMLで従来使用されていたtext/htmlは、XHTML1.1以降では非推奨となっている。
<meta http-equiv="Content-Type" content="application/xhtml+xml; charset=Shift_JIS" />メディアタイプがapplication/xhtml+xmlの場合、meta要素のhttp-equiv属性の使用は非推奨となる[4]。代わりにHTTPのヘッダでメディアタイプを指示することが必要となる。 HTML要素#HTML構文とXML構文との違いも参照されたし。
歴史[編集]
XHTML 1.0[編集]
HTML 4.01をXMLにて再定義したもので、HTML 4.01と同様にStrict、Transitional、Framesetという3種類のDTDが存在する。 2000年1月26日に勧告となり、2002年8月1日に改訂版であるSecond Editionが勧告された。XHTML Basic[編集]
XHTMLのサブセットで、PDAや携帯電話などの小規模な端末を含む、より広域の環境のための仕様である。2000年12月19日にXHTML Basic 1.0が勧告された。 その後、OMAが策定するXHTML Mobile Profileとの不整合を解消する目的で策定された XHTML Basic 1.1が2008年7月29日に勧告された。 Basic1.1では、Basic1.0から次のような変更が行われている。 ●target属性やscript/style要素、style属性の追加 ●XFormsよりinputmode属性の追加XHTML Modularization (Modularization of XHTML, M12n)[編集]
XHTMLをその要素の目的や役割ごとに分割し、フレームワーク化したもの。XHTML 1.1やXHTML 2.0は、M12nをベースに構築されている。バージョン1.0が2001年4月10日に、バージョン1.1が2008年10月にそれぞれ勧告された。2009年7月現在、バージョン2.0が草案の段階にある。 1.0から1.1ではXML Schemaへの対応などが変更点となった。XHTML 1.1[編集]
機能がモジュール化されたXHTML。XHTML 1.0からの主な違いは、次の通りである。 ●機能がモジュール化され、カスタマイズ性が向上した。 ●HTML 4.0以来複数あったスキーマが、従来のStrictスキーマの思想を基としたスキーマ1つのみとなった。 ●ルビモジュールが導入された。 2001年5月31日に仕様が勧告となった。 2010年11月23日にXHTML 1.1 Second Editionが勧告された。エラッタの修正とXML Schemaへの対応が主な変更点となる。XHTML 1.2[編集]
策定中であるXHTML Role ModuleやAccess Module、WAI-ARIAの語彙を組み込んだ新しいプロファイルとして策定予定。XHTML 2.0[編集]
XHTML Familyの次期バージョンとして策定されていたが、W3Cは2009年07月03日に策定の打ち切りを決定し、今後はHTML5にリソースを注ぐものとした。理由として、XHTML 2.0の市場はHTML5に比べて非常に小さいことがあげられている。HTML5のXML構文[編集]
HTML5をXML構文で記述したものは、しばしばXHTML5と呼ばれるが、WHATWG の標準仕様の中ではこの語は用いないことが明言されている[5]。 HTML5をXML構文で記述するための仕様も、HTML5仕様の中で定義されている。そのため、HTML5のXML構文はHTML5の一部である。しかし、HTML5の仕様ではXML構文とHTML構文の間には違いが多く、単に﹁HTML5﹂﹁HTML5ドキュメント﹂と言う場合には、HTML構文によるもののみを指すことが多い。そのため、実用上はHTML5のXML構文はHTML5と別のものとして扱われることがある。 以下にHTML構文とXML構文の違いをいくつか挙げる。 ●HTML構文の場合は要素名は固定だが、XML構文の場合は要素の名前空間が "http://www.w3.org/1999/xhtml" に属していれば接頭辞付きが許される︵XHTML1.x以前には、文書型宣言にモジュールを追加することで接頭辞を付けることを可能としていたが、基本的には許されなかった︶ ●HTML構文では限定的なSVG, MathMLの拡張しか行えないが、XML構文では名前空間を用いて制限なく拡張ができる︵以下の例ではxml:id属性を利用している︶ ●従来のHTML/XHTMLで許されていたDTDを用いた文字参照が不可能となった︵HTML5はもはやSGMLに基づいていない︶。 上記のような違いによってHTML構文と見た目が大きく異なるXML構文の文書として、以下のような例が考えられる。<?xml version="1.0" encoding="UTF-8"?>
<!-- これは妥当なHTML5のXML構文。ただしHTML構文との互換性はない -->
<?xml-stylesheet type="text/css" href="test.css"?><!-- 左のようなXML処理命令も書ける -->
<!-- この場合、ルート要素がxhtml:htmlのため、通常のHTML5のように "<!DOCTYPE html>" という文書型宣言は行えない -->
<xhtml:html xmlns:xhtml="http://www.w3.org/1999/xhtml" xml:lang="ja">
<xhtml:head>
<xhtml:title xml:id="title">XML名前空間を用いた拡張例(xml:id)</xhtml:title>
<xhtml:script><![CDATA[ ... ]]></xhtml:script>
</xhtml:head>
<xhtml:body>
<xhtml:p> ... </xhtml:p>
</xhtml:body>
</xhtml:html>
関連項目[編集]
脚注[編集]
- ^ "XML stands for Extensible Markup Language. The X is for the first syllable of Extensible. eXtensible is a spelling error."
- ^ C. HTML Compatibility Guidelines
- ^ W3C Note: XHTML Media Types <http://www.w3.org/TR/xhtml-media-types>
- ^ XHTML Media Types - W3C Note、2002年8月1日(2013年12月5日閲覧)。
- ^ HTML Living Standard — Last Updated 31 May 2021 §14 The XML syntax