日本国憲法を ISO-HTML でマークアップする

妥当なマークアップを施された文書は、再利用が楽であります。然るに、妥当なマークアップとはどういうものか。日本国憲法を題材にマークアップの仕方について考察してみました。但し、ISO/IEC 15445:2000 限定の話。


発端

例えば日本国憲法なら

第十四条  すべて国民は、法の下に平等であつて…

の‘第十四条’の部分。憲法は全部で百三条あるので百三ケ所をゴシック体にしたいのです。

とか言う質問が某所で有りました。いや、Mac 版 Word で印刷したいらしいのですが、面倒だから、HTML にしてスタイルシートで指定してプリントしたらどーよとか思ったのです。それで、日本国憲法は【http://law.e-gov.go.jp/htmldata/S21/S21KE000.html】にリソースが有るのですが、マークアップが凄いことになっております。ついでなので、【mi】を使って、正規表現の練習のつもりで、マークアップを修正してみました。

この際に、マークアップの手法として、「第〜条」を見出し(hx 要素)にする方法と、「第〜条」を定義リスト(dl 要素)にする方法を思いついたので、2 種類作ってみました。

マークアップ考察【日本国憲法】資料その1

「第〜条」は見出しにしてみました。


<h3>第六条</h3>
<p>天皇は、国会の指名に基いて、内閣総理大臣を任命する。</p>
<h4>○2</h4>
<p>天皇は、内閣の指名に基いて、最高裁判所の長たる裁判官を任命する。</p>

<h3>第七条</h3>
<p>天皇は、内閣の助言と承認により、国民のために、左の国事に関する行為を行ふ。</p>
<ol>
<li>憲法改正、法律、政令及び条約を公布すること。</li>
<li>国会を召集すること。</li>
<li>衆議院を解散すること。</li>
<li>国会議員の総選挙の施行を公示すること。</li>
<li>国務大臣及び法律の定めるその他の官吏の任免並びに全権委任状及び大使及び公使の信任状を認証すること。</li>
<li>大赦、特赦、減刑、刑の執行の免除及び復権を認証すること。</li>
<li>栄典を授与すること。</li>
<li>批准書及び法律の定めるその他の外交文書を認証すること。</li>
<li>外国の大使及び公使を接受すること。</li>
<li>儀式を行ふこと。</li>
</ol>
マークアップ考察【日本国憲法】資料その2

「第〜条」は定義リストにしてみました。


<dt>第六条</dt>
<dd><p>天皇は、国会の指名に基いて、内閣総理大臣を任命する。</p>
<dl>
<dt>○2</dt>
<dd><p>天皇は、内閣の指名に基いて、最高裁判所の長たる裁判官を任命する。</p></dd>
</dl></dd>

<dt>第七条</dt>
<dd><p>天皇は、内閣の助言と承認により、国民のために、左の国事に関する行為を行ふ。</p>
<ol>
<li>憲法改正、法律、政令及び条約を公布すること。</li>
<li>国会を召集すること。</li>
<li>衆議院を解散すること。</li>
<li>国会議員の総選挙の施行を公示すること。</li>
<li>国務大臣及び法律の定めるその他の官吏の任免並びに全権委任状及び大使及び公使の信任状を認証すること。</li>
<li>大赦、特赦、減刑、刑の執行の免除及び復権を認証すること。</li>
<li>栄典を授与すること。</li>
<li>批准書及び法律の定めるその他の外交文書を認証すること。</li>
<li>外国の大使及び公使を接受すること。</li>
<li>儀式を行ふこと。</li>
</ol>
</dd>

経過 1

Mac 版 MSWord とかで印刷する分には、上記のようなマークアップで十分整形が可能なので、これにて一件落着、なんですが、正しくマークアップされているのか微妙な感じもします。

すると、有り難いことに、DDT's Room:Web Site Watch Jan-2003 「法文のマークアップ」よりご意見を頂きました。

さて,法文において条番号の直後に書かれているのは,第一項の本文です。で,項が二つ以上ある場合は,第二項以降は,本文の前に項番号を記すのが通常です。

そういう表記方法に違いがあるとはいえ,実態としては,第一項の本文も第二項の本文も,全く並列のものであるわけです。

ところが事例では,二例とも,第一項の内容に比べ,第二項の内容は一段下のレベルになっています。これでは「項」ではなく「号」のようです。(もっとも,第7条で「号」は順序リストとして表記されてるので,違うことは判りますが。)

つまり、法文というのは、第〜条・第〜項・第〜号という具合に構成されていて、第一項しかない場合、「第一項」という表記は省略されてしまうらしいのです。なるほど、何故「○2」などという表記があるのか解せなかったのですが、第二項のことだったのです。納得しました。DDT 様、有り難う御座居ます。

というわけで、「日本国憲法」のマークアップを修正、かつ、各要素に id など割り振ってみました。

マークアップ考察【日本国憲法】資料その3

「第〜条」は h3 要素、項番号は h4 要素、号は h5 要素にしてみました。


<h3>第六条</h3>
<h4 class="Kou01">○1</h4>
<p>天皇は、国会の指名に基いて、内閣総理大臣を任命する。</p>
<h4>○2</h4>
<p>天皇は、内閣の指名に基いて、最高裁判所の長たる裁判官を任命する。</p>

<h3>第七条</h3>
<h4 class="Kou01">○1</h4>
<p>天皇は、内閣の助言と承認により、国民のために、左の国事に関する行為を行ふ。</p>
<h5>一</h5>
<p>憲法改正、法律、政令及び条約を公布すること。</p>
<h5>二</h5>
<p>国会を召集すること。</p>
<h5>三</h5>
<p>衆議院を解散すること。</p>
<h5>四</h5>
<p>国会議員の総選挙の施行を公示すること。</p>
<h5>五</h5>
<p>国務大臣及び法律の定めるその他の官吏の任免並びに全権委任状及び大使及び公使の信任状を認証すること。</p>
<h5>六</h5>
<p>大赦、特赦、減刑、刑の執行の免除及び復権を認証すること。</p>
<h5>七</h5>
<p>栄典を授与すること。</p>
<h5>八</h5>
<p>批准書及び法律の定めるその他の外交文書を認証すること。</p>
<h5>九</h5>
<p>外国の大使及び公使を接受すること。</p>
<h5>十</h5>
<p>儀式を行ふこと。</p>

経過 2

さらに、ご意見を頂戴しました。

さて,これを見て色々と考えたンですが,項番号を見出しにするのは間違いなンじゃないかな,という気がしてきました。

参議院法制局の法制執務コラム集「条・項・号・号の細分」には,次のようにあります。

法律は,まず,箇条書きにすることが必要とされるわけで,その箇条書きの一項目が「条」ということになります。そして,一つの条を規定の内容に従って更に区分する必要がある場合に,行を改めて書き始められた段落のことを,「項」と呼んでいるわけです。

これからすると,つまりは,項は単なる行変えに過ぎないと言えます。さらに,こうもあります。

昔の文語体・片仮名書きの法律では、行を変えるだけで項を区切っていましたが、口語体・平仮名書きになってからは、行の初めの字を一字下げて項をはっきりさせることになり、さらに、昭和23年ごろからは、第2項以下の項には「2、3…」と算用数字で「項番号」と呼ばれる番号を付けて、第何項かがすぐに分かるようにされています。

つまりは,項番号とは,一つの条のなかでの行変え文の順番に過ぎないということです。

おおー、なるほど。明示的に「項番号」は振られているわけではなくて、補助情報として採用されているというわけらしいです。なおかつ、条名や号名は固有名と考えられるらしいので、今度は、項番号を h3 要素直後の p 要素の title 属性として記述、号名は h4 要素としてマークアップしてみました。

マークアップ考察【日本国憲法】資料その4

「第〜条」は h3 要素、項番号は p 要素の title 属性として記述、号名は h4 要素にしてみました。


<h3>第六条</h3>
<p title="1" class="Kou">天皇は、国会の指名に基いて、内閣総理大臣を任命する。</p>
<p title="2" class="Kou">天皇は、内閣の指名に基いて、最高裁判所の長たる裁判官を任命する。</p>

<h3>第七条</h3>
<p title="1" class="Kou">天皇は、内閣の助言と承認により、国民のために、左の国事に関する行為を行ふ。</p>
<h4>一</h4>
<p class="Gou">憲法改正、法律、政令及び条約を公布すること。</p>
<h4>二</h4>
<p class="Gou">国会を召集すること。</p>
<h4>三</h4>
<p class="Gou">衆議院を解散すること。</p>
<h4>四</h4>
<p class="Gou">国会議員の総選挙の施行を公示すること。</p>
<h4>五</h4>
<p class="Gou">国務大臣及び法律の定めるその他の官吏の任免並びに全権委任状及び大使及び公使の信任状を認証すること。</p>
<h4>六</h4>
<p class="Gou">大赦、特赦、減刑、刑の執行の免除及び復権を認証すること。</p>
<h4>七</h4>
<p class="Gou">栄典を授与すること。</p>
<h4>八</h4>
<p class="Gou">批准書及び法律の定めるその他の外交文書を認証すること。</p>
<h4>九</h4>
<p class="Gou">外国の大使及び公使を接受すること。</p>
<h4>十</h4>
<p class="Gou">儀式を行ふこと。</p>
マークアップ考察【日本国憲法】資料その5

「第〜条」は dt 要素、項番号は dd 要素の title 属性として記述、号名は項の dd 要素の子要素として dt 要素にしてみました。


<dl class="J">
<dt class="Jo">第六条</dt>
<dd class="Kou K1" title="1"><p class="Joubun">天皇は、国会の指名に基いて、内閣総理大臣を任命する。</p></dd>
<dd class="Kou K2" title="2"><p class="Joubun">天皇は、内閣の指名に基いて、最高裁判所の長たる裁判官を任命する。</p></dd>
</dl>

<dl class="J">
<dt class="Jo">第七条</dt>
<dd class="Kou K1" title="1"><p class="Joubun">天皇は、内閣の助言と承認により、国民のために、左の国事に関する行為を行ふ。</p>
<dl>
<dt class="Go">一</dt>
<dd class="Gou"><p class="Goubun">憲法改正、法律、政令及び条約を公布すること。</p></dd>
<dt class="Go">二</dt>
<dd class="Gou"><p class="Goubun">国会を召集すること。</p></dd>
<dt class="Go">三</dt>
<dd class="Gou"><p class="Goubun">衆議院を解散すること。</p></dd>
<dt class="Go">四</dt>
<dd class="Gou"><p class="Goubun">国会議員の総選挙の施行を公示すること。</p></dd>
<dt class="Go">五</dt>
<dd class="Gou"><p class="Goubun">国務大臣及び法律の定めるその他の官吏の任免並びに全権委任状及び大使及び公使の信任状を認証すること。</p></dd>
<dt class="Go">六</dt>
<dd class="Gou"><p class="Goubun">大赦、特赦、減刑、刑の執行の免除及び復権を認証すること。</p></dd>
<dt class="Go">七</dt>
<dd class="Gou"><p class="Goubun">栄典を授与すること。</p></dd>
<dt class="Go">八</dt>
<dd class="Gou"><p class="Goubun">批准書及び法律の定めるその他の外交文書を認証すること。</p></dd>
<dt class="Go">九</dt>
<dd class="Gou"><p class="Goubun">外国の大使及び公使を接受すること。</p></dd>
<dt class="Go">十</dt>
<dd class="Gou"><p class="Goubun">儀式を行ふこと。</p></dd>
</dl>
</dd>
</dl>

まとめ

個人的には、【マークアップ考察【日本国憲法】資料その4 】あたりが気に入ってますが、【マークアップ考察【日本国憲法】資料その5 】の方が、「条」が dl 要素としてひとつのブロックにまとまっていて、利用しやすそうな気もします。


追加 その1(2003-01-15T03:41:57+09:00)

ああ、やっぱりそうなのですか。落とし穴はありそうな気がしたのですが。DDT's Room:Web Site Watch Jan-2003「法文のマークアップ その3」で、さらなるご意見を頂戴しました。

先の文章[see 法文のマークアップ その2]で,条名を見出しとするのは,号名との整合性がとれませんと書きました。これは,法文の(というか,どんな文章でもそうですが)基本的な構造に対応できないからです。

ということで、民法「第一編 総則」の「第一章 人」の「第二節 能力」の「第十二条」を例に挙げてもらいました。条文は以下の通り。

第十二条

被保佐人カ左ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ

一 元本ヲ領収シ又ハ之ヲ利用スルコト

二 借財又ハ保証ヲ為スコト

三 不動産其他重要ナル財産ニ関スル権利ノ得喪ヲ目的トスル行為ヲ為スコト

四 訴訟行為ヲ為スコト

五 贈与、和解又ハ仲裁契約ヲ為スコト

六 相続ノ承認若クハ放棄又ハ遺産ノ分割ヲ為スコト

七 贈与若クハ遺贈ヲ拒絶シ又ハ負担付ノ贈与若クハ遺贈ヲ受諾スルコト

八 新築、改築、増築又ハ大修繕ヲ為スコト

九 第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト

2 家庭裁判所ハ第十一条本文ニ掲ゲタル者又ハ保佐人若クハ保佐監督人ノ請求ニ因リ被保佐人カ前項ニ掲ケサル行為ヲ為スニモ亦其保佐人ノ同意ヲ得ルコトヲ要スル旨ノ審判ヲ為スコトヲ得但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ

3 保佐人ノ同意ヲ得ルコトヲ要スル行為ニ付キ保佐人ガ被保佐人ノ利益ヲ害スル虞ナキニ拘ラズ同意ヲ為サザルトキハ家庭裁判所ハ被保佐人ノ請求ニ因リ保佐人ノ同意ニ代ハル許可ヲ与フルコトヲ得

4 保佐人ノ同意ヲ得ルコトヲ要スル行為ニシテ其同意又ハ之ニ代ハル許可ヲ得ズシテ為シタルモノハ之ヲ取消スコトヲ得

上記の法文を【マークアップ考察【日本国憲法】資料その4 】の手法に従いマークアップすると、


<h3>第十二条</h3>

<p title="1" class="Kou">被保佐人カ左ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

<h4>一</h4>
<p class="Gou">元本ヲ領収シ又ハ之ヲ利用スルコト</p>

中略

<h4>九</h4>
<p class="Gou">第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト</p>

<p title="2" class="Kou">家庭裁判所ハ第十一条本文ニ掲ゲタル者又ハ保佐人若クハ保佐監督人ノ請求ニ因リ被保佐人カ前項ニ掲ケサル行為ヲ為スニモ亦其保佐人ノ同意ヲ得ルコトヲ要スル旨ノ審判ヲ為スコトヲ得但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

と上記のようになってしまい、DDT氏が仰せの通り、本来「第十二条の第二項」であるべきものが、「第十二条の第一項の第九号」に含まれてしまうのです。これを避けるには、「第二項」が「第九号」より上のレベルであることを明示すれば良いわけですが……。


<div class="Jo">
<h3>第十二条</h3>

<p title="1" class="Kou">被保佐人カ左ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

<div class="Go">
<h4>一</h4>
<p class="Gou">元本ヲ領収シ又ハ之ヲ利用スルコト</p>
</div>

中略

<div class="Go">
<h4>九</h4>
<p class="Gou">第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト</p>
</div>

<p title="2" class="Kou">家庭裁判所ハ第十一条本文ニ掲ゲタル者又ハ保佐人若クハ保佐監督人ノ請求ニ因リ被保佐人カ前項ニ掲ケサル行為ヲ為スニモ亦其保佐人ノ同意ヲ得ルコトヲ要スル旨ノ審判ヲ為スコトヲ得但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

中略

</div>

上記のようにマークアップすれば、各号は h4 要素を含む div 要素の子要素となりますので、h3 要素を含むブロック要素の子要素である「第二項」より下位の要素であることが明白になります。……などとマークアップ出来ないのが、ISO-HTML或いはそれに基づくJIS-HTMLのつらいところで、そうなると「号」を見出しとするのなら、「項」も見出しとしてマークアップする【マークアップ考察【日本国憲法】資料その3】の手法を採用しなければならなくなります。


<h3>第十二条</h3>

<h4>〇1</h4>
<p title="1行" class="Kou">被保佐人カ左ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

<h5>一</h5>
<p class="Gou">元本ヲ領収シ又ハ之ヲ利用スルコト</p>

中略

<h5>九</h5>
<p class="Gou">第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト</p>

<h4>〇2</h4>
<p title="1行" class="Kou">家庭裁判所ハ第十一条本文ニ掲ゲタル者又ハ保佐人若クハ保佐監督人ノ請求ニ因リ被保佐人カ前項ニ掲ケサル行為ヲ為スニモ亦其保佐人ノ同意ヲ得ルコトヲ要スル旨ノ審判ヲ為スコトヲ得但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

つまるところ、ISO-HTMLにおいては、見出しの出現が直後の要素のレベルを左右するので、民法「第一編 総則」の「第一章 人」の「第二節 能力」の「第十二条」のような文章はマークアップしづらい、或いは、この文章の書き方がそもそも間違っている、というような事になります。

もっとも項番が、本来明示されず補助的なものであるとして p 要素の title 属性に記述するならば、号番も明示されずに補助的なものであると考えて、下記のようにするべきなのかもしれません。


<h3>第十二条</h3>

<p title="1" class="Kou">被保佐人カ左ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

<ol class="Go">
<li title="一" class="Gou">元本ヲ領収シ又ハ之ヲ利用スルコト</li>

中略

<li title="九" class="Gou">第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト</li>
</ol>

<p title="2" class="Kou">家庭裁判所ハ第十一条本文ニ掲ゲタル者又ハ保佐人若クハ保佐監督人ノ請求ニ因リ被保佐人カ前項ニ掲ケサル行為ヲ為スニモ亦其保佐人ノ同意ヲ得ルコトヲ要スル旨ノ審判ヲ為スコトヲ得但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

上記のようなマークアップなら、各号は第一項直後の要素として同レベル、或いは ol 要素の子要素なので、下位レベルと見做すことも可能で、妥当かもしれません。

いやいや、飽く迄「項番」を補助的なものとするなら、そもそも、左ニ掲ケタルなんて書くからいけないのであって、「別号ニ掲ケタル」とか書いて、条文の各項が終わってから、別号を記述すればいいんじゃないか、などと条文にケチをつけたくなってきましたよ。


<h3>第十二条</h3>

<p title="1" class="Kou">被保佐人カ左ニ掲ケタル<a href="#12jo-appendix">別号</a>ニ掲ケタル行為ヲ為スニハ其保佐人ノ同意ヲ得ルコトヲ要ス但第九条但書ニ定メタル行為ニ付テハ此限ニ在ラズ</p>

中略

<p title="4" class="Kou">保佐人ノ同意ヲ得ルコトヲ要スル行為ニシテ其同意又ハ之ニ代ハル許可ヲ得ズシテ為シタルモノハ之ヲ取消スコトヲ得</p>

<h4 id="12jo-appendix">別号</h4>
<ol class="Go">
<li title="一" class="Gou">元本ヲ領収シ又ハ之ヲ利用スルコト</li>

中略

<li title="九" class="Gou">第六百二条ニ定メタル期間ヲ超ユル賃貸借ヲ為スコト</li>
</ol>

HTML 文書として見れば、上記でも良いような気はしますが、ただ、印刷物であったりした場合、長い長い各「項」が終わってから「号」が出てきたりすると、頁が跨がってしまったりして、行きつ戻りつが大変なんてこともあるでしょうしねえ……。

で、実際問題として、あまり見出しを使うのも問題があったりして……。

ただ,条以下のマークアップについて,個人的には,見出し要素にしたくない理由があります。というのは,法人税法のように,「第二編第一章第一節第三款第二目」なんてのがあるため。この時点でH6要素まで使ってしまいます(H1要素は法律の題名や法律番号)。H6要素までしかないJIS-HTMLでは,条,項,号までは見出し要素に出来ないわけです。そんな理由で。

なるほど、同一リソースに全文を納めようとすると、見出しが不足する(!)なんて由々しき事態が発生するのです。

そうなると、定義リスト、dl 要素というのは、ISO-HTML(HTML4.01 だって同じですが)にとっては(見出しを使い切った場合も含めて)強い味方で、使い勝手が良かったりするのです。

が、しかし、dl 要素はあまりに応用範囲が広すぎる上に、自由過ぎる要素で、使い方には注意が必要な気もするのです。その子要素の出現順や数量、dt 要素と dd 要素の対応型についても、これといった決まりが無く、記述の仕方を間違えると valid でありながら、意味不明なんてことになりかねない要素なので、ひょっとしたら多用してはならないのかもしれないと思ってたり。

まあ、今どき ISO-HTML だから、と言われれば、それまでなんですが。

ところで、この文書も上の方と下の方では、微妙にマークアップ手法が違っています。つまるところ、それも ISO-HTML だからなんですが(逆に言えば、ISO-HTML でマークアップするには、相応しくない文書構造とも言えるのかなあ)。


付記

書いた人