XML文書の基本的な構成
XML宣言
a)意味するもの
- そのXML文書が準拠するXML規格のバージョン
- この文書で使用する文字コード
DTD(Document Type Definition)
a)意味するもの
- 文書を記述する際、その文書中でどのような タグや属性が使われているかを定義したもの。
b)備考
- XML文書の中に含めてもよいし、外部ファイルにしておいて、XML文書の中から参照してもよい。
- 省略可能
- XML本体がDTDに違反するデータ構造をしていると、XMLパーサがエラーを吐いてくれる。
- HTMLにもDTDがある。
エンティティ
a)意味するもの
- XML文書内で何度も出てくる文字列は、変数として記述しておき、後から一括して変換する仕組み
- 大きな文書を手分けして作成する場合、章ごとに別々のXML文書にしておき、メインのXML文書がそれらを参照することもできる。
- エンティティ(entity:実体)=別ファイルのXML文書であったり、DTDの中で宣言された文字列であったり、イメージデータファイルであったりする。
b)備考
- エンティティ参照=エンティティ名を“&”と“;”で囲んで記述する。
- あらかじめ定義されているエンティティがある。
- C言語のプリプロセッサに似ている気がする。
XML本体
a)意味するもの
- タグ付けされた実際のデータ
b)備考
- 省略できない(当たり前だが)
- XMLのデータモデルでは、XML文書をツリー構造(=XML文書を構成する各パーツ(=要素)には親子関係がある)としてとらえる。
データ
- 要素(element)=開始タグから終了タグまでを指す。(タグの部分を含む)
- 要素名=タグの中に書かれた名前。開始タグと終了タグの中には必ずこの名前が記述される。
- ルート要素=最上位の要素。これ以外の要素はすべてルート要素に包含されることになる。
- 属性(attribute)=属性名に対し、属性値を与えられる。属性値には数字、文字の両方が受け取れる。要素は、複数の属性を持つことができる。ある要素の特性や性質を表現するために存在するが、特性や性質を決める絶対的な基準はない。よって、属性ではなく要素として表現してもかまわない。
- 空要素(empty element)=開始タグと終了タグに挟み込まれる内容がないもの。簡略して記述できる。
- コメント=無視される文章。覚書や説明文を記述しておくために存在する。