ビジネスお役立ち情報 > ITトレンドWatch

ITトレンドWatchITトレンドWatch 私たちの生活の様々な分野で活用されるITについて最新情報をお届けします。

ITトレンドWatch のトップへ

文書をより活用するための「XML」
Office 2007とWindows Vistaの新展開

Office 2007は既に多くの方が使っているだろう。実はこのバージョンからファイル形式が「XML」をベースとしたものとなり、Wordの拡張子が「.doc」から「.docx」となっているようにXMLを表している。また、読み取り用ファイル形式のXPSも登場しているが、これらはどのように扱われていくのだろうか。

テキスト情報に文書の構造を与える
ファイル形式「XML」の意味と歴史

「XML(Extensible Markup Language)」は、Webサイトでよく用いられている「HTML(Hyper Text Markup Language)」と同じように、文書やデータの意味や構造を記述するためのマークアップ言語の1つである。そもそもマークアップ言語とは「タグ」と呼ばれる特定の文字列で地の文に構造を埋め込んでいく言語のことをいう。

マークアップ言語によるタグ付け

HTMLなどWebに関わる仕様の協議・勧告などを行っている団体「W3C(World Wide Web Consortium)」は、インターネットの発展のためにHTMLの初期バージョンを1994年に標準化した。HTMLはWebページにおいてテキストや画像などのコンテンツを表示するために作成された言語であり、その点については優れている。しかし、目的のために特化されたため、コンテンツのデータ管理の点においては適していないことが課題となっていた。インターネットの広まりと共にコンテンツの量は増え続け、解決策が必要となったためだ。

HTML自体も改良が加えられたが、ついにデータ管理も可能で、HTML並みに記述も容易なマークアップ言語としてXMLが1998年に制定された。その後、XML関連の仕様が次々と登場、XMLの構造を定義する「XML Schema」や、XMLを別の表示形式に変換する「XSLT(XML Stylesheet Language Transformations)」などはXMLを補完し、その利便性を高めている。

ほかにも、XMLで定義されたグラフィックを扱う「SVG」や数式を扱う「MathML」、マルチメディアを扱う「SMILE」、また通信上のデータのやり取りを定めた「SOAP」など、XMLを中心として定義された仕様は多い。なお、XMLはユーザが独自のタグを指定してデータを管理できることから、マークアップ言語を作成するためのメタ言語ともいわれている。その特徴、メリットをまとめてみると次のようになる。

  • テキストファイルとして記述できる
    XMLはテキスト形式のファイルに記述する。テキストファイルは保存情報が文字だけなので、その他のデータファイルなどと比べてOSの種類を選ばず、容易に扱えるという利点がある。
  • タグの定義を自由にすることができる
    HTMLではタグの定義は決められており、限られたタグの意味や使用法が固定されていた。XMLではタグの定義は自由であり、柔軟性が向上している。
  • データ構造を表現することができる
    XML文書では、HTMLのように書式やレイアウトを設定するタグはなく、データとデータに関する情報を定義したタグを使用する。そのためXMLで記述するとデータの意味・構造が非常に明解となる。
  • 世界標準である
    XMLの記述ルールなどの仕様は、W3Cによって誰もが同じ使い方ができるように決められて公開されている。この仕様は話し合いにより、すべての疑問や反対意見などに答えて十分に検討され、最終的に内外の支持が十分に得られたと判断されてから勧告に至る。この話し合いは常に続けられ、現在もXMLに関する仕様の標準化に向けて努力が行われている。

オープンなXML形式をベースに刷新された
2007 Microsoft Office systemの目的

「2007 Microsoft Office system(以下Office 2007)」では、実に10年ぶりにファイルフォーマットが大幅に変更された。Office 2007に導入されたファイルフォーマットには「Microsoft Office Open XML Formats(OOXMLまたはOpenXML。以下OpenXML)」という名前が付いている。このOpenXMLはXMLベースのファイル形式で、仕様が一般に公開されている。

マイクロソフトはOpenXMLを国際的な標準化規格とする努力を続けてきており、この結果、OpenXMLは2006年12月に「ECMA-376」として欧州の「ECMA International」の標準規格となり、2008年4月には「ISO(International Organization for Standardization)」標準規格としての承認を得ている。

従来の97-2003形式はマイクロソフト独自のバイナリフォーマットであり、他社製のソフトなど第三者が直接読み書きすることは難しかったが、OpenXMLではこれが広く可能になった。なお、Office 2007には複数のアプリケーションが含まれるが、新しいOpen XML形式のファイルフォーマットに対応しているのは「Word 2007(拡張子.docx)」「Excel 2007(拡張子.xlsx)」「PowerPoint 2007(拡張子.pptx)」の3つである。「Outlook 2007」などは従来のファイルフォーマットをそのまま使用している。

なお、このXML形式ファイルの実体はZIP形式で複数のファイルを圧縮したものだ。例えば、Excel 2007で保存した「.xlsx」形式の文書ファイルを1つ用意して、拡張子を「.zip」に変更してみよう。ZIP形式のアーカイブとして表示され、開くことができるはずだ。内容を見てみると、複数のXML文書がパッケージングされていることが分かる。これらのXML文書によって1つのファイルが構成されているのだ。

Office 2007でXML形式を採用したメリットは大きい。XML形式ではデータがタグで区切られ定義されているのが大きな特徴だが、WordやExcel、PowerPointは同じように共通のタグでデータを管理している。つまり、WordからExcelのデータを利用するといったアプリケーション間でのやり取りがこれまで以上にスムーズになり、さらに実体がテキストファイルなので、マクロなどのプログラムからの操作でも自由度が大きくなっている。例えば、フォルダ内に保存されているすべてのブックについて、ヘッダ情報だけを一括置換するなどといった作業も可能になる。

Excel 2007ではワークシートの大きさも広がった。また、条件付き書式で設定できる条件の数にも制限がなくなった。こうした仕様の拡張も、XML形式の恩恵によるところが大きい。従来のエクセルファイルはExcel 97で採用されたファイル形式を使用していたため、記録できる情報量に限度があった。ワークシートの大きさを広げてほしいというユーザのニーズは何年も前から数多く寄せられていたが、仕様を拡張するには新しいファイル形式を採用しなければならない。ファイル形式が変われば、古いバージョンとの互換性が問題になる。マイクロソフトが長年ファイル形式を変更しなかったのは、そうしたトラブルを避けるためだったといえる。

Office 2007と2003の互換トラブル解決法

Office 2007で採用されたOpenXML形式と、Office 2003までの独自バイナリフォーマットの間には互換性がない。新しいOffice 2007では従来の97-2003形式でもファイルの作成や編集ができるため問題はないが、OpenXML形式の文書をOffice 2003以前のバージョンで開こうとした場合には何らかの対策が必要となる。

マイクロソフトでは旧バージョンのOfficeでもOpenXML形式のファイルを開けるように、無償の追加モジュール「Office互換機能パック」を配布している。これを追加インストールしておけば、Officeバージョンの新旧に関わらずファイルを取り扱うことができる。

XMLの採用で登場した「XPS」
Windows Vistaが狙うフォーマット展開

Windows Vistaでは、Internet Explorer 7(IE7)でのXML対応や、サイドバーの「ガジェット」におけるXMLの採用、グループ・ポリシー・テンプレートのXML採用など、さまざまな部分でXMLの導入が進んでいる。一般的な使い方ではそれらの存在を気にすることはまずないだろう。ただし「XPS」というフォーマットについては、今後大きく注目される可能性が高いので、ぜひ紹介しておきたい。

XPSは「XML Paper Specification」の略である。画面上の内容やレイアウト結果をこのフォーマットで保存すると、電子ペーパーおよび電子データとしての使用や、印刷へと用いることができる。もちろんオンラインで見ることもできる。AdobeのPDFに似た、環境非依存の文書フォーマットと説明するのが分かりやすいかもしれない。

いったんXPSフォーマットに変換すると、Office 2007や特定のアプリケーションがない場合でも「Microsoft XPS Viewer」という閲覧用ソフトウェアを使ってドキュメントを見ることができる。このソフトウェアは無償で使うことができ、Windows XPやWindows Server 2003でも提供されている。なお、Windows VistaではIE7上でドキュメントを閲覧できるようにもなっている。またOffice 2007では、インストールした後に無料プログラム「PDF/XPS保存アドイン」をダウンロードすることで利用できる。

XPSで利用されるタグなどの書式は、Windows Vistaで採用されている画面描画エンジン「WPF(Windows Presentation Foundation)」の一部である「XAML(Extensible Application Markup Language)」の縮小版となっており、Windowsアプリケーションの描画命令などをそのまま利用することができる。従来のWindowsのGDIという仕組みでは、色ごとに8ビット階調までしかないという制限や、印刷上のレイアウトに制約があったが、Windows Vistaではこれらの制約をなくし、印刷機能も大きく改善されている。

マイクロソフトではXPSの仕様を公開しており、XPSを利用するアプリケーションが誰でも自由に開発することができるようになっている。デジタルやアナログ、OSの違いなどに依存しない次世代の文書フォーマットとして積極的に普及を狙っている。

(掲載:2009年2月)

企業のITセキュリティ講座