デジタルアーカイブスタディ
夢の電子図書館へ──「大規模デジタル化事業」
国立国会図書館長 長尾真
影山幸一
2011年12月01日号
「デジタルアーカイブ」は日本で誕生した造語であるが、その源流は電子版アレクサンドリア図書館にあった。このデジタルアーカイブが生まれた1990年半ば、京都大学教授、情報工学者である長尾真氏は「アリアドネ 」という電子図書館構想を発表していた。その長尾氏が京大総長を経て、2007年に当時衆議院議長の河野洋平氏の意向により国立国会図書館長に就任。2009年度127億円というかつてない高額予算のデジタルアーカイブ事業「大規模デジタル化事業」を実施、今年8月には「国立国会図書館 資料デジタル化の手引2011年版」を発行した。「アリアドネ」から17年を経て、現実に電子図書館に着手し、この大規模デジタル化事業を終えた現在の感想など、デジタルアーカイブに関することとともに、美術についても伺いたいと思いが募った。「知識は我らを豊かにする」というテーマを掲げ、精力的に知識インフラ整備を推進する長尾国立国会図書館長に、東京本館にて、「大規模デジタル化事業」「資料デジタル化の手引2011年版」「美術関連」「その他」について、インタビューに答えていただいた。
大規模デジタル化事業について
2007年に長尾さんが館長に就任してからの国立国会図書館の変化に驚いています。2009年5月から2011年7月の2年間で約127億円をかけ、約100万冊に及ぶ最大規模のデジタルアーカイブ事業を実施してきた今の感想をお聞かせ下さい。
長尾──2年間デジタル化をやってきまして、過去のものと併せると全部で約210万冊の資料をデジタル化しました。本で言いますと、1968年までの図書。雑誌は12,000タイトルの創刊号から2000年までの雑誌。古典籍は蔵書数約30万冊のうち約7万冊。その他、博士論文約39万冊のうち1991年から2000年の約14万冊。実際に持っている資料は約3,700万点、そのうちデジタル化すべき資料は950万冊ですから、まだ5分の1しかできていません。しかし、雑誌は特に、掲載されている論文のタイトルや著者などから検索することが可能で、細かいところまで調べていけるので、非常に面白い内容だと思っています。インターネットでは、著作権の切れた資料や、著作権処理を終えたもの、許諾が得られたものは公開されますが、それ以外は国立国会図書館内でしか見ることができません。今の段階では残念ながらしょうがないですね。
図書館のシステムが、このように大きな情報システムになって、2012年の1月には新たなシステムに入れ替えるように準備しています。すべての館内端末からOPAC検索で書誌情報を知ることも、デジタル化した資料も、古い貴重書画像も見ることができます。
こうしてアメリカやイギリスの図書館と比較しても負けないくらいの内容になってきましたが、新しい資料はデジタル化できていません。雑誌についても最近の論調に多くの人が関心をもつと思いますが、まだできていません。古い歴史や古い来歴を調べるには非常にいいのですが、過去10〜20年くらいの間にどういうことが起こってきているかなど調べるには、まだ不足です。
平成21年6月の著作権法改正により、国立国会図書館においては資料保存のために著作権者の許諾を得なくてもすべての本をデジタル化できることになっていますので、やろうと思えばやれます。ただ、今の日本の財政状況ではなかなか難しい。
世界レベルで遜色のないデジタル化に近づいたかなぁ、という気はしますが、これではまだまだ不十分、やるべきことは多いです。またデジタル化したとはいえ、テキストとしてではなく、画像としてデジタル化しただけで、文字化できていないのは大きな問題点です。文字化ができると、視覚障害者等の方々にも役に立ちます。文字を拡大して読めるとか、音声で聞けるとかが可能になりますから、それを是非推進したい。
長尾館長は「デジタルアーカイブ」を、どのようにとらえているのですか。
長尾──デジタルアーカイブの第一段階というのは、すべての書物を文字レベルでデジタル化し、コンピュータに格納、そして誰でも利用できるようにすることです。第二段階としては、例えば「この本を読むのならこちらの本も読んだ方がいいですよ」とか、「こんないい本がありますよ」といった本と本、あるいは雑誌論文との相互関係を明らかにすることが必要になります。また、本や雑誌論文などには参考図書や引用文献が巻末にたくさん書かれていますが、これにリンクを付けて自動的に取り出せるようにしたい。要するにコンピュータに入れた知識同志の相互関係をうまく組織化し、関連するものを自由に引っ張り出せるようにする。今までの図書館は、本に手で分類番号を付けて同じような内容の本を集めて活用していたが、できるだけ自動化し、関連する資料を自由に取り出せるようなかたちにする。Wikipediaなどはある部分をクリックすると、関連する項目へ飛んで行きますが、あれの図書館版。『電子図書館』のなかに書いておきましたが、世界的にまだどこもやっていず、これからやるべきことではないかと思っています。
大規模デジタル化事業を行なう業者は、どのように選択したのですか。
長尾──国立国会図書館がスペックを書き、公募しました。国のお金を使うときは、公開入札で業者を決めないといけない。多数の企業がデジタル化作業に参加しています。
その企業が将来なくなった場合は、どのようにフォローするのでしょうか。
長尾──デジタル化作業の手順書に従って企業には作業を実施してもらったし、その品質管理もきっちりやったので、納入された品物のメンテナンスなど、特定の企業に依存しなくてもできます。
デジタルアーカイブのデータは、どのように保存しているのですか。
長尾──関西館の電子図書館課で、サーバとそのバックアップによってデータの保存管理を行なっています。実際のサーバ管理作業については、保存用データは関西館で保存。提供用データはデジタルアーカイブシステムのハードにあり、ハードの運用保守業者は、全部で3社に依頼してやってもらっていると思います。図書館内部だけでは、データベースのメンテナンスや、ハードウェアの運用をするのは不可能なので業者に委託して管理してもらっています。