2022年05月15日号
次回6月1日更新予定

デジタルアーカイブスタディ

夢の電子図書館へ──「大規模デジタル化事業」
国立国会図書館長 長尾真

影山幸一

2011年12月01日号

資料デジタル化の手引2011年版について

8月に「国立国会図書館 資料デジタル化の手引2011年版」を公開しました。所蔵資料を画像としてデジタル化する際の仕様を共通化し、技術を共有することを目的に製作された「手引2005年版」を最新化したこの「手引 2011年版」を発行した目的は何でしょうか。

長尾──「手引2005年版」から6年が経ち技術が進んだこともあり、「手引 2011年版」では新技術や大規模デジタル化によって得た知見を反映させ、プロセスもよりわかりやすく詳細化しました。仕様の共通化や技術の標準化を図り、それによりデータ品質の確保及びデジタル化作業の効率化に資することを目的にしています。当面全国の図書館がデジタル化作業を行なうときに、参考にしていただけると思っています。

一般図書と貴重書のデジタル化方法は異なるのではないかと思いますが、「手引 2011年版」では資料別にはデジタル方法の詳細は書かれていません。「手引 2011年版」に関する質問は、どこへ問い合わせをすればいいのでしょうか。

長尾──関西館電子図書館課に問い合わせをしてもらえれば回答できます。

「手引 2011年版」によると、デジタル画像のフォーマットは、TIFFのほかJPEG2000を推奨しているようですが、誰がどのようなプロセスを経てこのように決定したのでしょうか。

長尾──関西館電子図書館課が「手引 2011年版」を扱っており、そこで技術資料を収集し、比較検討のうえ決定しました。画像解像度の400dpiについても検討しました。個人的には将来的に精細度が足りないと思っています。600dpi〜800dpiにすればあと20年くらいは持つかもしれません。400dpiは中途半端と思いますが、分解能を上げるとメモリを極端に増やさねばならないため、予算などが関わってきて妥協せざるをえない状況です。

図書資料では画像のアーカイブからテキストアーカイブへ、というのが本筋だと思いますが、日本語の文字をアーカイブするという視点から、デジタル側で認識できないフォントや旧漢字などは、どのようにテキストアーカイブしていけばよいのでしょうか。

長尾──そこは大きな課題です。OCR(文字読み取り装置)で文字化する実験をやりました。戦後の活字だとある程度テキスト化していけるが、戦前の活字の場合、しかもルビが振ってある場合もあるので、今の段階では60%くらいしか認識できなかったと思います。それを90%にもってくるためには、OCRを旧字体に対応できるように改良しなくてはいけません。まずその方向です。手で打ち込むことはとてもできない。それと、戦後の漢字でも小説家などは、特殊な難しい漢字を使うので、それらをどうするかという課題が残っています。今のOCR可読文字6,000文字だと間に合わず、10,000文字くらいまで文字を増やさないといけない可能性がありますし、個別対応せざるをえないかもしれない。そして端末装置側で、それをうまく再生できるか、これはもうどうしようもないですね。
 また、詩や俳句などの改行、行間、余白。著者物によって1ページのレイアウトが問題になってきます。この場合の文字の散りばめ方の意味をどうするか。これは難しい。電子化して文字化してしまうと、ページという概念は放棄せざるをえない面があります。しかしページを大切にしろという本の場合は、それに従わざるをえない。

デジタルアーカイブを提供する側として、デジタルアーカイブを利用するユーザー(国民)の声は、どのように聞いているのでしょうか。また、それをどのように現場へフィードバック(反映)させているのでしょうか。

長尾──大規模デジタル化事業の前に、一部について商業出版社との調整は行ないましたが、原則としてデジタル化する本としない本の判断はできるだけしない、ということで進めました。1968年までの図書はほとんどデジタル化しています。

美術関連について

現在、長尾館長は陶芸と書道を習っていらっしゃるそうです。また大学生時代、IBMのFORTRANのプログラミング言語が美しくない(エレガントでない)と著書に書かれています。長尾館長にとって「美しい」とはどのようなことなのでしょうか。

長尾──京都大学の総長をしていたときに、入学式や卒業式などで訓示ではないのですがいろいろ話をしました。これを別途にひとつの本(『学術無窮 大学の変革期を過ごして 1997-2003』)にまとめて出しています。そこのひとつに真・善・美について論じたものがあります。学問は真を追究するが、その真の追究の裏打ちとして善が付いていなければだめだ。善という価値を持たないかたちで、真を追求する学問は、よくないのではないか、と言いました。しかしそれを超えて、人間に取って本当に大事なのは、美ではないか。美の感覚が最も大事なのではないかという話をしました。
 数学の定理にしろ、物理学の法則にしろ、本当にすごい法則というのは、美的です。スカッとしていて誰でも直感的にわかるような内容であるし、それが普遍的に通じることがあります。新しい法則を打ち立てるような数学者は、ほとんどが論理的というより、美的直感からやっている人が多い。そういう意味でも、学問を志す人は、真も追究するが、善やその上の美というものの持つ価値を認識することが必要です。これは人間の根源、原動力にあるものと思います。真は理屈の世界、善は心の世界であるのに対して、美は生命力の世界という気がします。

大学の助手になってすぐの1962年に初めて外国へ行った際、1カ月間のヨーロッパ滞在期間中に各国美術館を訪れ、「画集で見ていた作品と実際の作品の迫力が違っていた」と、自伝に書かれていますが、どのように違っていたのですか。

長尾──音楽のレコードなどは家で聴きますが、本物の音楽は教会で聴く。絵も実物を美術館などで見ると、それは美術全集とは異なり大きさや色彩など、いわば生の情報、力がこちらにぶつかってくる。そういう意味において、まったく次元が違います。身体全体で直接作品を受け止めるというのがレコードや複製とは根本的に違うところです。ヨーロッパという風土で生まれ、そこで結実しているものを、その場で見たり、聴いたりすることのインパクトは大きい。ですから日本の水墨画や襖絵などは、ヨーロッパの美術館に展示して見るよりも、日本のお寺で見るほうがいいと思います。

そうしますとデジタル化した絵画などは、実物には及ばないということでしょうか。

長尾──そうですね。ただ細かいことはデジタル画像を入念にみることでいろんなことがわかります。例えばレオナルド・ダ・ヴィンチの《最後の晩餐》のデジタル画像は、遠くからの肉眼では見えないようなところまで見えるという利点はあります。

パブロ・ピカソの《ゲルニカ》(1937, 国立ソフィア王妃芸術センター蔵)に感動されたようですが、長尾館長の好きな美術家、作品を教えて下さい。

長尾──ピカソは抜群の天才だと思います。特にデッサンが優れています。顔の輪郭線など、線の質が他の作家とは違っています。ルオーなども好きです。

館長のお嬢さんの長尾宣子さん(1970〜2008)は画家だったそうですが、画家としての活動をどのようにご覧なっていたのですか。作品に家族の食事の様子をレインボーカラーでシュールに描いた《今日もごちそうであるために》(図参照)があります。作品を見ての感想をお聞かせ下さい。

長尾──自分の娘のことは、なかなか客観的になれないから何とも言い難いです(笑)。まあ、面白い絵ではあると思います。


長尾宣子《今日もごちそうであるために》2008, 油彩,約 160×260cm, 長尾氏所蔵
無許可転載・転用を禁止

展覧会の図録など、いわゆる灰色文献★2のデジタル化については、どのようにお考えでしょうか。専門図書館がデジタル化を行ない、インターネットで連携していくという考え方でしょうか。

長尾──図録を国立国会図書館でも集めるようにしています。国立国会図書館には納本制度があり、納めてもらった本をきちんと保管するという、原則があります。図録を納入することを理解してくれている方はいいのですが、それを知らない人は納本してくれないわけです。送られてこないものについては「1冊送って下さい」と連絡しています。展覧会が日本中あらゆるところで開催されており、すべてを把握できないので、わかる範囲で集めています。人的余裕がないので、灰色文献は手薄になります。こういうものは美術館と両方で集めていてもいいものです。今のところ美術館と、連絡調整はしていないのですが。ほかにも各種の報告書類など、集めにくいものがいろいろとあります。

★2──灰色文献とは、一般に流通していない出版物。

長尾館長は、コピー&ペーストを積極的に奨励されているようですが。

長尾──コピー&ペーストを積極的に奨励しているわけではありません。コピー&ペーストはけしからん、という人が多いのですが、排除するのは行き過ぎではないかというのが私の考え方です。自分の考えている内容を文章に表現するとき、そこに部品としていろんなものを持ってくる。そういうかたちで先人の書いたことや、研究成果などをうまく持ち込んで、自分の言いたいことや表現に組み込む。こういう場合はコピー&ペーストを利用してもいいのではないか。編集工学的な、つまり編集する能力が問われているわけです。今日の学問の場合、ほとんどが先人の成果を取り込んで、自分の意見をそのなかにちりばめるという感じになっている。多くの学者や評論家は、人のアイデアをコピーして、自分の文章にして書いているのであって、自分の考え方に人のアイデアをうまく埋め込んでいるという意味においては、考え方のコピー&ペーストをしている。学生はそのへんが下手だから、じかにコピー&ペーストをして先生に叱られています(笑)。

日本の思想や文化は、デジタルネットワークによって、世界にどのように貢献できると思われますか。

長尾──たとえば、江戸期の浮世絵や俳句などは、ヨーロッパでものすごく流行っています。もっともっと日本の文化・芸術やものの考え方を諸外国に知ってもらう努力をする必要があると思います。これからは限られた地球の中に、60億〜70億、将来は100億人を超す人間が住まなければならないことになる。日本人は小さな国に多くの人が住み、共存共栄していくためのノウハウを江戸時代から蓄積してきたわけですが、これからは日本がやってきたこのような慣習や、ものの考え方を世界で活かすべきだし、また必要なことだと思っています。そのひとつは寛容の精神です。今は弱肉強食のような世界ですが、それではものごとは解決しない、とそろそろわかってもいいが、なかなかわかってくれない。もう少し寛容の精神を世界中がわかる必要があるわけでして、デジタルアーカイブは日本がもつそのようなノウハウを伝えるツールのひとつと考えられるのです。
 今、ユネスコが主導して各国の文化遺産のデジタル資料を集めて、「ワールド・デジタル・ライブラリー」をやっています。当館もいろいろと出していますが、各国の文化的、歴史的背景を他の国の人たちが、デジタルなライブラリーを通じて知る。これは文化の世界で、精神性の世界まではまだ行っていません。だからそれをもっと進める必要がありますが、まず言語の壁を乗り越えた世界をつくらないといけませんね。

日本の美術は、そこに貢献できそうな気がしますが、いかがでしょうか。

長尾──そうだろうと思います。

日本の知識インフラ整備を推進していくうえで、国立国会図書館と美術館の連携で具体的に進んでいる事業や予定があれば教えて下さい。

長尾──具体的には今のところまだありません。話し合いの場をつくってやりつつあるのですが、これからです。

  • 夢の電子図書館へ──「大規模デジタル化事業」
    国立国会図書館長 長尾真

文字の大きさ