ボーン・デジタルの情報学

第1回:生まれながらのデジタル情報

大向一輝(国立情報学研究所・総合研究大学院大学助教)2009年09月01日号

 twitterでつぶやく 

 今月より大向一輝氏による新連載がはじまります。テーマは、情報のデジタル化とアーカイビングについて。ボーン・デジタルとはなにか? あらたなデジタル形態はなにをもらたすのか? 2009年8月より1年にわたり、全6回の隔月連載です。[artscape編集部]

はじめに

 筆者はここ数年、所属している国立情報学研究所での仕事として、学術論文を収集し、検索機能を提供する「CiNii(サイニィ)」というサービスの設計・開発に携わっている。
 今回、artscapeにおいてデジタル・アーカイブに関する連載を行なうことになったのは、このCiNiiの活動が編集の方の目に留まったからだそうだ。しかしながら、最初に依頼をいただいた際にはあまりピンと来なかったというのが正直なところである。というのも、自分の仕事が「デジタル・アーカイブ」という言葉から想像されるものとはかけ離れている、と感じたからである。
 一方で、CiNiiの機能を見れば(詳細については次回以降で触れる予定である)、デジタル・アーカイブとして必要な諸条件は満たされており、これがデジタル・アーカイブではないと断言できるほどの明白な何かがあるわけではない。けれども、何かが違う。もちろん、筆者自身のデジタル・アーカイブに対する理解が表層的あるいは古典的なものに留まっている可能性は否定できないが、まずはその違和感から話を始めてみたい。

デジタル・アーカイブの因数分解

 違和感のありかを探るために、また読者のみなさんと少しでも違和感を共有するために、最初の一歩としてデジタル・アーカイブの定義について考えてみる。まず、デジタル・アーカイブを「デジタル化されたアーカイブ」と読み替えるのはそう不自然なことではないだろう。次に、デジタル化とアーカイブを切り離し、後者を辞書を調べると「人々・組織などについて記述された歴史的な資料群、またはそれらを保存する場所」とある。ここで、アーカイブの基本的な定義は「貴重な資料を収集すること、散逸や劣化を防ぐこと」であることが理解できる。
 この理解を下敷きとして「デジタル化」と「アーカイブ」をつなぎ合わせると、デジタル・アーカイブは「資料群をコンピュータで扱える形式に変換すること、そしてそのような資料を集積する場所をコンピュータ・ネットワーク上に設けること」と定義することができる。デジタル化された資料を格納するために必要な物理的空間はほとんどゼロに等しい。また、デジタル化を施すことに よって経年変化などを考慮することなくあゆる種類の資料を半永久的に保存できるようになる。その意味で、「アーカイブ」と「デジタル化」の親和性は非常に高いと言える。
 デジタル化はアーカイブの保存機能を強化するだけではなく、定常的な資料の公開という新たな展開を生み出した。デジタル化された資料は原本とは切り離されたかたちで存在しており、一般公開や専門家に対する情報提供を容易にしている。ここでは、大規模かつ継続的に提供されている例として、国立国会図書館の「近代デジタルライブラリー」を挙げる[図1]。近代デジタルライブラリーでは、明治・大正時代の書籍約148,000冊の全ページをスキャンし、画像データとして閲覧することができる。

 1──近代デジタルライブラリー

 このようなサービスはデジタル・アーカイブに対する一般的なイメージを見事に体現している。また、国立国会図書館では今年度100億円を超える予算をデジタル化に投じることが決定し、話題になったのは記憶に新しい。無論、国立国会図書館に限らず、デジタル・アーカイブの構築・整備は今後も活発に進められていくことは間違いない。
 こういった流れの一方で、筆者には「デジタル化されたアーカイブ」だけがデジタル・アーカイブのすべてなのだろうかという疑問がある。「デジタル化」という言葉自体に原本が非デジタルの物体であることが暗黙的に語られている。アーカイブの対象となるのはそういった資料に限られているの ろうか? 純粋なデジタル情報からなるアーカイブは存在しえないのだろうか?

ボーン・デジタル

 現時点でウェブに流通している情報のなかで、現実世界に存在する資料をデジタル化したものの割合はそう多くない。ほとんどは、つくられた時にすでにデジタルの形態をとっているという情報である。これを「ボーン・デジタル(Born-digital)」な情報と呼ぶ。直訳すれば「生まれながらのデジタル情報」というところであろうか。
 ボーン・デジタルな情報が生まれた背景には、コンピュータを用いたコンテンツ制作環境の整備がある。古くはDTP・DTM・DTVという言葉に代表されるように、以前からパソコンの主な利用目的はデジタル情報をつくることであったし、デジカメや携帯電話もまたデジタル情報を生み出すためのデバイスとして完全に普及した。
 また、ボーン・デジタルな情報を誰もが配信し、受信することができるインフラが急速に普及している。ブログやソーシャルネットワーキングサービスのように、テキストベースのコミュニケーション様式が定着したのをはじめとして、画像共有、映像共有サービスを通じて参加者同士がコラボレーションを行なう事例も見られる。
 これらは、コンテンツ制作の敷居が低くなったこと、また制作物を鑑賞する観衆の多くなったことが相まって活発化しているものと思われるが、一方で最終的に生まれた作品がアーカイブとして適切に管理されているとは言い難い。
 そもそも、ボーン・デジタルな情報には、「デジタル化されたアーカイブ」の成立の要件であった、保存の困難さに関する問題が存在しない。コンテンツがウェブ上のどこかにあれ、検索エンジンやユーザによって確実に発見されるというある種の楽観論は、今日のウェブの発展を支えてきた重要な原動力であるが、そこには過去から現在にわたって積み上げられてきたアーカイビングの知見は活かされていない。
 ボーン・デジタル時代のアーカイブを考えるにあたっては、先に述べた「貴重な資料を収集すること、散逸や劣化を防ぐこと」から離れ、より積極的な存在意義が必要になる。筆者としては、ユーザ参加型ウェブサービスの成功を鑑み、興味・関心を同じくする人々のアテンションを集める場としてのアーカイブを考えていきたい。

 このような、ユーザ中心のデジタル・アーカイブをどのように設計すべきだろうか? 本連載では、先行事例として、筆者が関わる学術情報の世界を紹介していく。学術分野においては、研究者はアーカイブを活用し、また自身の成果をアーカイブに加えることが死活的に重要である。それと同時に、アーカイブをつくる側からも研究者のどういった活動を支援するかが常に問われており、ここでの試行錯誤の過程で得られた知見は他分野のアーカイブ設計にも役立つものと思われる。
 次回以降は、学術分野におけるアーカイブの設計や周辺技術について概説する予定である。

▲ページの先頭へ

大向一輝

1977年京都生まれ。国立情報学研究所准教授。博士(情報学)。2005年総合研究大学院大学博士課程修了。セマンティックウェブやソーシャルメデ...

2009年09月01日号の
ボーン・デジタルの情報学

  • 第1回:生まれながらのデジタル情報