デジタルアーカイブスタディ

ジャパンサーチ正式版公開!──美術のデジタルアーカイブの利活用に向けて

徳原直子(国立国会図書館 電子情報部 電子情報企画課 次世代システム開発研究室 室長)

2020年12月01日号

2020年8月25日に正式公開されたジャパンサーチは、我が国のさまざまなデジタルアーカイブと連携し、多様なコンテンツを統合的に検索できる「国の分野横断型統合ポータル」である。内閣府知的財産戦略推進事務局が庶務を務める「デジタルアーカイブジャパン推進委員会・実務者検討委員会」の方針のもと、さまざまな機関の協力により、国立国会図書館がシステムを開発・運用している。2020年10月末現在、25連携(つなぎ役)機関を通じて114データベース2100万件以上のメタデータ★1を検索できる。
本稿では、2019年2月に試験版を公開し、このたび正式版公開という節目を迎えたジャパンサーチについて、「柔軟な連携の仕組み」「二次利用条件の整備」「利活用のプラットフォーム」という三つの特徴を柱に、構築の背景や今後の方向性も含めてご紹介する。なお、本稿に含まれる意見等は筆者個人の見解であることをあらかじめお断りしておく。

ジャパンサーチ TOPページ。ヘッダの検索窓が横断検索の入り口

★1──ここでいうメタデータとは、コンテンツの内容、外形、所在等に関する記述データのことで、ミュージアムの収蔵品等の目録データ、文化財の基礎データ、図書館の書誌データ等をいう。


柔軟な連携の仕組み

連携方針

ジャパンサーチの連携方針は、分野・地域コミュニティのつなぎ役(Europeana〔文化遺産のためのEUのデジタルプラットフォーム〕のアグリゲーター、DPLA〔米国デジタル公共図書館〕のハブに相当する機関)を介して、博物館・美術館、図書館、文書館等の各アーカイブ機関★2と連携することを原則としている。例えば、国立国会図書館は、書籍等分野のつなぎ役として、全国の公共・大学図書館等のデジタルアーカイブに対し、国立国会図書館サーチ(NDLサーチ)を介してジャパンサーチとの連携を促進している。

文化財や美術の分野のつなぎ役は複数おり、つなぎ役を介して連携しているデータベースにはさまざまなものがある。国立文化財機構のColBase、国立美術館の所蔵作品総合目録、文化遺産オンライン(いまは国指定文化財等データベースのみ)といった国の機関が運営するもののほか、一般社団法人全国美術館会議をつなぎ役として愛知県美術館、東京富士美術館のデジタルアーカイブとも連携している。また、三重県など自治体の運営する地域アーカイブ経由で連携している博物館等もあり、地域の博物館・美術館との連携も少しずつではあるが、進みつつある。

なお、ジャパンサーチの連携方針では、つなぎ役が不在の分野・地域については、一定の条件を満たせば直接に連携できることになっており、ある程度、柔軟な対応が可能である。ただし、いまは連携依頼が殺到していることもあり、実態としては原則どおり、つなぎ役機関から優先的に連携している。


★2──ここでいうアーカイブ機関とは、広い意味での記録機関全般を指し、社会・文化・学術情報資源のコンテンツを保有する機関ならどこでも対象になりうる。


メタデータ連携の仕組み

ジャパンサーチはコンテンツそのものではなく、メタデータを収集し、その検索・共有・活用を可能にしている。多様なコンテンツのメタデータを扱う工夫として、連携の仕組みは非常にシンプルで、柔軟にしている。連携機関は、オリジナルのメタデータ構造を活かしたままのメタデータ登録が可能である。必須項目はコンテンツを識別するためのIDとタイトル/名称だけであり、ほかは任意項目として、連携機関が登録するオリジナルのメタデータ項目のうち、誰が(人物/団体)、いつ(時間/時代)、どこで(場所)といった分野横断で共通に持つ要素に対して、持っている場合にのみ共通項目ラベルを付与するだけである。これにより、分野を超えて似た要素での串刺し検索が実現している。時間と場所については、ジャパンサーチ側で、和暦に西暦の情報を付加したり、昔の地名をいまの地名でも検索できるようにしたりするなど、データの正規化★3を行なっている。また、海外からのユーザを意識して、共通項目ラベルが付与されたメタデータはローマ字読みへの自動変換を行なっており、登録時に日本語しかないメタデータであってもローマ字検索でヒットできるようにしている。


★3──「開発者向け情報」>「簡易Web API概説」>「6. 正規化機能を利用した検索」を参照のこと。
https://jpsearch.go.jp/static/developer/webapi/#sec6


構築の背景

こうした柔軟な連携の仕組みにしたのは、ジャパンサーチ構想ができる前の取り組みに端を発する。「国の分野横断型統合ポータル」の構築については、2014年頃からEuropeanaやDPLAを意識して、日本の魅力あるコンテンツを紹介する必要性から、(当時は内閣官房)知的財産戦略推進事務局において検討が進められていた。「知的財産推進計画2015」および「知的財産推進計画2016」では、我が国における統合ポータル構築のため、国立国会図書館サーチ(NDLサーチ)と文化遺産オンラインを連携することが掲げられ、2017年3月にはその連携が実現した。その過程で、NDLサーチのメタデータ収集・提供用フォーマットであるDC-NDL(RDF)は、書籍等分野に最適化しているため、文化財分野の重要なメタデータ項目、例えば文化財の指定区分、材質・技法等が適切にマッピングされないといった課題が見えてきた。また、図書館領域以外の方々からは、なぜ「図書館」と名前のあるデータベースと連携しなければならないのか、といった声も聞かれた。こうしたことから、「知的財産推進計画2017」では、新たに国の分野横断型統合ポータルとして「ジャパンサーチ(仮称)」を国立国会図書館が中心となってNDLサーチの知見を活かして開発することとなった。


二次利用条件の整備

どのように利用できるか

ジャパンサーチの目的は、日本の魅力あるコンテンツを紹介し、より活用してもらうことである。そのためには、どのように利用できるかを示す「二次利用条件」をわかりやすく表示することが重要である。

ジャパンサーチでは、メタデータ、サムネイル、デジタルコンテンツのそれぞれについて、二次利用条件を設定・表示できるようにしている。各データベースの紹介ページに記載があり、デジタルコンテンツについては各コンテンツの詳細ページにも記載がある。これらは、いくつか例を見てもらえると、一目瞭然である。

例1:東京富士美術館収蔵品データベースの紹介ページ
例2:ColBaseの紹介ページ
例3:海北友雪「源平合戦図屏風」(東京富士美術館所蔵)の詳細ページ
例4:狩野永徳筆「檜図屏風」(東京国立博物館所蔵)の詳細ページ


例1:東京富士美術館収蔵品データベースの紹介ページ(一部)


例2:ColBaseの紹介ページ(一部)


設定の仕組み

ジャパンサーチでは、データベースの基本情報を登録する際、二次利用条件について、PDMCC BY等のコンテンツの権利区分(15種類の権利表記から選択可能)の設定と、「固有の条件」に表示される自由記入フィールド(htmlタグが利用可能)への入力ができる。権利区分はデータベース単位での一括登録のほか、権利に関するメタデータ項目がある場合は、コンテンツ単位での登録も可能である。

権利区分として設定可能な15種類の権利表記は、「デジタルコンテンツの二次利用条件表示について」で一覧できる。これは、国際的に普及しているライセンスおよびマークを採用したもので、詳しくは、実務者検討委員会が平成31年4月にまとめた「デジタルアーカイブにおける望ましい二次利用条件表示の在り方について(2019年版)」を参照されたい。いわゆるクリエイティブ・コモンズ(CC)ライセンスのほかに、EuropeanaやDPLAがデジタルアーカイブの権利表記のために作成したRights Statementsも参考にしている。

なお、権利区分は、コンテンツの著作権の状態およびその利用条件について、便宜上簡潔に要約して表示したものであり、実際の利用にあたっては、固有の条件に記載されている連携元データベースの利用条件も併せて確認してもらいたい。


オープンな条件で

コンテンツの利活用促進のためには、CC0、CC BYなどオーブンな二次利用条件が望ましい。EuropeanaやDPLAと同様、国際的流通を意識して、ジャパンサーチは、少なくともメタデータに関しては、原則CC0(著作物性のあるものはCC BYでも可)としており、多くの連携機関にご協力いただいている。

また、オープン化を促進するお手伝いとして、ジャパンサーチでは、デジタルコンテンツについてCC0やPDMといった条件を採用したとしても、ユーザに対し、サイトポリシーで所蔵機関などの典拠情報を示すようお願いをしている★4。また、コンテンツの詳細ページには、典拠情報を簡単にコピーできるボタンを設けている。


★4──サイトポリシー「データの利用について」のなかの「(データ利用に当たってのお願い)」を参照のこと。
https://jpsearch.go.jp/policy#185tphq1umpons


利活用のプラットフォーム

APIの提供

ジャパンサーチは、検索だけを目的としたサイトではない。ほかのアプリケーションで利活用できるよう、連携後に収集したメタデータを分野横断の標準形式「ジャパンサーチ利活用スキーマ」に基づきリンクトデータに変換して、API(SPARQLエンドポイント)で提供している。詳しくは、開発者向け情報のページにある利活用スキーマ概説SPARQLエンドポイント解説を参照してほしい。このAPIはジャパンサーチ自身も利用しており、コンテンツの詳細画面で「関連コンテンツ」として同じ作者や同じ時代、同じ場所の作品などを自動表示させている。今後、検索結果のファセットにおいてもこのAPIを利用するべく開発中である。


ギャラリー/マイノート

利活用のためのキュレーション機能として、ジャパンサーチのコンテンツを解説付きで紹介する「ギャラリー」がある。検索しなくてもユーザに楽しんでもらいたいというコンセプトからつくられたものである。ギャラリーでは、解説に加え、検索式の埋め込みも可能となっており、テーマに応じた検索結果を自動表示させることもできる。ギャラリーは、連携機関であれば管理画面上にあるエディタ機能を用いて作成でき、ジャパンサーチ上に自由に公開できる。ギャラリーは現在約200件あり、連携機関の協力を得て、今後も増やしていきたいと考えている。

キュレーション機能で編集され、公開中の「ギャラリー」の例

ユーザ向けのキュレーション機能としては、アカウント登録不要でブラウザに保存される「マイノート」機能を提供している。お気に入りのコンテンツにある♡(ハートマーク)をクリックして自分だけのノートとしてメモと一緒に保存できる。各ノートはエクセルなどの形式で抽出できるほか、ウェブパーツとしてhtml形式で取り出して、自らのホームページに貼り付けることができる。ジャパンサーチの正式版では、マイノートの機能を拡張し、ギャラリーと同レベルの複雑な編集が可能となった。これによりマイノートは、学芸員等の展示企画の検討用メモとしての用途はもちろん、デジタル展覧会そのものの作成にも役立つツールになったと考える。ジャパンサーチ上の資料と一般にウェブ公開されている資料とを一緒に並べて解説を付けることができることも便利になったと言われる。


ワークスペース/プロジェクト

ジャパンサーチ正式版には、「ワークスペース」と「プロジェクト」という利活用のための新たな機能が追加されている。ワークスペースは、ギャラリーやマイノートを共同で同時に編集できる、公園の砂場のようなページである。URLとパスワードを知っている人であれば誰でもアクセスできる。マイノート同様に、html形式等での出力もできる。

一方、プロジェクトは、小さなジャパンサーチの世界を体験できる機能であり、プロジェクト上では、データベースの登録・公開、ギャラリーの作成・公開など、連携機関が利用可能な機能がひと通り使用できる。ただし、プロジェクト上のデータはジャパンサーチ本体の横断検索や一覧表示の対象外となっている。

これらの新機能は連携機関が利用できるほか、ジャパンサーチのお問合せフォームから利用申請し、実務者検討委員会の承認を得れば誰でも利用できる。教育、研究、地域活性化等の目的で活用されることを期待している。すでに教育ではキュレーション授業の一環での利用実績がある★5。研究においては、共同研究ツールとしての活用、地域活性化目的では、地域情報をまとめて発信するためのツールとしての活用が考えられる。

「ワークスペース」の例

★5──大井将生、渡邉英徳「ジャパンサーチを活用したハイブリッド型キュレーション授業:遠隔教育の課題を解決するデジタルアーカイブの活用」(『デジタルアーカイブ学会誌』4巻s1号、2020.10、pp. s69-s72)
https://doi.org/10.24506/jsda.4.s1_s69


サムネイル画像URLと画像検索

連携をご検討中の機関の方には、ひとつお願いがある。連携するメタデータ項目に、「サムネイル画像URL」を含めてほしい。平成30年の改正著作権法により、美術館は、展示する美術と写真の著作物のサムネイルについて権利処理を要することなくウェブ公開することが可能となった。しかし、法律上で可能となってもなかなか美術館界での公開は進まない。だが、サムネイルの有無はデータベースの価値を大きく左右する。サムネイルがないテキストだけのメタデータの場合、その魅力はなかなかユーザに届きにくい。特に教育利用において、小中学生には見向きもされないと聞く。また、サムネイルがあれば、ジャパンサーチの画像検索★6で、類似画像を検索することもでき、楽しむ幅がさらに広がる。

インターネットでヒットしないものは存在しないことになるとも言われる世の中だが、せっかくヒットしたとしても、サムネイルがなければその価値は伝わりにくい。

画像検索の結果例


★6──ジャパンサーチの画像検索では、サムネイルの類似画像を検索できるほか、アップロードした画像と似た特徴をもつサムネイルの検索もできる。


おわりに

昨今のコロナ禍でデジタルアーカイブの価値が高まってきたと言われるが、結局のところ、本物の力、リアルが及ぼす力には、デジタルはかなわないと思う。でも、デジタルがないと、広く伝わらないことも確かである。アーカイブ機関は、リアルとデジタルの良さをそれぞれ活かしたハイブリッドな取り組みが今後は求められていくだろう。ジャパンサーチはそのときにひとつの手段として役に立つものでありたい。

ジャパンサーチの運営方針を決定する、デジタルアーカイブジャパン推進委員会・実務者検討委員会は3カ年の延長が決定され、さらに実務者検討委員会の下位にジャパンサーチWG(ワーキンググループ)が設置された。ジャパンサーチの将来像や課題については、そのWGで検討がなされる予定である。個人的には、GoogleやYahoo!のように、ネット社会での生活の一部としてジャパンサーチがいずれ欠かせないものとなっていくようにならないものか、とひそかな野望を持っている。

  • ジャパンサーチ正式版公開!──美術のデジタルアーカイブの利活用に向けて