artscapeでは、開設以来30年のあいだに公開された記事の大半をアーカイブのページから読むことができます。そこからは取り上げられた日本のアートシーンという内容だけでなく、構成要素や図版の用い方、コーナー、UIの変遷など、メディアとしての変遷、インターネットそのものの進化の歴史がうかがえます。映像ワークショップ合同会社代表でアーキビスト/キュレーターの明貫紘子さんと、同社所属で編集者/ライターの坂本のどかさんに、artscape全記事のアーカイブをメタデータとして読む、その可能性を探っていただきました。(artscape編集部)


※artscapeの過去記事のアーカイブはこちら
※30周年記念企画 記事一覧はこちら

メタデータは地図である。
メタデータとは、ある対象の複雑さを
シンプルな形で表現するための手段である。
★1
ジェフリー・ポメランツ


artscapeのメタデータ

artscapeは、前身の「 nmp(ネットワーク・ミュージアム&マガジン・プロジェクト)」が1996年に公開されて以降、現在も継続する老舗のウェブサイトだ。1990年代はデジタル図書館やデジタルアーカイブ構想が注目された時代で、当時はオンラインでさまざまな試みがなされた。しかし、現在でも閲覧可能な状態で残っているウェブサイトは多くない。

果たして、30年運営されてきたウェブサイトの全容とはいったいどのようなものなのだろうか? ウェブサイトは本のようにページ数や厚みでボリュームを直感的に把握できるメディアではない。さらに、30年以上にわたるインターネットの技術的変化やデザインリニューアルによって生じた複雑なファイル構造を理解するのも容易ではない。

そこで、私たちはartscapeのメタデータを抽出してみることを編集部へ提案した。号ごとの目次や構造はさておき過去に掲載された全記事データベースの作成を目指し、大日本印刷株式会社(DNP)のAIチームの協力を得て、以下の6項目を定義してメタデータ抽出を試みた。

①issue_number(掲載号数)
②publication_date(記事のリリース年月日)
③title(記事タイトル)
④author(著者名)
⑤url(URL)
⑥summary(概要)
※AIによる自動生成

最終的に得られたスプレッドシートのレコード件数は5万件以上。そのうち、情報が上記の6項目に分類され記述されているレコードは半数以下であった。しかも、それらの情報が全て適切とは限らない。AIだけでは自動的なメタデータの抽出は十分にできなかった。しかし、この混乱したメタデータは、1990年代からインターネットの大海を生き抜いてきたその姿を物語る。

「ページ」から「サイト」へ

現在のartscapeは、記事一覧ですべての記事の「②publication_date(記事のリリース年月日)」「③title(記事タイトル)」「④author(著者名)」が確認できる。そこから記事へダイレクトに飛ぶことができるため「⑤URL」の抽出も容易だろう。過去のartscapeにおいて、何がメタデータの抽出を困難にさせているのだろうか。その要因を探るため、アーカイブの「バックナンバー 号数」を紐解いてみたい。

artscapeは長く継続する過程で、幾度ものシステム変更とリニューアルを経てきた。大きくは「nmp(ネットワーク・ミュージアム&マガジン・プロジェクト)」の1996年7月18日号〜1997年6月17日号、「nmp.j」となった1997年7月24日号〜1998年10月1日号、「artscape」に改めた1998年10月18日号〜1999年8月2日号の第1期、1999年9月26日号〜2000年5月25日号の第2期、2000年6月15日号〜2001年11月15日号の第3期、2001年12月15日号〜2003年9月1日号の第4期、2003年9月15日号〜2008年12月17日号の第5期、2009年1月15日号〜2024年3月1日号の第6期、そして現在に続く以後の7期に分けられる。



「artscape」第1期(1999年4月15日号



「artscape」第2期 左:(1999年10月15日号) 右:(1999年11月15日号



「artscape」 左:第3期(2000年12月15日号) 右:第4期(2001年12月15日号



「artscape」第5期(2003年10月1日号



「artscape」第6期(2020年9月15日号

特に4期までは、約8年の間に5回という高頻度でページのデザインや構造のリニューアルが行なわれている。ひとつの号のなかでも、記事ごとに階層の深さが異なる、ひとつのURLに複数のページが含まれるといったケースもあり、AIによるメタデータ抽出を考えるうえで最も難解な部分と思われる。

その一例として、いくつかの展覧会レビューページを取り上げてみたい。1997年7月24日号を発行して以来、artscapeには必ず掲載されているコンテンツである。各ページの仕様について概略を述べるが、リンクから実際のページを体験することをおすすめしたい。

◾️アートスケープ(アートカレンダー)市原研太郎1998年12月15日号
日記仕立ての展覧会レポート。日付ごとに、訪問した展覧会のショートレビューが並ぶ。多くがページ単体で完結する内容だが、一部、さらに詳細なレポートページが設けられている場合がある。また、同じ日時に複数の展覧会レポートが含まれる場合もある。

◾️1997年のアートシーン/1998年のアートシーン1998年1月15日号
さまざまな筆者が一年を振り返り、また翌年ついて展望するという年末年始によく見られる企画。展覧会レポートとは異なるが、以降の展覧会レポートページに似た構造が見られるため、取り上げたい。

ひとつのページがフレームによって分割されており、左のフレームと右のフレームで異なるURLのページが表示される仕組み。右のフレームにある筆者名のメニューからいずれかを選択すると、右側にその筆者による記事が表示される。記事の一つひとつに異なるURLが割り振られてはいるものの、ブラウザに表示されるのは常に左のフレームのURLのため、どの記事を閲覧しても表示されるURLは変化しない。

◾️Recommendations(お奨め展覧会)2001年12月15日号
地域別の展覧会レビュー。前述のフレーム構造と同じように見えるが、実際は異なり、メニュー、記事ともに同一フレーム。そのため、ページ左部にあるメニューから地域名/筆者名を選択すると、ページ全体が切り替わり、ブラウザに表示されるURLも変わる。

◾️Exhibition Reviews & Guide 村田 真 原 久子2000年6月15日号
二人の筆者による展覧会レビュー。メニューが上部にあり、また1ページに複数の記事が含まれるケース。レビュー記事が執筆日の古いものから順に並び、全5ページにわたっている。各ページには5件程度の記事が含まれ、ページ単位で見ることもできれば、メニューから個々の記事に直接飛ぶこともできる。以後、2008年12月15日号まで続く展覧会レビューページの前身と思われる。

◾️展覧会レビュー 東京ミッドタウン・アワード2008 など43件2008年12月15日号
前述のケースと構成要素は変わらないが、メニューが右に移動し、ページ区切り(=期間の区切り)がメニューに追加されている。メニューの位置などの変動はあるものの、2000年7-8月合併号から本号までこの形式が継続している。

取り上げたページはあくまで一例に留まるが、このように多様なページに含まれる一つひとつの展覧会レビューは、どのようなプロンプトによって各記事のメタデータを拾うことができるだろうか。個別に最適な指示を用意することはできても、全体を同じプロンプトで実施することは難しいだろう。全記事を網羅するリストの作成には、ある程度、人の介入も必要と考えられる。

個々のページの構造変化に加え、アーカイブを紐解くなかで見えてきたのは、「ページ」から「サイト」への変化だ。それは「定期刊行物というアナログメディアを意識したサイト」から「ウェブサイト」への変化とも言い換えることができる。4期までのartscapeには、定期刊行物を思わせる「ページ」や「号」という単位が強く意識されているが、6期以降においてはその必要性は希薄になっている。トップページは流動的になり、「号」としてのアーカイブは、その時々のキャプチャ画面が残るのみである。現在の7期では「号」という表記は見当たらない。私たちがメタデータ抽出項目として一番に上げた「①issue_number(掲載号数)」は、ついに消滅したようだ★2

artscapeのメタデータがひらく風景

メタデータとは、しばしば「データ(情報)についてのデータ(情報)」と呼ばれるように、ある対象に関する特徴や性質の記述を指す。情報科学者でゲームプロデューサーのジェフリー・ポメランツによれば、「メタデータ」という単語が英語で使われるようになったのは1968年だという★3。60年足らずの歴史しかない「メタデータ」だが、その起源は何千年もの年月をかけて築かれてきた図書目録にある。

しかし、ポメランツは現代においてメタデータはもはや単なる「データについてのデータ」ではなく、生活を支える情報の社会基盤そのものになりつつあると指摘する★4。さらに、現代社会におけるメタデータの役割を地図にたとえる。地図とは、現実の複雑な地形や権利構造などから切り離されて、より単純で客観的な情報で作成されたコミュニケーションツールだ。

例えば、世界地図に描かれた全ての場所へ行くことが困難であるように、artscapeの膨大なコンテンツをすべて読むことは容易ではない。しかし、メタデータという地図があれば、全体像を俯瞰し、そこから何かを計画したり分析したりするための手がかりを得ることができるだろう。

現状の混乱したメタデータは、まだまだartscapeの案内係として使えるものではない。しかし、今回の試みで得られた最大の成果は、とりあえずウェブサイトが閲覧できる状態が保たれていれば抽出できるメタデータがあることがわかったこと、そして、artscapeのボリュームを大雑把ではあるが可視化できたことである。

把握できたhtmlのファイル数は約5万件にのぼる。未整理な部分は多いものの、記事タイトルや日付、著者名が文字データで表示されたことで検索や参照の可能性が高まった。もちろん、オンライン上での全文検索は技術的には難しいことではない。しかし、それは検索対象やキーワードが定まっている限りにおいて有効である。今回、メタデータを通してartscapeを客観的に俯瞰できる視座を得たことで、これまでartscapeに埋もれていた風景に出会える可能性が広がった。

artscapeはウェブメディアのアーカイブについて考察するうえで貴重なケーススタディになるだろう。今後、コンピューターと人間、そしてAIが協働しながらメタデータを整え、より見やすく使いやすい、そして有用な「地図」を描いていくことが期待される。インターネット黎明期にスタートして30年。近年のAI技術の飛躍的進展とともに、私たちはartscapeのアーカイブという未開の地を目の前にして地図作りのスタート地点に立っている。

★1──Jeffrey Pomerantz, Metadata, MIT Press, 2015, p.12.
★2──編集部注:第7期に月2回(1日号、15日号)配信から平日毎日配信になったため、号の表記がなくなりました。
★3──前掲書 p.5.
★4──前掲書 pp.3-4.