話題にのぼり始めたのはいつからか、がわかる
たいていのブログ検索は、RSSというウェブページのメタデータを検索している。通常のブログ作成サービスはRSSを自動的に作成しているから、ブログ・ツールによってウェブ日記が広まったアメリカなどでは、それでことたりるかもしれない。しかし、日本には、ブログ誕生以前からウェブ日記が存在しており、RSSを配信していないウェブ日記もある。
blogWatcherは、htmlを解析し、日付に着目することで、RSSを作成しないサイトもブログに含めて検索する。そして、それらのサイトのRSS Feedも自動作成してくれる。それを読みこめば、ブログリーダーなどで表示できる。
対象とする「ブログ」の幅の広さもさることながら、ブログを社会調査のツールとして使うという視点が、明確に打ち出されているのも興味深い。
トップページの検索ウィンドウに言葉を入れて実際に検索してみるとよくわかるが、検索語がブログでどう評価されているか、その推移も含めてわかる仕掛けになっている。
たとえば「ブログ」で検索してみると、2003年5月までは、この言葉が使われている頻度は20を超えず、ウェブ日記であまり話題になっていなかったようだ。しかし、2004年にはいると、この言葉がさかんに使われるようになり、この年の年末にひとつのピークに達した、ということがわかる。
この仕組みは、「イラクについてのニュースがいつ頃から盛り上がっているか」などの情報を得るために作ったのだそうだが、とくに頻度の高くなった「注目の日付」にその言葉を使ったブログだけをリストアップすることもできるようになっている。その日に何があったのかを確かめられるわけだ(blogWatcherでは、頻度が急増したときには赤線でバースト度が表示されている)。
さらに、「評判情報検索」というのもあって、ブログでどう評価されているかを検索する仕組みまでできている。たとえば、「村上隆」などの言葉を入れて検索すると、ポジティヴな評価は上に伸びる赤い棒グラフで、悪い評価は下に伸びる青い棒グラフで表示される。さらに詳細表示のリンクをクリックすると、円グラフで、いい評価と悪い評価のどちらが多いかが一目でわかるようになっている。
いったいどういう根拠で評価をはじきだしているんだ、と不思議に思うかもしれないが、評判情報の検索結果を見ると、一目瞭然だ。
そのブログ記事で使われている言葉によって判断されているのが見てとれる。赤くマーキングされている言葉はポジティヴ、青はネガティヴ、緑はどちらでも使われる言葉という判別で、「おもしろい」や「ほしい」「素敵」は赤、「苦手」「嫌い」は青という判定になっている。もっとも、「くわしい」も赤、「すごい」は緑と、どういう基準なのかよくわからないものもある。言葉の判定は、文脈によって変わってくるから、むずかしい。blogWatcherでは、評価の際に、着目点を考慮に入れているというから、単純に言葉だけで評価しているのではないらしい。
blogWatcherにはそのほか、ブログから関連するニュース記事を、ニュース記事から関連するブログを検索する「ニュース検索」とか、ウェブ上で話題になっているできごとを自動的に発見してブログ化している「メタブログ」など、おもしろい仕組みができている。
まだ研究ベースの試みのようだが、ツールバーもできていて、今年の3月には、ヴァージョン2.0になった。今後の発展が楽しみなブログ検索だ。
|