グーグルの書籍検索に関する美崎薫さんの記事を読む


美崎薫さんが『MYCOMジャーナル』に立て続けにグーグルにまつわる話題を記事にしている。


■ICADL2006 - Google Book Search技術担当者が語るデジタルアーカイブ(2007年1月9日)

■ICADL2006 - Google Book Search技術担当 Daniel Clancy独占インタビュー(2007年1月10日)

■Google Japan村上社長が語る「Googleが行いたいこと」(2007年1月29日)
(何れも『MYCOMジャーナル』)


お正月明けに発表された「Google ブック検索」プロジェクトの担当者の講演記録とインタビューは面白かった。


インタビューを受けたグーグルのダニエル・クランシーさんがどこまでしゃべったのか、どこから先の話に口をつぐんだのかが興味深い。美崎さんのレポートを読む限り、彼が講演でしゃべったことは、デビット・ヴァイス他著『Google誕生』(イースト・プレス)などのよくできたノンフィクションや記事で触れられていることに少しだけ具体的な報告を加えた程度で、本のスキャニングに関する詳細な情報を提供してくれている『bookscanner記』(id:bookscanner)の前線情報に接して耳年増になっている我々からすると、「せっかく京都まで来て、話はそこまでかよ」と思ってしまう、その程度の内容だ。ほとんど何もしゃべっていないに等しいのである。


記事はご自身が書籍のスキャニングを実践している美崎薫さんの筆になるものだけに、ご自身の経験に照らしてクランシーさんが語るグーグルの実践の意味、凄さを立体的に伝えてくれて読み応えがあるが、講演内容自体はベタである。美崎さんの単独インタビューの方も、結局美崎さんが訊いている質問にクランシーさんはほとんど何も答えていない。

    • 書籍のスキャンで、一番コストがかかっているのはどの部分ですか? わたしの実体験では分解、OCRの場合は校正やインデックス作成にもっとも手間取っています。

Daniel Clancy氏: 「グラフィックスキャナ、写真型スキャナ、自動ページめくり型スキャナなどいろいろな方法があります。残念ながら、Googleはテクノロジーの企業です。そのコアのテクノロジーについては話せない」
(ICADL2006 - Google Book Search技術担当 Daniel Clancy独占インタビュー)


一事が万事この調子で、ここまでノーコメントだと美崎さんはこの記事に仕立てるの、けっこう苦労しただろうなと思ってしまう。基本的にクランシーさんがしゃべったのはbookscannerさんが記述を始める手前のところまで。「書籍のもつ情報に容易にアクセスする手段を提供する」ことにグーグルが意義を見いだしているというステートメントがあるだけだし、講演自体も、どの程度の規模で話が進んでいるのかという話と、本のスキャンの現場がどうなっているのかについてのごく概括的な話、スキャンされた本はどんな風に見えるのかという、それなりに面白くはあるが有り体の情報だけだったようだ。彼が主体的に発言したことは皆無と見える。だから、あらためてグーグルのやっていること、米国のIT企業が本をめぐって進めていることの凄さと怖さの感覚を味わいたかったら、やはり『bookscanner記』をめくるに限るということになるだろう。

「書籍をスキャンするよりも重要なのは、たとえばどうやってわれわれは探したいものを探しているか、ということを考えることだ」とクランシー氏はいう。
(ICADL2006 - Google Book Search技術担当 Daniel Clancy独占インタビュー)


記事の中盤に置かれたこの言葉を契機として、美崎さんは「探す」ことに記事の軸足を移し、あらゆるデータがインデックス化され、縦横無尽にその情報を呼び出せるようになった世界を論じる。美崎さんの真骨頂である。美崎さんの記事の中で面白かったのは、クランシーさんの発言の部分ではなく、この美崎さんの語る明日の情報世界の姿、それにインタビュー記事の最後にかなり唐突に紹介されている中国の学者さんのひと言、それに対する美崎さんのコメントだ。

「検索で有効なのはユーザーのもつコンテキストだ」と、ICADL 2006に参加した中国科学アカデミーのHai Zhuge教授はいう。

「コンテキストは、テキストでも画像でもキーワードでもなく、静止した状態ですらない。コンテキストはダイナミックに変貌しつづけるユーザーのニーズそのもの」

たしかに、最後に残るのはコンテキストだけだ。
(ICADL2006 - Google Book Search技術担当 Daniel Clancy独占インタビュー)


これらの記述は、書籍のデジタル化後の世界で"複合した重層した体験が可能になる"ことに対する濃厚な期待を美崎さんが述べた直後に出てくる。タグの分類にこだわるだけでは、タグの外には出られない。mmpoloさんの指摘するように「本当の画像検索」もできない。

■本当の画像検索は可能か(『mmpoloの日記』2007年1月26日)


美崎さんがご自身で日常的に実践している百万枚の画像のスライドショーは、古いコンテキストを反芻しつつ、そられを解体し、つなぎ合わせながら、新しいコンテキストを創造する試みだ。それが理論的・芸術的創造の新しい源泉になる可能性を美崎さんは繰り返し強調するわけだが、美崎さんの場合、発見はあくまで美崎さんの脳の中で起こる化学反応に委ねられており、彼が技術の発展に期待する部分とそうではない部分は、ある程度割り切って整理されているように僕には映る。だがデータ投入の人海戦術を終えたグーグルは、あるいはグーグルを乗り越える新しい検索のモンスターの実践は、美崎さんが狙っているところとどう重なり、どう逸れていくのか。彼らがどこに我々を連れて行くのか、見当も付かないが、ただ、それに対して一喜一憂しても仕方がないぜという気にはなってきた。