P2P で何が変わるのか:分散検索

前回紹介したファイル共有ソフトが代表的な P2P アプリケーションだとするなら、最も現在地味なものが分散検索でしょうか。実際、P2P の具体的な分散検索アプリケーションとして紹介できるものがまだあまりないのがこの分野です。ただ、これは検索サービス単独で見た場合の話で、実は P2P の分散検索は大きな可能性を秘めています。

まずは、皆さんが通常利用しているインターネットの検索サービスから考えてみましょう。


Yahoo! にしてもGoogle にしても、通常検索エンジンは中央に巨大なサーバーのあるイメージです。あなたのパソコンは Yahoo! の検索サーバーに接続して、検索結果を受け取り、自分のパソコンに表示します。インデックスの生成方法が手作業かロボットかという違いはあっても、通常の検索サイトは大体同じ仕組みになっています。

例えて言うならば、生徒が何か調べるたびに先生に聞きに行っているイメージですね。生徒であるパソコンの質問に効率的に答えるために、先生であるサーバーは頻繁にインターネット上の情報を収集して、自分の情報を最新にしていきます。

この仕組みは一見効率的なようですが、課題も含んでいます。なんといっても、サーバーにかかる負担が非常に大きいのです。

現在インターネット上には30億ページを超える情報が存在すると言われています。膨大な量です。さらにこれは毎日増えつづけています。

Yahoo! や Google は非常に強力なシステムを持っており、現在はインターネット上の情報を彼らなりに網羅していると言っています。確かに現在の Web サイトは企業やオンラインサービスのサイトが中心のため、比較的検索は確立しやすいと考えられますが、 blog(Web Log)のような個人ベースの情報が増えだすと、現在の仕組みは破綻するのではないかとも言われています。

ここで注目されるのが、P2P 型の分散検索の仕組みです。先ほどの先生と生徒の例で言うと、先生にすべてを聞くのではなく、生徒同士でもお互いに情報交換をするイメージですね。

もちろん、インターネット上の検索に関しては検索サイトも様々な対策を打っていますので、数の危機は技術で解決できるかもしれませんが、 P2P でコストを抑えた検索システムを構築できれば、検索システムを様々な場所で活用できるようになります。

特に現在注目されているのが、企業における検索システムへの適用です。企業で日々従業員が作成している資料のうち、きちんと共有されているものは10%にも満たないと言われています。共有する仕組みがなかったり、サーバーに毎回ファイルを掲載するのが面倒くさかったりと、その原因は様々ですが、それぞれがパソコンで作成している資料を簡単に検索することができれば、効率的な情報共有が実現でき、業務の生産性に大きく貢献することができると考えられます。

また、実は P2P 型のファイル共有システムでも、当然分散型の検索ロジックが活用されています。サーバーがないにも関わらず、欲しい音楽のファイルを発見できるのは、パソコンがバケツリレー的に必要な情報を探してくるからです。

そういう意味では、分散検索はアプリケーションと言うよりは、 P2P の基礎技術という意味合いが強いかもしれませんが、 P2P の根幹を支える重要な技術です。技術的には、検索の効率化のために各社様々な方法を模索しているのですが、それはまた別の機会に紹介したいと思います。