GoogleとYahooの係り受けの扱い

「日本経済の予測」というフレーズがある。これをGoogleとYahooはどう形態素解析して、どう係り受けの判断(処理)をするのか。

両エンジンに日本経済の予測を入力してみた。

一応、両者とも次のように分かち書きしている。

  日本 経済 の 予測

しかし、一見同じような解析でも表示結果は大きくことなる。





まず、検索結果のキャッシュを見てみよう。

Googleの例:
f0173567_16204974.jpg


Yahooの例:
f0173567_16214488.jpg


同じように分かち書きされているようで、実は違う。見たとおり、Googleではすべて黄色でハイライトされている。そしてYahooは色分けされている。

Googleの黄色だけのハイライトの意味は、「分かち書きはしたけれど、このフレーズを一つのまとまりとして検索しますよ」ということ。つまりマッチするのは、日本経済の予測というフレーズがあるページだけである。これがGoogleの立場のようだ。

一方、Yahooでは色分けされてキーワードがハイライトされている。これが意味するのは、「それぞれのキーワードがページにあれば、マッチさせますよ」ということ。日本経済と予測が「の」で結ばれていることをまったく意に介していない。Googleとは逆を行くような、Yahooの立場といえそうである。Googleで「日本 経済 予測」と入力した場合の検索結果に近い。

ところでGoogleは日本経済の予測と完全一致するフレーズがないページは拾ってくれないのだろうか。

否、である。

119位にきて、キャッシュのハイライト色が変化した。

f0173567_16352529.jpg


Googleでは完全一致するページがなくなると、Yahooのように個別のキーワードを含むページを検索結果として表示する仕組みになっている。

このことからそれぞれの検索エンジンの仕組みを導き出すのは無理な話だが、サイト構築する上で考慮する点が見えてくる。

ただし、検索エンジンのことばかりだけでなく、実際にユーザーは何と入力するかも考えねばならないだろう。入力しないキーワードを無理にページに入れ込むのは、やぶへびになるかもしれない。
[PR]

  by suiteama | 2008-07-29 16:55 | SEO

<< タイプライターのような明治のス... SEO For Firefox... >>

SEM SKIN - DESIGN by SEM EXE

free seo tool