|
『“Yahoo!サーファー・検索の鉄人”による「YST」ページ検索技術のノウハウ』
〜Yahoo! JAPANを隅々まで使いこなす知恵とキーワードの思考法とは〜 |
|
ヤフー株式会社 リスティング事業部 サーファー部 関 裕司 氏
|
|
当日の様子はこちらから |
当日の資料(抜粋版)はこちらから |
|
|
|
|
48回目の今回は、ヤフー株式会社の関 裕司氏を迎え、Yahoo! JAPANの検索エンジンの特徴やキーワード検索のコツについて、すぐにでも実践可能なノウハウを多数紹介していただきました。日々、登録サイトのメンテナンスや新着情報の選別を行う「サーファー」という職業とは、いったいどんなものなのか。「検索の鉄人」から直接話を聞くことのできる、貴重な機会だったのではないでしょうか。
■カテゴリ検索・ダイレクト検索を積極活用する
Yahoo! JAPANには登録サイトのデータベースだけでなく、様々なデータベースが存在し、それぞれがうまく絡み合うことによって結果のページが表示されています。このことを踏まえた上で、皆さんが自分の知りたい情報をいち早く、また詳しく知るために、ぜひ覚えておきたい初歩的な検索のコツについて、関氏に伝授していただきました。
Yahoo! JAPANの検索結果ページを開くと、「ヤフーサービスとの一致」「カテゴリとの一致」「スポンサーサイト」「登録サイトとの一致」といった「ダイジェスト」と呼ばれる項目が表示されています。これらのナビゲーションバーを上手に使いこなすことによって、皆さんはワンクリックするだけでYahoo! JAPANに存在する様々なデータベースを渡り歩くことができるのです。知りたい情報をスピーディーに収集したい場合、これは非常に価値ある検索手法といえるでしょう。
また、言葉の意味を調べたい場合は、「ダイレクト検索」という手法が有効です。Yahoo! JAPANには、例えばコンピュータ関係の用語辞典、「家庭の医学」など各種辞書・辞典のデータが登録されています。ダイレクト検索の使い方としては、意味を知りたい用語の最後に「?」あるいは「とは」を付けます。すると、語句に関連する辞典のページが表示されますから、あとは指示にしたがって検索を進めれば意味が表示されます。
やみくもに検索する前に、まず上記2つの手法を活用すれば思わぬ発見があると思いますので、ぜひ試してみてください。
■カテゴリの構造
Yahoo! JAPANのカテゴリは14種類に分かれており、さらにその下にあるサブカテゴリを含めると約19万のカテゴリが存在します(約45万サイトが登録されています)。では、いったいカテゴリとは、どのような仕組みでできているのでしょうか? 関氏から簡単に説明していただきました。
通常、キーワード検索をする場合、そのキーワードにマッチしたカテゴリが表示されます。例えば「販売促進」というキーワードで検索すると、「ノベルティ」「販売促進」といったカテゴリが表示されます。また、省略して「販促」と入力した場合も「販売促進」「プロモーション」といったカテゴリにヒットします。このように、カテゴリには、裏側に省略した語句や平仮名など別のキーワードも登録してあるので、皆さんの想像以上に自然な形で該当するカテゴリが出てくるのです。
また、登録サイトについては、基本的にサイトのタイトルと説明文からのキーワード検索になりますが、これも漢字を平仮名に直したものが裏側に入力されています。ですから、もし漢字が分からないという場合は、平仮名で検索することも可能です。ところで、Yahoo!
JAPANには「新着情報」というページがあります。ここには、その日新たに登録されたサイトが表示されています。平日ベースで約400件の登録があり、各サイトを一件一件サーファーがチェックして、カテゴリ分けされて登録される仕組みになっています。
■ロボット型検索プログラムの仕組み
本題となるYST(Yahoo Search Technology)を使った検索については、その仕組みから解説していただきました。
YSTは、ロボット型のページ検索プログラムです。先に述べたカテゴリがサーファー(人間)が目視によって選別したサイトを「サイト単位で検索する」のに対し、YSTは、ロボットが自動的にウェブを回って、人の手を借りずにデータベースを作り検索するシステムになっています。
仕組みとしては、ある基点となるページに「クローラー」と呼ばれるロボットが来たとき、そのページの情報をすべて収集してYahoo!
JAPANのサーバーに蓄えます。その後、ウェブページ上にあるリンクを辿って別のページに行き、テキストや画像などあらゆる情報を取る――この繰り返しによって、世界中のあらゆるウェブをすべてインデックスすることで検索が可能となるのです。
一方、ページ自体に該当するキーワードは載っていないが、あるキーワードを使って検索するとそのページにヒットする、という経験が皆さんにもあると思います。YSTでは、「アンカーテキスト」と呼ばれるリンク元の文字を特に重視しています。つまり、アンカーテキストはそのページに関する「定義」ですので、その定義を検索の対象に含めることによって、キーワードに一致したページが出てくる仕組みになっています。
■YSTを使ったサーチのポイント
こうしたYSTの仕組みを理解した上で、いよいよサーチのポイントに入ります。先に述べたとおり、検索においてはウェブページに含まれるすべてのテキスト情報が検索の対象となります。
しかし、私たち人間は何かを検索しようと思ったとき、どうしても物事を大きく概念的に捉えて、目的の情報のイメージでキーワードを考えてしまう傾向があります。キーワード検索では、目的のページにそのキーワードがあるかどうかが勝負です。したがって、「そこに絶対にあるキーワードを使うこと」が基本になります。
そのポイントは、以下のとおりです。
・ 自分の目的としているページに独特のフレーズやワードを探す
例えば、契約書を作るときにサンプルが見たいという場合、契約書によく出てくる「以下甲と言う」「以下乙と言う」といった特有のフレーズを入れることで、目的にマッチしたページが表示されやすくなります。その他、求人情報の場合なら「当社規定による」というフレーズ、ブログのページが探したい場合は「トラックバック」など特有のワードをキーワードの後ろにつけることによって、より近い検索結果が表示されます。
・ キーワードを組み合わせて検索する
複数のキーワードを入力して検索する場合、キーワードの組み合わせ方が重要になります。基本的な考え方としては、そのページに必ずあるキーワードをできるだけ沢山入れることによって、より絞られた情報が表示されます。
例えば、都内の全税務署の住所が知りたいという場合、「税務署」と入れるだけでなく「〜区」「〜町」「〜丁目」といった住所に必ず含まれる語句を付け足すことで、検索結果は絞られます。しかし、下手に「住所」など、その言葉があってもなくても成立してしまうような語句を入力してしまうと、目的のページから照準がどんどんズレていってしまいます。
キーワード検索のコツはタイトルを考えるのではなく、ページの中に含まれるキーワードを探すことです。一朝一夕にはいきませんが、想像力を働かせる訓練によって力は伸びますから、皆さんも努力してみてください。
・ 結果からキーワードを探す
皆さんも経験があるように、キーワード検索というのは、ほぼ一回で目的のページに行けません。ですから、いったん自分のできる範囲で検索をして、結果のページを見てその中から核となるキーワードを探し、再検索するという手法が有効です。これによって、検索結果は具体性の高いものになります。
・ 検索結果から不要な文字を削除する
例えば、自分の知りたいキーワードで検索した結果、余計な文字がついたページがたくさん出てきてしまったような場合は、キーワードの後ろに「−(マイナス)取りたい文字」と入力することで、その文字の入ったページは削除されます。
その他、ピンポイントサーチのための機能として、以下のようなものがあります。知っている知識もあるかもしれませんが、ぜひ覚えておいてください。
・ ドメインの限定…語尾にsite:○○○←ドメインを入れる
(例)ac.jp=大学・各種学校関係のページ 、go.jp=政府関係のページ
・ ファイルタイプの指定…語尾にfiletype: ○○○←ファイルタイプを入れる
(例)xl(エクセル)、msword(ワード)、ppt(パワーポイント)、pdf(PDF)、text(テキスト)など
2005.3.11 |