11 月05日リアルタイム検索での時間軸以外の重みづけの方法

だいぶ前ですがTechCrunchに以下の興味深いエントリが投稿されていました。

リアルタイム検索の難問―「意識の流れ」をいかに検索するか?

リアルタイム検索とは、Twitterなどでポストされるとその投稿がすぐに検索結果に反映されるという仕組みのことです。現在ほとんどのリアルタイム検索のサイトが単純に時間軸で最新の投稿が表示されるようになっています。

ただ、時間軸だけで並べてしまうとどうしてもいらない情報(ノイズ)がヒットしてしまううえに、今後リアルタイム検索が流行してきたときには容易にスパムの対象となってしまうため、欲しい情報を探すためには時間軸だけで並べるのは最適な方法とは言えないです。

そこで何によって順番を決めるかといういろいろな基準が上記の記事に書かれています。バランスの設定の仕方が難しいという話です。

上記の記事で言及されている要素も含めて、どんな基準があるかを考えてみました。Twitterに固有な単語も含んでますが、他も含めて考えてます。Facebookとかでも同じような話になってくると考えてます。

・どういった投稿か
-キーワードの前後の文章
-リンクが含まれている場合にはそのサイトの重要性
-どの程度の速度で拡散したか
-何人にRTされたか
-何人にfavされたか
-いつ投稿されたか
・言及しているイベントからの経過時間
・期限までの残り時間
・何時に投稿されたか

・誰が投稿したか
-どれくらいフォローされている人か
-どういった人にフォローされている人か
-どういったリストに加えられている人か
-前後にどのようなポストをした人か
-同じトピックについて何回投稿しているか
-どんなサイトを運営している人か

・検索した人の状況
-以前に検索したワードは何か
-どういった人と繋がっている人か
-いつ検索したか
-どんな端末で検索しているか
-所属しているコミュニティやリストなど

列挙しながら考えた結果、今まで「人」というファクターが圧倒的に重要になっていくかと考えていたのですが、とある事象にからめた時間軸(注目されたポストの前後どのタイミングで投稿されたものか)なども要素として入れたほうがよさそうだと思いました。




This entry was posted on 木曜日, 11 月 5th, 2009 at 9:49 PM and is filed under 考察. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

Leave a Reply





XHTML: You can use these tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

最近の投稿
カテゴリー
最近のコメント
タグ
アーカイブ
ブログロール