« 漠然とした不安 | メイン | 活火山と死火山とナポレオン »
2004/10/03
永遠のBETA
最近ではすっかり愛用して、ブラウザのトップページにも指定している「Googleニュース日本語版」だが、そのトップロゴの下にさりげなく書かれた「BETA」の文字の意味がようやくわかった!
■『Googleニュース』、3年経ってもベータ版であり続ける理由(WIRED)
Googleニュースが有料広告の掲載を開始しようものなら、新聞社の法務部門から記事の使用停止を要求する書簡が怒涛のごとく押し寄せる恐れがあることが、ベータ版にとどまっている理由だ。新聞各社は、記事の見出しとリード文をそっくりそのまま転載する行為は「公正使用の原則」の適用外だと主張するだろう。また、Googleニュースからやって来るユーザーを遮断し、Googleニュースを実質的に締め出してしまうニュースサイトも現れるかもしれない。
なるほど!きわめて的確な指摘だ。
ところで、Googleニュースのアルゴリズムってどうなっているんだろうか?単純な知的好奇心からちょっと気になっている。これまでにいくつかの謎に気づいている。
例えば、記事の一番下についている「関連記事○○件」という緑色のリンクを辿っても、○○件のニュースが出てくることはまずない。必ずその数字よりも少ない数字のニュースしかリンクされていないとか、画像の採用率は一般ニュースの場合テレビ局系ニュースサイトの画像が、また、モバイル系ニュースの場合はWindowsCE Fanからの画像が、あと、芸能系のニュースではデイリースポーツの画像が、他の画像よりも転載される率が高いような気がする。
あと、Project Palmでも話題になった「ピトケアン諸島」系のニュースが、リンク本数は少ないのに、かなりの長期間にわたって「国際」欄に掲載されていた。この事実から、リンク本数を重視しながらも、あまりにも人気の高いニュースの場合はリンク本数以上に評価される場合もあるというというアルゴリズムのヒントらしきものも見えてくる。
さて、本当のところはどうなんだろう?
参照●Googleニュースについて(Google)
2004-10-03 | Project Palm 直接リンク