Subscribed unsubscribe Subscribe Subscribe

Page Rankアルゴリズムについて考えてみる

Google検索の仕組みは以下のようになっています。 f:id:keiwt:20150228201303j:plain

しかし、ユーザーにとって質の高い情報ほどPage Rankを上げるにはどうしているのでしょうか。 年間500回を超える改善が行われているようですが、詳細のアルゴリズムは企業秘密のようです。 アルゴリズム – 検索サービス – Google

そこで私は個人的に考えてみました。どうユーザーにとって価値の高いページのPage Rankを上げるかを。

基本的な方針としてはユーザーが質の高い情報に対するアクションをベースにアルゴリズムを組むと考えます。

質の高い情報に対してユーザーが取るアクションについてまとめていきます。

滞在時間

ユーザーは閲覧しているページの情報が求めているものだった場合、 滞在時間は長くなると思います。

情報の質が低い場合は滞在時間は非常に短いものとなります。

しかし、タブとして開いているだけの状態でも閲覧時間は長くなります。

これに関してはどう対処するのがよいのでしょうか。

恐らく、ユーザーがそのページ内でスクロール等をしている時間を閲覧時間とすればいいのではないでしょうか。

1分以上ユーザーからのアクションがない場合は閲覧していない状態と解釈していいと考えます。

再来

ユーザーが長く滞在したとして、そのページの情報がユーザーにとって本当に価値が高い情報を提供したかは再来回数で判断が付きます。

もし、初回の滞在時間が長かったとしても再来しない場合はただページをスクロールして見ただけの可能性があります。

しかし、本当に情報の質が高い場合は再来します。

ブックマーク

ユーザーが同一のページに何回もアクセスする場合、もしくはページを見ただけでためになる情報だと判断した場合はブックマークをします。

ブックマークされるというのは情報の質がとても高いことを物語っています。

もう一度検索して、そのページにアクセスする手間を減らすためにブックマークは存在すると思います。

ブックマークというのはページとしてユーザーから殿堂入りしたようなものです。

そして、そのページのアクセスがブックマーク経由が多い場合、 そのページの提供する価値は高いことを示します。

Page Rankアルゴリズムとしてはブックマークされていても、すぐにブックマークから削除されるものも考慮しないといけないと思います。

なぜなら、さらっとページを見て、情報の質が高いと判断されたときにとりあえずブックマークするというユーザーのアクションもあるからです。

情報の質を人工知能

こちらは本題とは逸れますが、これからは人工知能で情報の質を判断するのがよいのではと考えています。

ユーザーの行動をトラッキングすることによって、Page Rankを決める場合はクラウドソーシングをしていることになります。

人工知能でページの情報を精査する場合はAIソーシングです。

しかし、テキストや画像や動画を分析して、情報の質を判断するアルゴリズムはまだ難しいのではと感がております。

まず、必要なのは正しい情報を格納したマスターデータ。
マスターデータを更新するのは自動でしたいですが、とても難しいですね。。。

続いて、文字数、画像、視覚的に理解しやすいかを判断するための指標。
ページを解析すると文字ばかりのページより、画像多めのページの方が分かりやすいと思われます。
また、画像のクオリティ、表現力、分かりやすさも解析できるといいかもしれません。

続いて、ページの読みやすさ。
こちらは改行等の体裁、ページ全体としてのバランスです。
一種の共通の法則があるかもしれません。

脳の反応を見てみる

ユーザーの脳が質の高い情報に対してどのように反応しているかを分析してもいいかもしれません。

なぜなら、脳は嘘をつけないからです。
脳の反応を自身で制御できるヒトはあまりいないと思われます。
脳は正直に反応しているのではないでしょうか。

外から見た顔の表情やリアクションは恣意的に変えることはできると思いますが、脳は正直です。

情報の質を上げるフィルターサービス

例えば、こちらのページを閲覧者にとってより見やすいように体裁を整える、「こちらの画像を入れるともっと情報の質が上がります」等のサービスも面白いのではと考えています。

要するに既存のページを読み込ませるとページの質を向上させる案を提案する、体裁をよくするサービスです。