私たちは日々、多くの選択に直面している。ネットショッピング、映画、音楽、レストラン……選択肢は膨大で、人力ですべてを精査するのは難しい。
選択のコストを軽減するため、今日ではありとあらゆるサービスに推薦システムが導入されている。ユーザーの好みそうな選択肢を候補として提示してくれるシステムによって、人は注意を払うべき選択肢を大幅に減らすことができる。
では、推薦システムはユーザーの好みをどうやって把握しているのか。いちばん基本的な手法は、ユーザーの属性を基に、それぞれのユーザーにとっての格付け(レーティング)を推定する方法だ。
まず、選んだ選択肢(商品など)にどれぐらい満足したかをユーザーに格付けしてもらい、データを収集する。ユーザー属性と格付けのデータがある程度そろえば、その間にある関係が見えてくる。そこで推定された関係性を基に、高い格付けを得られそうな選択肢をユーザー属性ごとに推薦する。これが、私たちが日常的に使っている推薦システムの多くが、舞台裏で回しているアルゴリズムだ。
しかし、この手法にはいくつかの問題がある。格付けを行うことをユーザーに要求しにくいサービスは多い。また、格付けを入力してもらえたとしても、ユーザーが自発的に入力した場合、そのデータは欠損・バイアス(偏り)の問題を抱えている。ユーザーの入力する格付けがどれぐらい強くユーザーの好みと関連するか、その度合いが時間を通じて一定だと見なせるかも明らかではない。
この記事は会員限定です。登録すると続きをお読み頂けます。
東洋経済ID 会員特典
東洋経済IDにご登録いただくと、無料会員限定記事を閲覧できるほか、記事のブックマークや著者フォロー機能、キャンペーン応募などの会員限定機能や特典をご利用いただけます。
東洋経済IDについての詳細はこちら
無料会員登録はこちら
ログインはこちら