この記事では、コンテンツレコメンドシステムについて考察していきます。人々にもっともよく知られているものとしては、Netflixのレコメンドシステムがあります。また、それについて書かれている記事も多いことから、ここではこのタイプのレコメンドシステムに着目してみました。
Netflixのメカニズムには、感情に訴えかける特徴的なセオリーが含まれますが、いくつかの重要な要素が欠けていることも事実です。
これらの要素の欠如は、Netflixのレコメンドの不正確さと、レコメンドの範囲があまりにも広すぎる可能性につながっていると言えます。
感情と背景
元来、感情とはなにか(たとえばPaul Ekman氏[1]によると)。人はだれでも、生まれたときから一連の感情をもっています。それは、恐怖、怒り、悲しみ、そして好きだという感情などです。
私たちはみな、感情をもって生まれたので、この古来の見方によると、すべての人間がもつ基本的な感情は似通ったものだということになります。
Lisa Barrett氏の最近の研究[2] は、この昔から伝わったセオリーの難解さを紐解いたものだと言えます。
新しいセオリーのうちの1つに、構成主義的情動理論というものがあります。この見方によると、感情は生まれもったものではなく、あとから人に備わったものだということです。つまり、人によって感情は異なるということです。カルチャー的な環境は、これらの感情に影響を与えると言えるでしょう。
普遍的な感情というものは存在しません。つまり、怒り、悲しみ、恐れ、嫌悪、幸福感などが存在する文化的な環境がありますが、そうでない環境もあり得るのです。
感情のプロセスは脳から始まります。脳は、物理的な環境を認識しようとし、その環境が過去に意味したことを理解しようとし、また、その流れが一般的なカルチャーにどのように関連しているのかを理解しようとします。この流れに基づき、脳はこの状況にもっとも適した感情を導き出すのです。
コンテキストそのものも、1つの要因だと言えます。同じ特性をもつ異なる環境は、異なる解釈を生み出し、したがって異なる感情を生み出すのです。
レコメンドシステムの歴史
Netflixなどにみられるコンテンツのレコメンドには、感情分析に関する分野と共通する部分があります。
レコメンド機能を利用して、ユーザーがこれからなにをしたいと思っているか、どのような気分になりたいと感じているか(恐怖を感じたいなど)を理解しようとします。
いままでの一般的な意見は、レコメンドシステムによって蓄積される情報が増えるにつれ、精度が向上するというものでした。つまり、より多くのデータがより多くの精度につながるということです。ところが、ビデオ再生のレコメンドフィールドでは、膨大な量のデータがあるにもかかわらず、そのレコメンドは未だ正確とは言えません。
レコメンドシステムでは、ユーザーとコンテンツの両方を分析する必要があります。ここで私が問題だと思っていることは、コンテンツよりもユーザーを理解することに比重が集中しているという点です。
ユーザーが望むものを理解しようとするときに、間違ったメソッドに基づいていた場合、そこに使われたデータは何の意味もなしません。
問題点はまさにそこにあると言えるのです。
ユーザー分析
レコメンドに関する理論
レコメンドシステムの第1世代は、レコメンドの理論を作り出しました。たとえば、Thandoがスポーツコンテンツを視聴したとします。Thandoは男性で、他にも男性ホルモンを刺激するような類いのコンテンツを探しているとします。
ところが、女性もまた、スポーツを好むことに気づきました。
レコメンドシステムの第2世代では、さまざまなユーザーが共有する特性に基づいて好みを特定するために、使用状況のデータとコラボが可能なフィルタリングを利用したのです。
つまり、ParminderとMadisonの特性が似ていて、たとえばMadisonはMovie Xが好きだとしたら、Parminderもまた、Movie Xを好むかもしれないということです。
理論を伴わない理論
現代社会では、人々は行動と情報(登録やクレジットカードデータなど)の相関関係に依存しています。これらの相関関係には、視聴者に関する理論は含まれません。ここでは、女性が女性であるという理由だけで、メロドラマを好むだろうというふうには考えません。
このアプローチは「理論を伴わない理論」と呼ばれます。
「理論を伴わない理論」のメソッドは、グローバルでの感情を想定していません。データの内容に関して何の仮定もせずに、データ間の相関性をみつけだすものです。このため、これらの相関はいかなるグローバルな感情もあらわしていません。
ほとんどのAIシステム(高度なレコメンドはAIによるものです)と同様に、システムは分析する必要のあるパラメーターを定義しています。分析エリアを定義することは「理論のための理論」です。
たとえば、レコメンドアルゴリズムの入力には、視聴が発生した日時(データ)が含まれますが、視聴前にオフラインで発生したことや視聴中の物理的な場所(コンテキスト)は含まれません。
このようなことから、システムに含まれるコンテキストは充分なものだとは言えないでしょう。次の項で詳しくご説明します。
コンテンツの分析
Netflixに話を戻しましょう。
Netflixのコンテンツは、映画に関する知識を備えたメンバー約30人(Tagger=タガー[3],)のチームによって定義され、分類されます。
タガーのタイプはユーザー層に関する統計と合致してるかどうかではなく、映画の知識に基づいて採用されているため、映画を各ジャンルごとに割り当てる際にユーザーの多様性を反映することはできません。ユーザーの中には、「Game of Thrones」をファンタジーととらえる人もいれば、ホラーだと感じる人も、そしてそれ以外のジャンルだととらえる人もいます。したがって、Netflixのタガーたちのタグ付けは、外側のユーザーよりも、自分の仲間でつくられたグループの考えに、より関連しているものだと言えるでしょう。
Netflixは、「ドラマ」を「ドラマ」として定義しているように見えますが、構成主義的情動理論に基づいた最新の理論では、ドラマというものをユーザーそれぞれが定義するものだとされます。タガーは映画ファンであり、そのタグは世界中の人々よりも、アメリカ映画ファンの感情的な構造を表していると言えるでしょう。
構成主義的情動理論に応じたレコメンドの作成
すでにお話ししたように、ユーザー分析は構成主義的情動理論に類似した特性を、すでに含んでいるコンポーネントです。社会的に同じような環境で構築された感情をもつ人々は、実際には「相関クラスター」であり、各クラスターはサブカルチャーだという意見もあるでしょう。
ただ、Netflixのレコメンド機能には、2つのコンポーネントが欠けていると言えます。
コンテキストの偏りに関する原理
感情のコンテキストは、感情と知覚を変化させます。人は、自分が信じるものを感じ取るものです。
たとえば、お腹がすいているときほど、人を分析しようとする傾向があるということが言えます。食事前の、空腹の人は一般的に、他人に対して面倒だと感じるでしょう。なぜでしょうか? 空腹の人は気分が乱れて落ち着かないからです。
他人の行動に対する、自分の主観的な解釈は、自分の信念とコンテキストに基づいていると言えます。解釈には自分が投影されているということです。
コンテキストの偏りは、場所、気分、コンテンツ(それと同時に)レコメンド以前にすでに決定した人が原因だと言えます。たとえば、私の好みは仕事中、仕事が終わった直後、休憩をとる環境によって変化する可能性があります。レコメンドシステムはこの偏りを考慮する必要があるのです。コンテキストが自分の感情と、他人の感情を読み取る方法を変化させるからです。このシステムは、お腹がすいていてイライラしていたり、または仕事がうまくいって気分が満たされているなど、感情の変化とその環境を理解する必要があるのです。
コンテキストは自分の感情と、他人の感情を読み取る方法を変化させるものです。
コンテンツの分析
コンテンツの分析は、ユーザーがコンテンツをどのように体験するか、特定のプログラムが特定のユーザーにどのような感情を引き起こすかについての研究です。
最新のシステムは、どのユーザーたちが同じように感じるか、たとえば「恐怖」を同じ意味ととらえる人たちを分析することが可能です。しかし、システムは異なる人々が異なるコンテンツをどのように受け止めるかを分析することはできません。システムは、「恐怖」が人によって受け止め方が異なる可能性があるという事実を考慮せずに、コンテンツを「恐怖」としてタグ付けするのです。
たとえば、一部の人々は「ジェシカ・ジョーンズ」と言えば強い女性をあらわすコメディ[4]を連想します。また、別の人は、レイプ被害のトラウマに苦しむ女性を描いたドラマを思い浮かべるでしょう。
人の感情の状態を判断するのが難しいのと同じように(感情には「指紋」がないため)、人がどのようにコンテンツを体験するかを知ることは難しいものです。
レコメンドシステムへの新しいアプローチ
ここまでお話ししたことをすべて取り込み、ユーザー定義とコンテンツ定義の2つのアルゴリズムに基づくレコメンドシステムへの新しいアプローチをご紹介します。
ユーザー分析アルゴリズム
このアルゴリズムは既存のシステムと似ているものですが、偏った感情の動きにさらに重点を置いています。
- まず最初に、関連性が明確でない場合でも、できるだけ多くのパラメーターを収集する必要があります。取得するデータとしては、場所、レコメンド以前の閲覧と視聴、ページにとどまった時間の長さなどが考えられるでしょう。データに基づいて、ユーザーが属する行動クラスター/サブカルチャーを生成することができます。
- 次に、ユーザーにタグを付けます。ユーザーのコレクションとユーザーのコンテンツ選択に基づいて、システムは各ユーザーをサブカルチャークラスター(職場での芸術的な映画愛好家など)にラベル付けするのです。このタグ付けは、コンテンツにマッチするかどうかの基盤として機能します。
- 最後に、予測です。サブカルチャーのコンテンツラベル(下を参照)間の相関性を予測してみましょう。たとえば、クラスターAをX環境でコンテンツタグBにグループ化できると判断したら、タグBを含むコンテンツをレコメンドします。
コンテンツ分析のアルゴリズム
コンテンツ分析は、劇的な変化が必要な部分だと言えます。ここでは、サブカルチャーベースのコンテンツ分析をおすすめします。
現在、Netflixコンテンツはグローバルにタグ付けされています。「Game of Thrones」には世界中のすべての視聴者向けに同じタグが適用されているということです。私たちが提案する変更点は、視聴者のクラスター分析によって定義されるさまざまなサブカルチャーの代表者によって、各コンテンツが個別にラベル付けされることです。
わかりやすく言うと、ビジネス組織は、人口統計や社会的なグループ分けを基準に、マスメディアを通じてカルチャー的なグループを分析します。たとえば、平均以上の収入があり、都会的なアジア系男性である、など。
私たちの提案は、サブカルチャーグループに基づいて分析することです。たとえば、「勤務中に漫画を読んでいる読者層」といった分類です。
Netflixの分析では、関心のグループ「マンガ」に対するレコメンドの相関性は、国別のグループ「カナダ」の相関性よりも高いことが示されています。Netflixの主張は学術的には研究されていませんが、構成主義的情動理論に確実に基づいていると言えます。カルチャーに基づくグループ分けは、比較のための基本であるべきで、国、社会、または人口統計で分けるものではありません。
まとめ
ここでは、構成主義的情動理論に基づいて、レコメンドにおいての新しい構造を提案してみました。構造には、いくつかの基本的な変更が含まれます。
- ユーザー固有の分析を拡張し、ユーザーに関する可能な限り多くの情報を収集する
- 上記の点に基づいて、その人特有の好みを特定する
- 各オブザーバーが属するサブカルチャーに基づいて、コンテンツタグを作成する
Netflixは最初の2つの項目はすでに認識しているように見えますが、3つ目の項目はいまのところ、見落とされているようで、これはユーザーの不利益にもつながっていると言えるでしょう。
カルチャー的な意味合い
Netflixが提供しているレコメンドのメカニズムに対する認識を変えることは、社会的、カルチャー的な認識の変化をも呼び起こすでしょう。
少なくともNetflixのユーザーサブカルチャーにおいては、アクセス可能なグローバルコンテンツに、若干の地域/国/州のコンテンツを含めることで、文化的な影響の性質が劇的に変化しました。20年ほど前には、グローバルコンテンツとローカルコンテンツの間のギャップが大きかったため、カルチャー的なプラットフォームはローカル的なもので、主には国ごとのものでした。
伝統的に、人々は、国籍/社会グループごとに自分自身を定義するものです。「私はアメリカ人で、テキサス生まれで、キリスト教徒です」というように。
感情の分析とレコメンドに関して、ある人を正確に表現するとしたら「私は勤務時間中に漫画を読むのが好きです」となるでしょう。
構成主義的な感情の理論を思い出してみてください。感情は生まれながらのものではなく、あとから備えたものです。したがって、人によって感情は異なるのです。カルチャー的な環境は、これらの感情に影響を与えます。ビデオコンテンツが私たちの日常生活により密接したものになるにつれて、感情がどのように育つかにも影響があるのです。提供されるコンテンツが多様化するにつれて、同じ地理的条件に属する人たちの間で、感情もまた、多様化していくと言えるのです。
マスコンテンツの分布の変化は、グローバルなサブカルチャーグループにも変化をもたらし、それにともなって感情のグローバルシステムにも変化が現れました。
私の提案は、ユーザーのデータセットをより正確に予測するために、レコメンドベースの企業はコンテンツのタグ付けプロセスにユーザーを関与させるべきだということです。コンテンツタガーや分析の専門家チームをわざわざつくる必要はありません。ユーザーにコンテンツの定義を任せるのです。テクノロジーの世界ではよくあることですが、専門家やアルゴリズムに頼るのではなく、人々が定義するという古いやり方は、より高度な結果につながることもあるのです。
注釈
このトピックの元となった論文でご協力くださったT-A大学のEhud Lamm博士と、データサイエンスの背景についてご協力くださったAnna Belogolovski氏に感謝申し上げます。
[1] Ekman, P.; Friesen, W.V. (1971)。 “Constants across cultures in the face and emotion” (PDF)。Journal of Personality and Social Psychology. 17: 124–129. doi:10.1037/h0030377. PMID 5542557. the original (PDF) のアーカイブから。2015年2月28日
[2] Barrett, Lisa Feldman. How Emotions Are Made: the Secret Life of the Brain. Mariner Books, 2018.
[3] Grothaus, Michael. “How I Got My Dream Job Of Getting Paid To Watch Netflix.” Fast Company, Fast Company, 28 Mar. 2018, www.fastcompany.com/40547557/how-i-got-my-dream-job-of-getting-paid-to-watch-netflix.
[4] https://www.usatoday.com/story/life/tv/2017/08/22/you-wont-believe-what-shows-lead-viewers-watch-netflixs-marvel-series/587947001/