ソーシャルメディアを扱うUXリサーチャーとして、Ute氏はユーザーにもっと友だちを増やしてもらえるような、新しいインターフェイスのアイデアを考えていました。
Ute氏は思いついたアイデアを試すためのある過激なテスト方法を思いつきました。ユーザーがプロフィールに使用している写真を操作してみて、その人の友だちリストにどのような影響があるか調べてみたらどうだろう? うまくいけば、この調査によってオンライン上の社交性を高めるためにソーシャルメディアのデザインを改善していくヒントが得られるはずだ、と考えたのです。もちろん、このテストは何千ものFacebookユーザーの意向をないがしろにするものでした。しかしUte氏の頭のなかでは、これは単純なA/Bテストであって、後にソーシャルメディア調査を巡る大論争にまで発展しようとは思ってもいませんでした。彼女はその後でようやく、この仕事における倫理とは一体何だろう、と考えるようになったのです。
私は2つの異なる大学で科学研究者、教授として、技術が人間同士のコミュニケーションに及ぼす社会的、心理的影響を調べるために研究を重ねてきました。私たちの実験は、ソーシャルネットワークにおいて恋愛や嫉妬などの感情を操作することから、テレビゲームによって引き起こされるストレスや退屈感の与える影響、その他の実験及び観察まで、可能な限り幅広く行っています。ただし、すべての実験に共通した原則を守っていて、それは参加者たちに(調査結果を出す前か後か、いずれかのタイミングで)その趣旨を知らせること、そして彼らを傷つけることがないように注意を払うこと、そのために実験を内外から倫理的に評価してもらうことです。
Facebookの「情動の感染」調査を巡っては、インフォームド・コンセント(Facebookユーザーたちはこの実験について知らされていたか?)と、悪影響を最小限に抑えるよう努めていたか(この調査によって傷ついたFacebookユーザーはいなかったか?)という2つの問題を中心に議論がなされています。社会学、生物医学の研究者のような広範囲に渡る倫理的訓練を受けていない大多数のUXリサーチャーにとって、こうした議論は抽象的で役に立たないものに思えるかもしれません。そこで、この重要性を理解してもらうために、UXリサーチャーが日頃調査を行う際に考えるべき倫理の在り方について、実践者の立場から意見を述べたいと思います。
UXリサーチは「研究調査」ではない?
まずは研究調査という言葉を定義しましょう。その名の通りUXリサーチャーは通常、一定のユーザー層について、どのインターフェイスデザインが望ましい結果を得られるか比較するために、データを収集し調査する仕事に取り組みます。
こうした調査活動は通常、法的な検閲を受けることはありません。米国保険社会福祉省の規定46.102によると、こうした調査は「一般化できる知識の開発や普及を目的として行われる、研究開発、テストとその評価を含む組織的な調査研究」であるとされています。
「一般化できる知識」というところが重要です。実際のところ、A/Bテストを行なっている企業のほとんどは、その結果を自社の所有物であると考え、決して一般に公開しようとはしません。皮肉なことですが、そもそもFacebookが研究調査結果を一般に公開するつもりがなかったとすれば、ツイッターで議論を呼んだあるツイートの言っているように、彼らがやったことは研究調査という定義にさえ当てはまらない、ということになってしまいます。
つまり、どのようなUXリサーチも研究調査ではないため、技術的には「許可される」ということになるのです。しかし、人間として倫理的に納得のいく決断をするためにも、なぜUXリサーチにおいても他の研究調査と同じ倫理評価が適用されなければならないのか深く掘り下げていく必要があるでしょう。
法的に倫理的な調査研究
製品テストのような企業内で行われる調査研究がしばしば倫理的評価を受けない大きな理由は、ほとんどのUXリサーチは個人情報を利用しない匿名のデータで行われるから、というものでしょう。
ある大学の行なったFacebookの調査も、研究者が個々のFacebookユーザーのデータに直接アクセスしないという理由で内部の倫理的評価の対象外になりました。一般的に、ビッグデータの研究調査では、データは総体として扱われ、個々の人々に焦点を当てたものではないために倫理的評価から除外される傾向があり、多くの社会行動学者たちもこのような立場を取っています。
しかし、たとえデータが匿名であっても、人々に影響を与えないということではありません。研究調査の倫理的評価のほとんどは、調査によってもたらされるリスクと利益のバランスを最も考慮します。研究調査チームは、調査によって得られる社会的利益が、調査に参加する人々のリスクを十分に上回るものであるという論拠を用意する必要があります。
端的な例を挙げると、生物医学の研究者が症例対照研究において、末期ガン患者をa、bの二つのグループに分け、一方には実験段階の治療薬を与え、他方にはプラセボ(偽薬)を与えるという場合があります。このケースでは、社会的利益(ガンに対する治療法の発見の可能性)が、リスク(治療薬を与えられなかった末期ガン患者たちの死の可能性)を上回るのです。
ほとんどの技術研究調査のリスクは、私のものも含めて、命にかかわるような重大なものである場合は非常に少ないでしょう。せいぜい、ある広告を読む時間や、ある話をフォロワーたちと共有する頻度を増やす程度のものしょう。しかしそれでも、UXリサーチャーは次のことを自問しなければなりません。
「参加者たちはこの調査によって、日常生活で与えられる以上のリスクに晒されはしないか?」
正直に大丈夫だと答えられるなら問題ないでしょう。Facebookの研究調査においては、ほとんどの人が、研究対象者を意図した情動の操作にさらすことによって(たとえばうつ病などの感情的に良くない状態にするような)不要な心理的リスクを与えるということに同意するでしょう。さらに言うと、Facebookの調査結果が統計的にごくわずかなものであったとしても、彼らが悪影響を低減させる努力なしに情動操作をしたことは批判されても仕方がありません。
倫理的に安全で効果的なA/Bテストの素晴らしい例として、Dr. Jeffrey Lin氏が科学研究者のRiot Games氏と一緒に行った、テレビゲームLeague of Legendにおける「toxic chat(不快なチャット)」を理解するための試みが挙げられます。科学者から成るこのチームはゲームのチャットシステムのいくつかの設定を無差別に操作し、やがてプレーヤーを不快なチャットから守るための最良の方法は、ゲーム内のチャットシステムをデフォルトでオフの状態にしておくことことだという結論を得ました。こうすることによって、チャット自体は安定して行われながらも、誹謗中傷の言葉や猥褻な表現、否定的な影響が劇的に減少したのです。
なぜ、Facebookがあれだけ批判されたのに、このUXリサーチは賞賛されたのでしょうか? Facebookの調査と同様に、データ(生のチャットデータ)は匿名で収集、分析され、参加者は実験のことを知らされていませんでした。Facebookと同様に、Linのチームは技術の使用が感情に与える影響に焦点を当てていました(事実、調査は両方とも、「情動の感染」についての調査です)。
しかしながらFacebookとは違い、Linの作業は参加者たちを不快なチャットなどの悪影響下にさらすものではありませんでした。その代わりに、何人かのゲームプレーヤーたちの「チャットの設定をオフにする」ことで、製品を遊んでいるユーザーたちに蔓延していた不快な体験を緩和できる可能性を探ったのです。
UXリサーチに関連して、色の組み合わせがインターフェイスに与える影響を調べるA/Bテストが数多く行われてきました。UXリサーチャーたちはユーザーの感情を刺激し、望んでいたとおりにゲームに熱中させるようなUIのデザインを模索します。多くは色彩心理学を応用し、これをアルゴリズムに当てはめて、Webサイトにおける感情的な意味合いに基づいて適したイメージを見つけ出そうとします。
この手法をUteの行なった調査研究モデルに当てはめてみましょう。不満を与えたり、気持ちを落ち込ませたり、負の感情体験を与える目的で、そのように意図したUIをユーザーに与えるA/B調査の倫理性はどうなのでしょう。UXを完全に理解するために「良い」体験と「悪い」体験を与えることは両方とも必要だと考える人もいるかもしれません。しかし私は、ユーザーに負の体験をわざと与えることは、操作しているという体験を不愉快なものにさせるばかりで、UXにとってあまり意味のあるものだとは思えません。
より倫理的であるためには?
こうしたことを避けるためにUXリサーチャーはどうするべきでしょうか? ご安心ください。Facebook情動感染事件の顛末によって、企業や組織によるA/Bテストが禁止されることはないでしょう(連邦取引委員会による調査の可能性を考慮したとしてもです)。
だからといって、UXリサーチャーは安心してばかりではなく、「現実の」調査単位、すなわち個々の人々について、深く考慮しなくてはなりません。
最初にご紹介したUteのジレンマについて、すべてのUXリサーチャーに持つことを勧めたい仕事に対する倫理観というレンズで拡大してもう一度考えてみましょう。実際にこれは、私自身が何か調査を始める前に必ず自問する(そして、私の勤める機関が私に対して尋ねる)事柄でもあるのです。
1. その人心操作は学説的にも論理的にも正当化できるものか?
科学的な研究調査においては、研究チームはしばしばその人心操作の提案について学説的、論理的に説明する小論文を用意する必要があります。これは調査における必須手順で、これによって予測される観察結果についての説明を提供します。観察結果についての説明なしに、良いA/Bテストが行われることがあり得るでしょうか? なぜ、ある視覚的要素がより魅力的だと思うか(この点については別なデータに関する話題もありますが)について、Uteが学説的、論理的に説明できないのであれば、彼女には調査を実行する前にやるべきことがまだまだあったはずです。
2. 人心操作は私の調査研究に必要か?
先に述べたように、Facebook調査を巡る議論の「焦点」はユーザーのニュースフィードを積極的に人心操作することでした。実験はしばしば研究調査の第一選択肢とされていますが、因果関係を立証する方法は必ずしもこればかりではありません。
1968年、学者のDonald ShawとMaxwell McCombsは、その年(大統領選挙のあった年です)の7月にマスメディアに掲載された選挙に関する記事が、いかにその年11月の世論に大きな影響を与えたかを示すために、交差的時間差相関分析と呼ばれる相互の影響を時間差を考慮して比較測定する手法を用いて分析し、発表しました。
Uteは人心を積極的に操作することによる倫理的なジレンマを回避するために、これと同様の方法を取ることができたはずです。つまり、まずは一定の時間、人々の自然な振る舞いについて調査し、その後でプロフィール投稿に使う写真が増えたり減ったりしたユーザーについて、振る舞いが変化したかどうか、比較すれば良かったのです。
3. その人心操作は有害なものとなるのではないか?
人心操作が学説的、論理的に正当化され、UXリサーチャーの厳しい目によって必要であると判断されても、最も重要な精査をパスしなければゴーサインは出ません。ユーザーは普通にそのサイトやプラットフォームを使う場合に比べて、人心操作されることによってどの程度のリスクを被るかという検討です。
Uteのケースでは、ランダムに選択されたユーザーのプロフィールについて、自撮り写真を追加したり隠したりすることは大して有害ではないように思えるかもしれません。しかし、メディア心理学者が示唆しているように、自撮り写真はユーザーの自己表現における重要な要素ですから、Uteの研究提案によってユーザーのオンラインでの体験を混乱させる可能性を考慮する必要があったのです。一定の範囲で危害を最小限にすることは、調査の裏にある構造を理解することと大いに関係があります(このリストの最初の質問)。
4. 対象のユーザーは調査されることでどう感じるか?
上記3つの質問は、主にUXリサーチを計画し実行する側の立場についてのものでした。最後にもう一つ、重要な倫理的な考慮を加えます。調査されるユーザーの体験そのものです。
心理学の実験では多くの場合、調査終了に当たって(a)調査参加者に調査の目的を説明し、(b)人心操作調査のメカニズムについて報告し、(c)この調査についてコメントを述べる機会を与え、(d)調査報告書に参加者のデータを含めても良いか口頭もしくは筆記で同意を得ます。必ずしも実用的ではありませんが、これによって、ユーザーに調査のプロセスに参加したのだという実感を得てもらうことができます。
加えて、こうした面談によって、量的に大きなデータの特異性を説明する質的なデータ(ビジネスの場では混合研究法と呼ばれます)を得ることができるのです。そもそも、ユーザーにその意味を知らせたくないような調査を、UXリサーチャーは行うべきではないのです。
厳しい倫理的訓練は必ずしも実用的ではありませんが、少なくとも与える影響について、得られるデータ以上に考慮する必要はあります。A/Bテストが及ぼす影響についてより批判的な目を持つことで、思いやりのある調査となるばかりでなく、説得力があり有効な調査結果を得ることができるでしょう。