AmazonのAlexaスキルにおける音声認識のUXデザイン

Indra Sofian

Indra Sofian氏は、UXPinのコンテンツ戦略家です。以前は、AT&Tのプロダクト開発で働いていました。

この記事はUXPinからの翻訳転載です。配信元または著者の許可を得て配信しています。

CapitalOne’s Alexa Project: Designing UX Without UI

IoT(Internet of Things)は2010年代初頭に出現して以来、トレンドであり続けています。今や車からライト、家、冷蔵庫、そしてトースターに至るまで、すべてがインターネットに接続されています。

そんな流れの中、AmazonはEchoと呼ばれる音声認識が可能なワイヤレススピーカーをリリースしており、この製品はホームオートメーションのハブとなり、パーソナルアシスタントのような役割を果たします。

Amazon EchoとAlexaとは

Amazon EchoはAmazonがリリースしたワイヤレススピーカーで、Alexaと呼ばれる人工知能を搭載しており、インターフェースがほぼ音声のみとなっている製品です。Alexaには、ユーザーの身の回りのタスクをこなすために様々なことを学習させることができます。

image01-3-768x512

さて、このようなIoT革命の中、一つの疑問が浮かび上がります。

AlexaのようなUIを持たないIoT製品を、我々はどのようにデザインすれば良いのでしょうか?

Amazon EchoのAlexaには、サードパーティが機能追加するための「Alexaスキル」というものがあり、これによりAlexaに新しいスキル(=技)を覚えさせることができます。

米国の金融大手Capital Oneのチームは、ユーザーがEcho本体に話しかけるだけで財務状況を管理できるようなAlexaスキルをデザインすることになり、UIを持たない製品の難しさに直面しました。

ここでは、Stephanie Hay氏(Capital Oneのコンテンツ戦略責任者)へのインタビューを通し、従来のUIを使わずにUXをデザインするというユニークな挑戦について探ります。

image00-1-768x512

インタビュー:Stephanie Hay氏(Capital One)

Capital OneのAlexaチーム内ではどんな役割でしたか?

Capital Oneでは、私は200人以上の仲間と働いています。私は、Alexaの初期リリース時のリードデザイナーでした。

Alexaチームには、デザインチームに所属する全員に対し、様々なデザインプロセスに関わらせる文化があります。コンテンツ戦略やデザイン思考、ユーザー調査など、大規模なデザインの中においては専門的な領域とされるものも統合的に行います。

私が2年前にCapital Oneに参加したのも、それが理由でした。ここにいる、Capital Oneのグローバルデザイン責任者であるScott Zimmer氏は私の上司になります。

以前はデザインチームの中にコンテンツ戦略チームはなかったので、彼はこう言いました。

「私たちは、自分たちの持っている顧客データや、顧客とお金の関り方についてのデータのおかげで、各個人にパーソナライズした会話をデザインする機会を得ました。これらのデータによって、この体験に人間味や明快さを吹き込むことができるのです。ならば、(コンテンツ戦略も)やらない理由がありません。」

Alexaチームは、まさに前述の通りのチームで、プロダクトマネージャー、エンジニア、そしてデザイナーなどが部門の枠を超えて機能するようなチームです。

私たちは、ユーザーがキッチンやリビングルームを歩き回ったり、新聞の日曜版を読んだりしているとき、どのように自分たちのお財布事情について話すのか、そのコンテキストを完全に理解していなければなりません。

これはまったく新しいコンテキストで、私たちの横断的なチームが探索すべき、新しい未開拓分野でした。

Capital OneのAlexaスキルは、どのように人々の生活に溶け込みますか?

お金は、既に人々の生活の中の一部です。食料品を買っているとき、夕食を作っているとき、そしてテレビを見ているときなど、非常に多くの状況において、人はお金について考えています。お金は、常に人々の生活の背景に存在しているのです。

Alexaやスマートホーム、そしてAIなどは、テレビを見たり、夕食を作るなどの体験と同じく、生活のバックグラウンドとなる可能性を秘めています。

Alexaが目指すところに、Capital Oneも行けると信じています。ユーザーが必要なとき、いつでもお金について話すことができるよう、簡単に利用しやすいものにしたかったのです。

プロジェクトにおいて、どのようにユーザー調査を行いましたか?

デザインプロセスの一部として、私たちは定期的にユーザーインタビューを行っています。私たちは毎日顧客と会話をするのです。

また、人間の会話の自然な流れをより理解するために、コールセンターリサーチの生の記録にも手を伸ばし、Google検索のキーワードなども研究しました。そこで、人々のトランザクションにおけるニーズと、お金の話をしているときの感情面のコンテキストについて学びました。

人間の行動について、どんな興味深い洞察が明らかになりましたか?

人は、会話を終えるときに異なった言葉を使用します。そして私たちはそれに合わせてデザインしなければなりません。

例えば「以上です」のような表現を使うこともできますが、顧客が続けなければならないときや、終了させるべきときを決めるのは最終的に私たち次第となってしまいます。これは、純粋に言語におけるデザイン上の挑戦です。

UIが存在しない状態で会話をデザインするプロセスを教えて下さい。

このプロジェクトは、私が今までに取り組んだ中で最も純粋なデザインの挑戦です。

既存のUIがもたらす正確性はすべて取り払われ、感情と言語のみが残りました。

例えば、「balance(=残高、未払金の意)」ついて聞き出すというユースケースがあります。この場合、それがクレジットカード利用のみの顧客だったら、どうでしょう? また、クレジットカードと当座預金口座、更に普通預金口座を利用している場合はどうなりますか? 「balance」という単語は、双方の場合で何を意味するでしょうか?

クレジットカードの場合、「balance」とは未払金のことで、支払うべきものを指します。一方、当座預金口座の「balance」は残高=個人が所有している金額のことで、利用可能な現金のようなものです。この単語自体手を入れる必要がありますが、作業に取り掛かってみると、それを描写するためのUIがないことに気づくのです。

挑戦はどんどん深みにはまっていきました。

Amazonの世界では、顧客がAlexaに対して行う「発話」が言語を形成します。私たちは、人々の意図から導き出された単語群を構築することにより、その言語をよりフレキシブルに扱えるようにしました。

「お金をいくら持っているのか」もしくは「お金をいくら使わなければならないのか」、どちらを意味しているのかを知る必要があったので、会話だけではなく、ユースケースもデザインし始めました。

中でも重要だったのは、前提条件の確立でした。まずユーザーの質問に答え、その後に明確な質問をするようなデザインをしてみることにしました。

次に、可能な限り実際のデータに基づいて、ペルソナをより細かく描写する必要がありました。例えば、顧客がクレジットカードのみを利用しているのか、それとも普通預金口座を持っているのかがわかれば、Alexaはよりうまく質問に答えることができるのです。

また、Alexaの抑揚にも細心の注意を払う必要がありました。デザインしている中で、資料上ではうまくいくように見えても、実際やってみると正しく聞こえるとは限りません。Alexaの発言の抑揚や、言葉の途切れがあるからです。

エンジニアリング、プロダクトマーケティング、法務、およびデザインチームは、毎日共に電話をして、こういった会話のためのコンテンツを一緒に作成しました。研究室で会話をテストし、それがAlexaの上でどう聞こえるかを確認してから、最終的にリリースしました。

ユーザーテストの後で着手した重要なイテレーションをいくつか教えて下さい。

最初に自分のアカウントをペアリングするときですが、Amazonにはその時点で音声認識がなかったので、Alexaは実際誰と話しているのかまでは認識できませんでした。Alexaはただ、オープンな環境で鎮座しているだけだったのです。そのため私たちは、ユーザー名とパスワードに加えて更なるセキュリティの仕組みを構築するべきかどうか、Amazonに尋ねました。

Amazonからの回答は、「必要です。それも盛り込みましょう。」とのことでした。

私たちは「パーソナル・キー」というものも作りました。これは4桁のパスコードで、財政情報をより保護するために作成することができます。パーソナル・キーを作ると、Alexaはお金について話しかけられる度にキーを求めるようになります。

これこそが本当に、部署横断チームの出番です。ユーザーのコンテキストとデータを適合させるのです。これが、会話型UIをうまくデザインするための唯一の方法です。最初にリリースしたものはすでに市場に出ており、私たちはそこから学習しているので、あとは向上するのみです。

将来、IoTとAIはどこへ向かっていくと思いますか? また、デザインの先導者として、最もワクワクすることは何ですか?

我々を制限するものがなくなる、ということが一番ワクワクします。IoTとAIによって、私たちは24時間体制で稼働できるのです。それはつまり、皆さんの生活を私たちが常に支えることができることを意味します。

そしてそれが、没入型のデザインというものです。パラダイムをシフトし、皆さんがいるところにはどこへでも行き、摩擦のない、常にその場に適応した方法で存在することができます。そして、皆さんは、今までこの技術なしで生きていたなんて、信じることができなくなるでしょう。

・・・

この記事を気に入った方は、無料の電子書籍であるReal-Life UX Processes(英語)も是非ダウンロードして下さい。ここには、Slack、Autodesk、3M他などの企業の製品の背後にあるデザインの秘訣などについて紹介しています。

image02-10-768x404


イベント

2017/10/06(金)
UX School(全10回)