すべてのデザイナーにとってもっとも大事なタスクの1つは、自分のプロダクトとサービスを可能な限り使いやすくすることです。プロダクトや機能がどんなに役に立つものでも、ユーザーがそれを使うのに四苦八苦するようでは意味がありません。
iPhoneが携帯電話のマーケットに現れたとき、他の携帯電話にないような機能があったわけではありません。それどころか、初代のiPhoneには、競合が提供する携帯電話にはごく一般的に備わっていた3Gのインターネット機能すら無かったのです。iPhoneを成功させたのはつまり、優れた直感性とレスポンスの良さ、そしてユーザーが使って楽しいタッチインターフェイスなのです。
今日のアプリではいまだに、iPhoneが2001年に導入したUIコンポーネントと同じ動作が使われています。タッチし、スワイプし、遅くて面倒なスクリーン上のキーボードでタイプするという形です。これはどういうことかと言うと、Appleが作り出したUIのパラダイムは上出来だったけれど、他の全てのものと同じく、どこにも完璧なものは無いということです。
面倒なタッチインタラクションの使い方
モバイルアプリとその使い方がどんどん複雑になるにつれて、慣れ親しんだいくつかのUIパターンは限界になりつつあります。タッチによるUIがよく直面する課題には次のようなものがあります。
複雑なフォームに入力する
タイプすること自体はなんとかタッチスクリーンでも我慢できるとしても、せいぜい日付フィールドや選択肢、テキスト、数字から構成されたフォームまでならできるという程度でしょう。
ユーザーが最初のインプットを選ぶと、スクリーン上のキーボードが次の入力欄を隠してしまいます。次の入力フィールドを選択するためには、ユーザーはフォーカスを外してスクロールするためにありとあらゆる工夫をしなければなりません。
それに、たとえユーザーがすべての入力フィールドに簡単に到達できるとしても、タイピングに間違いは付き物です。カレンダーを表示する日付ピッカーはさまざまな形が存在します。オートコンプリートは上手く機能する場合も、思い通りに行かない場合や、ひどいときはまったく機能しません。
検索してアイテムを追加する
ユーザーは、たくさんのアイテムのインベントリーから多くのアイテムを選ぶ必要があることがよくあります。多くのECプラットフォームやCRMのようなプロ向けのアプリケーションの多くに見られる事象で、驚くべきことにすべての種類のアプリケーションに共通しています。このパターンは、複数の受信者にメールを送る時にとりわけ使われています。
これにもまた、タッチスクリーンではやりにくい、タイピングと選択の組み合わせが要求されます。ユーザーはまず何か(だいたいはアイテムの先頭数文字)をタイプして、その後にリストからアイテムを選びます。選んだ後に、ユーザーはフォーカスをテキスト入力に戻してまたタイプしなければならないのです。
ディープナビゲーション
タッチUIには各機能ごとに1つのボタンが必要であり、スクリーンの広さは限られているのですから、デザイナーはすべてのアイテムがカテゴリーまたはアイテムのセットに紐つけられるようなネスト型のメニューとナビゲーションを使わざるを得ません。
問題は、それぞれのアイテムが含まれるこれらのカテゴリーとセットの名前が分かりにくいことです。あなたは自分のプロフィール写真を変えようとするときに、「プロフィール」か「設定」のいずれかを選ばなければなりません。プロフィール写真はどちらに含まれているのでしょうか? 試してみなければ分かりません。
タッチスクリーンでの体験を強化するために音声を使う
音声は、タッチスクリーンでタイプするよりも最大4倍速いインプットチャネルです。たとえ音声認識の正確性が完璧ではないとしても、タイピングのエラー率ももっと高いことが普通です。
しかし、音声をキーボードの代替手段と考えてはいけません。逆もまた然りです。電気を消すためのもっとも簡便な方法は「電気を消して」と言うことですが、同じタスクをこなすためにタイピングすることはずっと面倒でしょう。
タイピングとは違って、声は私たち人間にとってもっとも自然なコミュニケーションの手段です。タイピングは学ぶ必要がありますが、話すために必要なことは生まれた時から知っています。だからこそ、まったく同じ内容を表すために使える手段であるとしても、話すこととと書くことはまったく同じではないのです。
ですから声によるUIは、書くための素早い手段と考えるべきではなく、タスクを達成するための素早い手段と考えるべきなのです。もしあなたが特定のプロダクト、たとえばiPhone SE 2020の赤を探しているなら、検索ボックスに「iPhone SE 2020」とタイプして、最初の検索結果として表示されたプロダクトをクリックして、色を探すのが便利でしょう。
しかし、もし同じプロダクトを店員に頼むとしたら、あなたは「iPhone SE 2020」とは言わずに、「新しい廉価版のiPhoneの在庫はありますか?」という言うようなことを尋ねることができるでしょう。店員の答えを得られたら、「赤はありますか?」と言って自分の要望を明確化することができます。
音声によるUIで強化されたタッチスクリーンのアプリは、中間的な存在であるべきです。それは、ユーザーがタイプすること、タッチすること、話すことを自然に使い分けられるようにすべきなのです。また、自然な言語をサポートする必要もあります。そしてもっとも重要なことは、現状の音声アシスタントやスマートスピーカーのようにユーザーの発声が終わってから反応するのではなく、リアルタイムで反応する必要があります。
音声だけでは完全なソリューションにはならない
先ほど私たちは、タッチスクリーンにおいて発生する3つの一般的なユーザビリティの問題を紹介しました。ここでは、それらの問題が音声によってどのように改善されるか考えてみます。
まず、複雑なフォームに入力することを考えてみましょう。
飛行機のフライトを予約するためには、ユーザーは最低限3つの異なる情報を入れる必要があります。つまり、出発地点、目的地、出発日です。人数やフライトのクラスなどといった、他の情報も入れるかもしれません。
こちらは、音声入力をサポートしたフライト予約フォームを紹介する本当に多様性のあるUIの例です。
次に、アイテムを検索して追加するケースはどうでしょうか。昔ながらのタッチによるUIであれば、ユーザーはスクリーン上のキーボードとアイテムの選択を何度も切り替えなければならず、反復的なタスクです。
繰り返しますが、タッチスクリーンにも利点があります。選択したものを修正するのがとても簡単です。たとえば、バナナを6個選んだユーザーがもう1個追加したい時には、ボタン1つをタップするだけで追加できます。
そして3番目、ディープナビゲーションです。これに関しては、音声がその実力を発揮し、ユーザー体験にまったく新しいアプローチを提供するのにぴったりのタスクです。
タッチによるUIとは違って、ユーザーが特定の画面に到達するために通る必要がある経路は音声には不要です。声を使えば、ユーザーはどんな画面からどんな画面へも、自然な言語だけでジャンプすることができるのです。
たとえば、「プロフィール写真を変える」という音声はどんな画面においても有効で、ユーザーを修正用の画面に直接ジャンプさせることができるでしょう。最高なのは、ユーザーが自分の意図をさまざまな言い方で表現できるということです。たとえば、「私の写真を設定できる画面」とも言えますし、「プロフィール写真の設定」とも言えます。
ナビゲーションにおける音声のユニークな特徴は他にもあります。それは、ユーザーがそのアプリの中で何を求めているのか、アプリのオーナーにネーミングのルールや機能についての有益な情報を与えてくれるということです。もし、多くのユーザーが口にしている機能がアプリに存在していなかったら、そのような機能を実装すべきだという非常に明解なサインです。これは、タッチスクリーンの分析からは得られないデータです。
デザインに音声を取り入れよう
Webサイトやタッチスクリーンによるアプリをデザインするなら、デザイナーは音声による機能の最善の使い方を考え始めるべきです。これらは、情報量の多いデータ入力や、ユーザーが忙しい時に遭遇するようなタスク、あるいはユーザーの手が塞がっている時に発生するようなタスクに関連していることが多いでしょう。
デザイナーは、ボタンとテキストについてだけ考えることを止めて、思い切ってタスクを達成するための最善の方法について考えるべきです。ユーザージャーニーの中には、彼らがタイプできない、あるいはタイプしたくないというような状況もあるはずです。
デザインのツールボックスに音声という新たなツールが加われば、デザイナーはもっと良いユーザー体験を作り上げることができるでしょう。