voiceinput

考察

音声入力というデバイスから学ぶマナー

  • 0
  • 0

みなさんこんにちは

齋藤です。今、撮影で札幌に来ています。

今回のテーマは音声入力というデバイスから学ぶマナー。

以前ユーザーインターフェースについて少し触れましたが、
最近話題のAIスピーカーが自宅に届き、色々試しているうちに気づいた点があったので書いてみたいと思います。

そもそも僕が音声入力というインターフェイスに出会ったのは
20代前半頃に先輩の車に乗せてもらった時です。
当時最新のカーナビが音声入力対応だったのです。そう考えるとかなり昔から技術としてはあったんですね。

「ジタクエカエル」

認識の精度が低いせいか、カーナビに向かって先輩がひたすら。。「ジタクエカエル」を3、4回。。
単純に帰宅ルートを設定するだけなのに何度も繰り返し。。
いや本人は全く悪くないです。認識精度が低いだけなんです。

でも、ちょっと恥ずかしい。何だろあの車中の空気感。。
みたいなことを思い出しました。

では、なぜ恥ずかしいと思ってしまうのか?

やはりそれは誰に話してるかわからないからじゃないでしょうか。
当然音声入力なので視覚的に何かのデバイスを操作しているわけではないので他人からは区別しにくい。

かなり一般的になってはきましたが、個人的はマイク付きヘッドホンも同じ匂いを感じます。
視覚的にはヘッドホンなので、隣でいきなり話しはじめられると焦ってしまう。
よくあるコールセンターのお姉さんが付けてるヘッドセットぐらいの存在感ならわかるのですが。

と考えると私、今、音声入力(電話)してます。
ってのが、視覚的にわかればこの気恥ずかしさや違和感はないのではないでしょうか。

なぜ、こんなことを思ったかと言うと
以前、何かの記事で某アイドルが先輩の前でずっとスマホを触っててブチ切れされた。
でも実は仕事のダンスの予習をひたすら映像でしていた。
みたいな話を思い出したので。

本であれば物と行動がイコールになっている。
本を読んでいるように見えて、実は音楽を聞いているということは起こらないわけです。

ただ現在はスマートフォンなどのデバイスが多様化して、
行動が1つじゃなくなってきているのです。
電話からはじまり時計、ヘッドホン
などなど。

すでに上記以外にも様々な多機能デバイスが存在するので、
こういった物と行動がイコールじゃないものがどんどん増えて行くのではないでしょうか。

そこで気になってくるのがマナー。
テレビなどの持ち歩きのできないもの、カーナビのように特定の人しか現場に存在しないものであれば
そこまで気にする必要はないのかもしれませんが
スマートフォンのように公共の場等で使用する頻度が高いものは気をつける必要があると思います。

例えば、会話の途中でスマホで検索する行為。
その会話がたとえ話題ででた内容の検索だったとしても、いきなりそれをされると個人的には、ん?となります。
ましてや、それで会話を待たされたりすると何だかなぁと。
だからと言って「これから検索しまーす」ってのもお互い面倒くさい。

そういう意味では音声入力なら何を検索してるかその場の人がわかるので変な気分にはならないのではと思っています。

 

ちょっと想像してみると

先輩「あの映画に刑事役でよくでるあの人」

後輩「えー誰ですか?」

先輩「いや、あの髭の人とよく出てた」

後輩「何歳ぐらいですか?」

先輩「45歳ぐらい」

後輩 スマートフォンで検索開始→無言

先輩「・・・・・・」(検索行為によるので長いときもある)

後輩「この人ですか?」

先輩「あーそうそう、その人、そう◯◯◯◯さん」

 

みたいな会話が以下のように変わるのでは?

 

先輩「あの映画に刑事役でよくでるあの人」

後輩「えー誰ですか?」

先輩「いや、あの髭の人とよく出てた」

後輩「何歳ぐらいですか?」

先輩「45歳ぐらい」

後輩「ひげ 45歳 俳優 画像検索」

デバイス「Webでひげ45歳俳優の画像が見つかりました」

先輩「お。」

後輩「この人ですか?」

先輩「あーそうそう、その人、そう◯◯◯◯さん」

 

こちらのほうがより自然で嫌な感じがしないのでは?

 

人間と機械の接点であるインターフェースには、
利用するシーンが増えれば増えるほどマナーみたいなものが必要になってくるのではないかと思います。
上記にも書きましたが特に持ち運び可能なデバイスには。

そんな観点からUI/UXを考えてみるのも面白いかと思いました。

 

ちなみに検索結果はこちらです。
みなさんの想像と一緒でしたか?笑

search
  • 0
  • 0