インフィニティソリューションズ株式会社ブログ

次はスマートフォンが感情認識機能を装備する

今やスマートフォンの機能として、音声認識が当たり前になってきているが、その一歩先では、感情認識、すなわち、ユーザがどんな気持ちかを理解する機能を準備しているらしい。

FastCompanyの記事から。

「Does Your Phone Know How Happy You Are? The Emotion-Recognition Industry Comes Giddily Of Age(あなたの携帯はあなたがどれくらいハッピーかを理解できる?感情認識業界がざわめいている」

‘Nunance, which makes PC voice recognition systems and the tech that powers Apple’s famous Siri digital PA, have revealed their next tech is voice recognition in cars and for TVs. But the firm also wants to add more than voice recognition in an attempt to build a real-life KITT—it wants to add emotion detection so its system can tell how you’re feeling while you gab away. ‘

「PC音声認識システムや、Appleの有名なSiriのエンジン技術を提供しているNuance社が、次世代技術として、車やテレビの音声認識を明らかにした。しかし、同社は音声認識以上のものを追加しようとしており、本物のKITT(ナイト2000)を作ろうとしているのだ。感情認識機能を装備し、うなずくと、その人がどういう気持ちなのかをシステムが察するというもの。」


Nuance Unveils Dragon Drive!; Powers More Intuitive, Intelligent Connected Car

— 元記事の一文字目がNunanceになっているが、正しくはNuance

— しゃべり、感情を持つ車としては、なぜか必ずナイトライダーに登場したKITTみたいなもの、と表現される。

‘But Nuance says it has far bigger plans to make your emotional input valuable: It’s looking into ways to monetize its voice systems, including your emotional input, to directly recommend services and venues to you. ‘

「しかしNuance社は、感情入力を価値あるものにするために、もっと大きな計画を持っているとのこと。感情もインプットとなる音声システムで、直接サービスや場所をレコメンすることにより、ビジネスにする方法を模索中だ。」

— ちょっとストレスが溜まっていそうなら、癒しの音楽を選曲して流してくれるとか。そしてそこに紐付く広告が流れるといったようなところ。

‘The implications of this are considerable: What if when you ask Siri for information about a movie, she works out that you’re sad and recommends a comedy film that you otherwise wouldn’t have seen, paired with an ad campaign?’

「この意味するところは重要だ。映画情報を教えてくれ、とSiriに依頼すると、悲しそうだということを理解して、自分ではまず選びそうもないコメディ映画をレコメンしてくれる。広告付きで。」

— このユーザが自ら選びそうもないものを、状況を把握してレコメンする、というところが狙い目らしい。

‘Microsoft is even building more sophisticated emotion recognition into its Kinect device, meaning next-gen games (and, yes, ads) will be able to react to your facial expression.’

「マイクロソフトはもっと洗練された感情認識機能をKinectデバイスに入れようとしている。つまり次世代のゲーム(そしてもちろん広告)は、顔の表情に反応することができるということを意味する。」

‘Because the smartphones we all carry contain sophisticated computing power, cloud computing connections and, increasingly, a front-facing webcam, it’s easy to see that the next generation of advertising will determine how you’re feeling and subsequently serve up information related to your mood. And it’s not just the question of detecting your mood, it’s all about how this leads the person expressing the mood to discover new information.’

「我々が持ち歩いているスマートフォンは洗練されたコンピューティング・パワー、クラウドコンピューティングとの接続機能、表面にカメラを搭載しているため、次世代の広告は、感情を理解し、結果、そのムードに合わせた情報を提供するようになるであろう。また、ただムードを理解するということだけではなく、情報を探すために、人がその感情を表現するようになるということだ。」

— 何か操作するために、いちいちカメラをアクティブにする、という場面は想像しづらいが、スマートフォンが擬人的になれば、音声認識システムに話しかけるというイメージではなく、仮想人間に話し相手になってもらうというのが不思議ではなくなるのかもしれない。