AI(人工知能)を家庭でも!スマートスピーカーとは?

スマートスピーカー


上記のイメージにもあるように、一見ごく普通のスピーカーのような見た目。「今日の東京の天気は?」と話しかけると、すぐに答えを返してくれる。これはスマートスピーカーというもので、AI(人工知能)の学習技術の一つ、音声認識機能が搭載されています。スマートスピーカーは、話しかけた人の言葉の意図を理解したうえで、連携しているデバイスから指示内容に沿ったアプリを見つけ出し、音楽を再生したり電話をかけたりすることができます。

今回は、スマートスピーカーの中身や代表的な商品について、解説していきたいと思います。

スマートスピーカーとは

スマートスピーカーは、ここ数年で登場してきた家庭用の音声アシスタント機械です。iPhoneやApple Watchユーザーであればおなじみの音声アシスタント「Siri」の技術の延長線上にあると言われています。スマートフォンの中にいた音声アシスタントに、専用の耳と口と頭脳をつけて、単体で動くようにしたものがスマートスピーカーと考えると分かりやすいでしょう。

スマートスピーカーの中身

人は対面や電話で会話するとき、耳と口と頭を使います。

スマートスピーカーにはスピーカーとマイク、ネットワーク機能が搭載されており、これらを人間の対面や電話での会話に置き換えると、マイクは喋る口、スピーカーは人の話を聞く耳、ネットワーク機能は頭脳にそれぞれ該当します。AI(人工知能)は頭脳の部分に音声認識技術と質問応答技術で構成されています。

音声認識技術と質問応答技術

音声認識技術

音声認識技術とは、声を発することで生じる波形を文字に変換する技術です。キーボードを打つのではなく、音声による入力で、音声をコンピュータの扱いやすいテキストデータに変えます。

一般的な音声認識は、以下の主要機能で構成されています。

  • 音響モデル:言語が持つ音の特徴をモデル化
  • 言語モデル:単語の語順などの文法的な特徴や文章の意味的な特徴をモデル化
  • 音響特徴量抽出(音響分析):入力された音声データを、音響モデルで扱いやすくするために変換するもの

質問応答技術

質問応答技術とは、言葉で問われた質問に対して、回答を返してくれる技術です。中身は大きくいうと、次の4つのフローから構成されています。

  • 質問の解釈
  • データベースやインターネットの探索(情報検索)
  • 回答抽出
  • 回答文の生成

例えば、「スカイツリーの高さは何メートルですか?」とスマートスピーカーに問いかけたとしましょう。

スマートスピーカーは人間から質問を受け取ったら、質問文に込められた意味を解釈します。「スカイツリーの高さは何メートルですか?」という質問文であれば、「『スカイツリー』という単語が『高さ』という単語にかかっている」「『何メートル』という問いが『高さ』を指している」といった解釈を行うのです。これによって、スマートスピーカーは人間から「スカイツリーの高さ」を問われていることを理解し、「スカイツリーの高さ」が書かれていそうな情報源を、データベースやインターネットなどから検索します。

この流れをみると、スマートスピーカーに内蔵されている質問応答技術は、本質的には検索エンジンとしての機能を持っていることが分かります。

代表的なスマートスピーカー

既に世界各国で家庭向けの製品が発売されています。以下に代表的な製品を紹介します。

Amazon Echo

「Amazon Echo(アマゾンエコー)」は、アメリカに本社を置くAmazon社が2014年に販売を開始した、世界で最も売れているスマートスピーカーです。内部には「Alexa(アレクサ)」という音声認識技術が使用されています。日本では2017年に発売されていますが、「Alexa(アレクサ)、〇〇を注文して」などとAmazon Echoに話しかけるCMの方が印象に残っているという方も多いでしょう。

Amazonでの買い物や、Amazon Musicなどの各種サービスを使えるのはもちろん、サードパーティが開発した「SKill(スキル)」と呼ばれる機能を、ユーザーが選んで追加することもできます。

Google Home

「Google Home」は、Googleの音声アシスタント「Googleアシスタント」を搭載したスマートスピーカーです。2016年秋に発売されましたが、Googleアシスタント自体は、Googleが独自に開発したスマートフォン「Google Pixel」をはじめとしたAndroid端末に搭載されています。Androidスマートフォンに向かって「OK Google」と話しかけると返事が返ってきますが、これがまさにGoogleアシスタントです。Googleアシスタントは、ユーザーが所有するアカウントの情報と連携しているので、スケジュール管理や音声を使った検索など様々なサービスを利用できます。

Home Pod

2017年に発売された「Home Pod(ホームポッド)」。Appleでは「家庭用ワイヤレススピーカー」と呼ばれています。2012年にApple社がリリースしたAppleの音声アシスタント「Siri」を搭載しています。他のスマートスピーカーと異なる点は、音楽スピーカーとしてのカラーを強く打ち出していることです。

ちなみに「Siri」は、スマートスピーカーの技術の起源とされています。リリース当時の最先端の軍事技術をもとに開発され、多様な言語にも対応したために、瞬く間に世界中のユーザーの心を掴みました。また、Siriの話し方には親しみを感じられるような声にする、テキスト入力機能を外すなど、徹底的に使い勝手に固執したといわれています。

LINE Clova

「Clova(クローバ)」 はLINEと親会社のNAVERが2017年3月にリリースした、クラウドAIプラットフォームです。Clovaを実装しているのが「WAVE」というスマートスピーカーで、台形からまるでLINEのマスコットキャラクターを実体化したものなど、ラインナップが豊富なのも特徴です。

Clovaに話しかけることで音声認識が起動する点は他のスマートスピーカーと同じですが、LINEが運営する様々なサービスや、スマートフォンのLINEアプリとも連携して、トークメッセージの読み上げや返信を全て音声で完結できます。自社の運営するサービスに、自社開発の音声認識技術を利用したスマートスピーカーから利用できるのは、Amazon社が展開するAlexaとEchoの関係に似ているといってもよいでしょう。


sweeep|請求書AI-OCR

請求書の会計処理を自動化します
請求書AI-OCR「sweeep」

面倒な請求書の会計処理をAIで自動化。100枚をたった3分で処理できます。月末に貯まった請求書を一掃しましょう。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

ABOUTこの記事をかいた人

Webライター。Webサイトのコンテンツエリアの文章作成から校正、コンテンツマップに沿ったライティングを手がけてきた経験がある。スマートフォンのスキャン用アプリAdobe Scanを使って文書作成するのが得意。OCR、協働、働き方改革、地域のコミュニティの形成、子育て期の女性へのサポートなどに関心あり。