NEW

音声認識技術、普及期に〜スマホ、カーナビ、東京五輪では通訳機能に期待高まる

【この記事のキーワード】

,

  • このエントリーをはてなブックマークに追加
クラリオンのカーナビゲーション「NX713」(同社HPより)
 音声認識システムが徐々に浸透し、本格的な普及期が接近しつつある。音声認識とは、例えば人が話す言語をコンピュータで解析し、その内容を文字データに変換する処理のことを指す。主に米国で1950年代から研究が開始され、コンピュータの普及とともに開発が進展してきた。ただ、数年前までは変換ミスなどが多く、一般に普及するまでには至らなかった。


 この分野での、日本のパイオニアはアドバンスト・メディア(AMI、東証マザーズ上場)だ。独自開発の音声認識ソフト「AmiVoice」(アミ・ボイス)を使って、病院での医師のカルテ記入や、議会の議事録作成支援などで実績を積み上げている。カルテでは医師が患者を触診しながら音声で入力できる。専門用語や医師の方言にも対応するなど、高い性能を誇る。また、フュートレック(同)は合弁子会社であるATR-Trekが開発する音声認識コア技術を用いて、携帯電話やスマートフォン(スマホ)向けのサービスを行っている。NTTドコモの「しゃべってコンシェル」に採用されている。

 直近では、米グーグルやアップル、ニュアンス コミュニケーションズなどが日本向けサービスを開始したことで、音声認識に対する消費者の理解が進み、利用者が増加している。特にスマホ向けサービスは一般化しつつある。AMIではスマホに「カメラ」と呼びかけるとカメラ機能が起動し、「はい、チーズ」と呼びかけるとシャッターを押す仕組みをキャリアに提供している。

 応用も広がり、フュートレックではパナソニック製エアコンの操作用アプリに音声認識技術を提供。AMIは交通案内の「NAVITIME」向けにアプリを提供している。NECはコールセンター向けのソフトやミドルウェアを提供している。

●進化めざましいカーナビ分野での活用

 クラリオンは今年10月中旬に、音声による入力で案内する新しいカーナビゲーション「NX713」を発売する。グーグルと組み、グーグルの位置情報やスマホで培った音声入力・変換システムを活用。クラリオンでは独自のノイズフィルターを開発し、入力エラーなどを減らすことに成功している。具体的にはドライバーが「ピザのおいしいイタリアンレストラン」などと音声で話すと、画面に該当する店舗が示される。ハンバーガーチェーン・マクドナルドの略称である「マック」「マクド」や、コーヒーチェーン・スターバックスコーヒーの「スタバ」、ロイヤルホストの「ロイホ」などでも表示する。

 これまで、カーナビでは音声入力の際、自動車独特のエンジン音や風切り音などが入り込み、変換がうまくいかなかった。クラリオンでは長年研究したノイズフィルターで、この問題を解決したという。価格は従来タイプと大きな違いはないもようだ。先日開催された最先端IT・エレクトロニクス総合展である「CEATEC JAPAN2013」に出品し、関係者に大きな反響を呼んでいた。

 音声認識は通訳機能も進化し、英語以外にも、フランス語や中国語などに対応する機種も出始めている。これまでは主に海外旅行の際などに使われてきたが、2020年の東京オリンピックの開催時には多数の外国人が日本に訪れる見通し。これからさらに進化するであろう、音声認識対応のスマホなどを使えば、コミュニケーションが容易になることが予想される。
(文=和島英樹/ラジオNIKKEI 記者)

音声認識技術、普及期に〜スマホ、カーナビ、東京五輪では通訳機能に期待高まるのページです。ビジネスジャーナルは、IT、カーナビスマホの最新ニュースをビジネスパーソン向けにいち早くお届けします。ビジネスの本音に迫るならビジネスジャーナルへ!