テクノロジーが進んできた近年において、特にAI技術の成長は著しいと言われています。AI技術はさまざまな分野に進出し、私たちの仕事や暮らしの中にもたくさんのAI技術が広がりつつありますが、そのひとつが音声認識です。AI音声認識がどのようなものか、具体的な活用方法も含めて解説します。
AI音声認識技術とはなにか?
まずはAIの音声認識技術とはなにか解説していきます。
人間の音声をコンピューター処理のために識別する技術
従来のコンピューター処理は、キーボードで指示を入力してコンピューターを操作するというものでした。AI音声認識技術は、文字ではなくコンピューターに話しかけることで操作指示が可能になる技術です。
AI音声認識技術の仕組み
最初に楽器の音や車の音、風の音など、世の中にあるさまざまな音の中から人の声を識別します。人の声を識別することができたら、次に声の中から意味を拾う必要があります。
単語の意味は単体ではわかりにくい場合があり、たとえば「橋」と「箸」のような同音異義語や、問題ないという意味の「大丈夫」とノーサンキューという意味の「大丈夫」といった単語は、シーンによって意味が異なります。これらは文脈によってどちらの意味なのかを判断する必要がありますが、この判断をするのがAIです。
AI音声認識をするメリット
AI音声認識技術を活用することで、具体的にどのようなメリットがあるのでしょうか。ここでは代表的な2つを紹介します。
タイピングよりも速く文書作成が可能
音声認識機能の識別スピードはますます早くなってきています。話した言葉がすぐに文字としてタイピングされていくため、手でキーボードを叩くよりもずっと早く文書作成ができるようになります。音声認識での文書作成のほうがタイピングの2倍以上のスピードで完成した事例もあります。
手を使わないで操作ができる
タイピングは手や腕の筋肉、ひいては背筋などさまざまな筋肉を酷使します。そのため、あまりに過度なタイピングを繰り返すと筋肉痛や関節痛、腱鞘炎などに悩まされることもあります。
一方、AI音声認識は基本的に声のみなので、筋肉や関節の痛みに悩まされることはありません。また、怪我や病気などで手が使えない場合でも文書作成ができるというメリットもあります。
AI音声認識を導入するには
社内にもAI音声認識を導入したい場合、代表的なのは以下の3通りです。
企業の音声認識サービスを利用する
実際にビジネスシーンで音声認識サービスを使いたい時、もっとも手軽で身近なのがGoogle Cloud Speech APIやAmiVoiceといった既存のサービスです。
「Google Cloud Speech API」はGoogleのサービスのひとつで、120もの言語の音声認識が可能な点と、利用コストが低めに設定されている点が特徴です。「AmiVoice」は日本国内の企業が提供しているサービスとなり、日本企業開発だけあって日本語の精度が高い点が特徴です。そのほかにもいろいろなサービスがありますので、自社の課題解決にもっとも適したサービスを比較してみましょう。
開発会社に依頼する
自社で音声認識サービスを制作することが難しい場合は、開発会社(AI音声認識のシステムを開発している会社)に依頼する方法が考えられます。開発会社に「どのような音声認識機能が必要なのか」「どのような使い方をするのか」など希望を伝えることで、自社にもっとも適した形にカスタマイズしたAI音声認識ソフトができあがります。
クラウドワークスで依頼する
音声認識サービスの開発を依頼するひとつとして、クラウドワークスに登録されている開発可能な人材を活用する手があります。音声認識には大量のデータ収集が必要なため、収集作業を登録者に依頼することが可能です。単発の案件だったり予算が限られていたりする案件は、開発会社に依頼するよりも効率的な場合があります。自社の希望に合うエンジニアを見つけたら、ぜひ交渉してみましょう。
AI音声認識技術の今後の課題とは
AI音声認識技術は進歩し、人々の生活の中でどんどん実用化されていますが、実はまだ課題は残されています。現在のAI音声認識技術では、「あとどれくらい?」のような漠然とした質問を投げかけても回答することができません。現在地、目的地、交通手段など条件の追加説明が必要です。
さらに、マイクの感度にもよりますが、周囲の雑音やほかの人の声を拾ってしまうことがあり、正しい認識ができないこともあります。それに加えて、複数人の声を同時に拾うことができない点も課題として考えられます。
AI音声認識導入での具体的事例
最後に、実際にAI音声認識技術を導入している企業の活用事例を紹介します。
新潟県庁:議事録作成や書き起こし時間が半減
新潟県庁は知事記者会見の内容を書き起こして情報を公開することがありますが、いままでは一語一句書き起こす作業に時間と手間がかかっていました。しかし、AI音声認識を活用することで従来の半分の時間で済むようになりました。これによって、より多くの時間をほかの業務に割くことが可能になり、働き方改革につながっている事例です。
株式会社日立システムズ:オペレーターの作業を9割削減
日立システムズでは、いままで作業員とオペレーターが作業チェックシートを電話で読み合わせて、抜け漏れがないかを確認していました。この作業にAI音声認識を導入することで、オペレーターの作業を9割削減することに成功しました。大幅な作業効率化が図れたことで、そのほかの業務を充実させることができています。
サントリーホールディングス株式会社:記載内容の質と量が向上
サントリーの店舗営業者はモバイルデバイスで日報を作成していますが、独特なサントリー用語や言い回しを使用していること、PCに比べて操作性や作成スピードなどが劣ることによって、日報入力に大きなストレスがかかっていました。この作業にAI音声認識を導入することで、自社専用の辞書構築と音声モデル化が実現。日報入力時のストレスが減り、日報の質や量が向上しました。
まとめ
AI音声認識は、声でコンピューターに指示を送ったり文章を作成したりできるAI技術です。導入することによって作業効率の大幅な改善につながった事例が多々あります。文字起こしなどの時間や手間がかかる文章作成業務が多い場合、作業効率化を図る意味でもぜひ導入を検討してみてください。