文字起こしAI、精度に満足しない?
近年話題の、AIが搭載された文字起こしアプリ。非常に便利で、いまや文字起こし関連業務の効率化に欠かせないツールですよね。私ももちろん、いくつかのツールを使っています。個人的な興味からも、いろいろと触っています。
職業柄、自動文字起こしアプリや文章生成AI関連の質問をされることが増えました。例えば、「CLOVA、プラウドノート、【Notta】とかたくさんあるけど、結局どれが一番良いの?」「いまいち精度に満足いかないので、〇〇を買うべき?」などと、よく聞かれます。
そんなとき、「ツールの選び方より、ノイズとか発話被りの影響のほうが断然大きいから、課金や機材の買い替えは、録音状態の良いデータを今の環境で起こしたものと比べてから検討したほうがいいと思う」といつも話しています。
この、AI文字起こしアプリを使う場合でも、精度を左右するのは結局データの録音状態だということは、意外と言う人がおらず、盲点ではないかと感じています。
そこで本記事では、AIの認識精度が大きく上がる音源の作り方のコツをテープライター目線で3つ紹介しようと思います。どれも、どの文字起こしアプリでも使える方法です。
特別な道具も要らないですし、すぐできることばかりなので、アプリや機材のジプシーをする前に、ぜひ一度試してみてほしいです(これをより多くの方に知ってもらえると、外注テープライターも仕事が楽になります★)。
タイポや表記ゆれのチェックに!AI校正サービス【Shodo】
1. 録音する時点でノイズを減らす工夫をする(セミナー受講など)
録音音源を文字起こしアプリにかけたとき、認識精度を決める最大の要因が「ノイズ」であると感じています。録音時に以下の点を意識するだけで、音声データの質を大きく向上させることができます。
これは、どの文字起こしアプリを使う場合でも使えるテクニックなので、状況として可能であれば試してみてください。
ノイズ対策のアイデア
録音装置の近くで資料をめくらない、タイピングしない
ボイスレコーダーやスマホの近くで紙をめくる音は、ノイズとして致命的な時があります。資料を静かに扱うか、離れた場所でめくるだけでかなり違います。また、パソコンで同時にメモをする場合も、至近距離のタイピング音やそれによる机の振動に注意です。
机の振動音・エアコンの風にも注意
手書きでメモをする、タイピングをする、着席していても肘をつく、少し姿勢を変えるなどの際、机に直置きしたボイスレコーダーに意外と振動音が入ります。
これについては、録音装置の下にハンカチや柔らかい布を敷くことで、振動音を軽減できます。また、空いている机があれば、自分が座っている机ではなく隣の席(机がつながっていない)に置くのもひとつです。
また、エアコンの風が当たる場所にレコーダーを置いたせいで、ノイズが入ったことが筆者個人の経験としてありました。
布ずれの音を防ぐため、レコーダーを固定する
隠し録りをしなくてはいけない場合は、服やバッグにしのばせたレコーダーが布擦れする音を防ぐため、固定することが効果的です。特に、マイク部分に布が当たらないように注意。ボールペン型やタイピン型のボイスレコーダーなども、売っています。
2. 発話被りを防ぐために事前アナウンスをする(オンライン会議など)
ZoomやTeamsでオンライン会議をする際、複数人が同時に話す「発話被り」は、AIが音声を正確に認識する大きな障害となります。
その場の全員に前もって小さなルールをお願いし、発話被りを防ぐことで、会議音源のAI認識精度が格段に上がります。
発話被りをふせぐアイデア
司会者を置き、挙手制で指名されたら発言する
Zoom会議や打ち合わせでは、司会者を1人決め、挙手してから指名された人が順番に話すようにするなど、小さなルールを設けるだけで発話被りが防げます。
プレゼンの最中に質問しないスタイルで会議する
「話す順番を決めておく」「プレゼンの最中に質問をしない」という決まりを設けて、会議を行います。
3. 業界用語や固有名詞を辞書登録しておく(独自用語対策・後日別記事に分けて解説します)
専門用語や固有名詞は、AI文字起こしが苦手とするポイントです。これらは事前に辞書登録しておくことで、アプリの文字起こし精度を上げることができます。
例えば、専門用語や業界用語、地方の施設名、新しいプロジェクトの名称などの固有名詞について、AIの性能は今後も進化するとはいえ汎用の文字起こしアプリにこれらをカバーすることを期待するのは非現実的だと、個人的には考えています(技術・理学・法務・行政・医療などの分野に限れば、文字起こしソフトを研究している企業さんはたくさんあります)。
専門用語・固有名詞は辞書登録したほうが早い
文字起こしアプリの辞書機能・学習機能を活用
多くの文字起こしツールにはカスタム辞書機能が付いています。固有名詞や専門用語、略語をあらかじめリスト化し、登録しておくと良いです。
また、アプリには頻出する語彙を学習する機能があることも多いため、この機能もオンにしましょう(まずはクラウドに情報が渡っても良いと思える音源限定で)。アプリやソフトによっては、スマホやパソコンで普段使っている固有名詞を自動的に学習してくれるものもあります。
会議前にリストを作成(外注時にも良い方法)
文字起こしを外注する場合も、会議で使われる可能性のある業界用語・固有名詞を事前にまとめ、リストで渡すと受注したライターが正式表記や知らない言葉を調べる工程が省け、文脈からの推定も必要なくなるため、工数が激減します。そして、ライターから納品される原稿の、大幅な精度向上も期待できます。
まとめ:AI文字起こしの精度は録音時に決まる!
AI文字起こしの精度を上げるために、アプリ・ツールを選ばず、お金もかけずに工夫できることがたくさんあります。ノイズ対策、発話被りを防ぐためのルール設定、辞書機能活用といった、少しの工夫で大きな効果が得られます。
私も、原稿作成の目的とお客様のお仕事の性質上問題がなく、AIにより大幅に工数減が見込める場合、リピーター様に限り(1~2回請けないと分からないため)、文字起こしツール導入と利用のアイデアを提案してきました。
そんな中、どのアプリをおすすめする場合でも、「精度を上げる」「工数を減らす」ためにできる共通のことは、音源の録音状態に気を配ることだと確信しています。
また、これらのアプリ・ツールについて、精度の高さ・使い勝手の良さ・業務効率化できる度合い・コスパなどの話は、一概にはできません。
それは、原稿作成の目的とお客様のお仕事の性質、音源取り扱い上の制約、予算、準備できる機材・人材などによって違うからです。
※『AI文字起こし向きの音源ジャンル』『文字起こしアプリを選ぶ際に考慮するポイント』『Googleドキュメントで作れる無料自動文字起こしシステムの構築』について、追ってまた記事にします。
今回はアプリ不問ですぐに取り入れられるアイデアを中心に紹介しましたので、ぜひ試してみてくださいね。