普段ライターとして働くなかで、インタビューのお仕事を頂くことが多いです。
インタビューをする際にもちろんメモを取りながらインタビューするのですが、基本的には録音した音声を文字起こしして、そこから書いていきます。
この文字起こしという作業が非常に大変でいつもどうにかならないかと工夫をしてきました。
最近は「Amazon Transcribe」というアマゾンの文字起こしサービスが提供され期待していたのですが、精度は50%いくかいかないかくらいでした。
聞き取れていないワードもありましたし、何より誤字脱字が多い。
インタビューを受ける人によっては話し方に特徴があったり、声が小さい方など様々です。そういう場合は余計に誤字脱字、抜けが多くなります。
50%も文字起こしが出来るならいいじゃないか。そう思われるかもしれません。しかし、実はそうでもないのです。
その理由をいくつかご紹介します。
修正する時に「消す」作業が手間になる
文字起こしサービスを使い修正する。
これが一番手っ取り早いと思っていたのですが、意外と内容の誤りや誤字を削除して、書き直すという行為がひと手間です。
文字起こしは耳で聞きながらどんどんタイピングしていきます。あまり、修正ばかりしていると何度も再生を巻き戻すことになり全く進みません。
なので再生速度をゆっくりにした上で、ミスの修正をしないでサクサク進めるのがいいのです。
しかし、自動文字起こしを修正する場合には、再生の巻き戻しが多くなり時間のロスが増えます。
修正時に文字の変換が遅くなる
自動文字起こしの場合、文章に改行が入りません。30分くらいの音声だとA4の用紙で4〜5ページになると思うのですが、その内容に改行がないと非常に読みにくいです。
修正中にどこまで修正したかわからなくなります。
また、何ページにも渡って改行なく続いていると、タイピングした時に文字の変換が非常に遅くなります。
1秒くらいタイムラグができることもしばしばで、普段のタイピングよりもかなり遅くなってしまいます。
自動文字起こしだと内容が頭に入りにくい
誤字だらけで内容が判別しにくい自動文字起こしを修正するよりも、最初から耳で聞いて、自分の手で文字起こししたほうが内容が頭に入ってきます。
昔より練習したおかげでタイピングが早くなったのもあると思うのですが、自動文字起こしよりも結局自分の手で文字起こししたほうが早いのです。
これからAIなどが進化して、今よりももっと自動文字起こしが早くなるのが待ちきれません。
そうしたら、僕の仕事も半分くらいになるのでそんな未来が待たれます。