音声認識ソフト(1998年2月掲載)

 11年前、音声認識ソフトの事を書きました。そしてホームページに掲載したのですが、驚いたことに朝日新聞の記者の方から取材の依頼を受けました。ネットで私の原稿を検索したようです。

 夕刊に掲載されました。正直言えば、あれから11年も経っているのに、音声認識ソフトは普及した、とは言い難いのが現実です。何が普及を阻んでいるのか。沼津の市議会では議事録を速記から音声認識ソフトに切り替えているようですが、まだまだ一般にまでは浸透していません。

 パソコンに話しかけて入力するというのは、意外と不自然なのかもしれません。

(2009年1月)

ホームページ掲載時コメント

 3年前に医師クラブで開催した文化講演会のテープ起こしをしました。2時間ほどのテープでしたが、本当に難行苦行でした。録音テープを少しずつ聞きながら、間髪を入れずにキーボードから入力するわけです。ほんの数行の文章ですら、正確に復唱することの難しさを実感しました。いかに人間の記憶力が当てにならないか、恐ろしいほどわかりました。

 そんな経験から、昨年度のPTA連絡協議会の文化講演会のテープ起こしは、何とかもう少し短時間でできないか、と考えていました。そんな時、知り合いの片浜小学校の浅賀教諭が音声認識ソフトのことを教えてくれたのです。渡りに船でした。さっそくパソコン・ショップへ行って購入しました。使用してみて、とにかく驚きました。マイクに向かって話すと、それがそのままテキストファイルになって、画面上に出現するわけです。久々ぶりの感動でした。

 今のところ文章入力のみの利用ですが、アプリケーションを開いたり、インターネットサーフィンも自由にできる日が、それほど遠い将来のことでなくなるでしょう。何といっても今のパソコンは難しすぎます。

 先日テレビのニュースて非常に興味深い場面を見ました。イギリスの閣僚たちは、「レッド・ボックス」といわれる赤い箱に予算案を入れ、随時チェックしています。そのレッド・ボックスに去年から、書類の替わりにパソコンが入るようになったのです。しかし印象に残ったのは、その事ではないのです。画面に登場した閣僚は、パソコンに向かって話しかけ、音声認識ソフトによってパソコンを操っていたのです。

 実は私もこの音声認識ソフト(IBM社 ViaVoice Gold)を少し前に購入し、試用していました。昨年開催された沼津市PTA連絡協議会主催の文化講演会の録音テープ起こしに用いたのです。三年前に沼津医師クラブが主催した文化講演会においても、演者の梅原利夫先生には講演をしていただきました。その際初めて原稿起こしを経験したのですが、それはまさに悪戦苦闘、難行苦行の連続でした。プロの方に頼めばもちろん話は簡単です。しかし予算の問題から自分ですることにしたのです。録音されたテープを少しずつ聞き取りながら、間髪を入れずにキーボードからパソコンに文章を入力していくわけです。二時間のテープ起こしに、ほぼ二ヶ月かかりました。三年前のこの経験から、なんとか短時間でできないものかと考えていました。

 そんな時、知り合いのある教諭から、この音声認識ソフトの事を教えてもらったのです。実際に試してみて、その素晴らしさに感動しました。それはインターネット電話以来の感動でした。パソコンの歴史に新しい一ページを切り開いた、と言っても過言ではないと思います。使用開始の頃は、かなり誤認識も多かったのですが、二百ほどの例文を音声入力し自分の声を記憶させたところ、かなり認識率が高まりました。テープの内容を少しずつオウム返しでマイクに向って話すと、パソコンが文章にしてくれるわけです。おかげで前回の十分の一ほどの労力で終えることができました。

 二年前この欄で、「人生データベース」という構想を私は提唱しました。地域に住む高齢者の方々から聞き取った貴重な経験を、公共のコンピューター上に蓄積しておき、ネットワークを通して地域の子ども達に自由に、さまざまな角度からそれを学んでもらおうというものです。学校や家庭で自由に検索、学習できます。子ども達はそうした学習を通じて、核家族では得にくい地域の歴史や高齢者の知恵を楽しみながら身に付けることができるはずです。

 ただし聞き取った貴重なデータを、どのようにしてパソコンに入力するか、という問題が残ります。ボランティアの方々の協力を得たとしても、膨大な労力と時間が必要になります。この音声認識ソフトの出現は、そうした現実的な問題を解決してくれる糸口となりそうです。残念ながら録音テープから直接原稿にすることはまだまだ無理ですが、構想自体が夢物語でなくなってきた事に、いま一筋の光を見た思いがするのです。



TO:随筆の部屋