動画中の音声をテキスト化し全文検索出来る EveryZing

EveryZingという、動画に特化した音声認識技術を提供している企業の紹介。彼らの提供するezSEARCHは、動画中の音声を自動で”テープ起こし”してくれるSaaSのサービス。つまり、動画中で人間の喋った言葉をテキストに変換してくれます。それだけでなく、その喋ったテキストに対し全文検索をかけ、さらに動画中でその言葉を発した時間に飛ぶ機能まで付いています。ニュースサイトBoston.comなどはEveryZingの顧客です。

Boston.comの動画にはEveryZingezSEARCHが使用されており、例えば「Obama」で検索すると、Boston.comが持っている動画で「Obama」と喋っている人がいる動画の検索結果が表示されます。

また、吹き出しの中の「Obama」のリンクをクリックすると、動画中の「Obama」と発した時刻付近に飛ぶことが出来ます(オレンジの丸が付いているところがおおよその発言した時刻)。さらに、動画中の人間が喋った言葉が右にテキストで表示されているので、最初から最後まで動画を見なくても、どのようなことを喋っているかをザックリ把握することが可能。

EveryZingのサービスは現在のところ、英語のみのサービスのようです。日本語で同じ事をやろうと思った場合、日本語は英語と異なり同音異義語があり、またIMEレベルの漢字変換、及び表記揺れ(コンピューターとコンピュータ)に対応した検索などが必要となるので、少しハードルが高そうです。しかし、日本語の音声認識ソフトウェアは実用化されてから10年弱は経つので、近いうちに同じようなサービスを提供する会社が出てくるのではないでしょうか。

まだテキスト検索が中心の現代のWebで、音声中の言葉をテープ起こししてくれるこのサービスは、動画への新たな導線として要注目です。

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>