<< 前のエントリ合通ロジのトップページへ次のエントリ >>
2009年04月02日

【流通】NEC、携帯で撮影した動画の音声を外国語翻訳するブログ作成システムを開発

--- ケータイのカメラで撮影した動画中の音声を外国語に翻訳し
映像やBGMを付加したブログを自動作成するシステムを開発 ---

NECは、携帯電話のカメラで撮影した動画をサーバにアップロードすることで、動画中の音声を認識して外国語への翻訳を行うとともに、映像やBGMを付加したブログを自動作成できる「多言語マルチメディアブログ創作システム」を開発した。このシステムは、動画中の音声メッセージを音声認識によりテキストデータ化し、テキストを日本語や英語、中国語に翻訳することができる。また、翻訳したテキストデータを元に、関連するイラスト、映像、音楽、BGMなどのマルチメディア素材を、本システムがインターネットで検索し、テキストデータと組み合わせることで、自動的にブログを生成することができる。

このシステムの特長および技術は、以下の通り。

1.動画中の音声メッセージを認識する「大語彙連続音声認識」
携帯電話で撮影された動画中の音声メッセージを認識するために、耐雑音音声認識技術を大語彙連続音声認識エンジンに導入した。本技術の導入により、動画中の雑音を含む音声メッセージに対する音声認識性能を向上し、特に従来は音声認識の精度向上が困難であった屋外等の雑音が多い環境で撮影された動画に対しても、高精度での認識を実現できた。

2.ブログメッセージを英語や中国語などに翻訳する「多言語機械翻訳」
「大語彙連続音声認識エンジン」によりテキスト化されたブログメッセージを、日本語、英語、中国語等の多言語のテキストに翻訳できる。NECが2002年にサービス化した「BestiLand 企業内翻訳ポータルサービス」等で実績のある多言語機械翻訳システムを活用してメッセージを多言語に翻訳し、日本語の音声を用いてグローバルなメッセージの発信を実現した。

3.メッセージからコンテンツを検索する「自然言語文検索」
多言語に翻訳されたメッセージにおいて、単語間の係り受け関係を分析し、その結果から、目的語と述語の組み合わせ等を抽出し、これらを元にインターネット上でコンテンツを検索する。コンテンツの説明文との類似性を判定しながら、メッセージ内容に関連したイラスト、映像、音楽、BGMなどのマルチメディア素材を高精度に自動的に検索する。関連コンテンツを検索する手間を省くとともに、言語に依存しないマルチメディア情報として検索・活用できるため、グローバルなメディアとしての表現力向上が可能になる。

近年、ブログは消費者生成メディアとして、世界的な影響力がますます強くなっている。また、従来のテキストだけでなく、写真や音声、ビデオなどのマルチメディア素材を取り込んだブログが急増している。ブログは、インターネットにより世界中から利用できるため、ブログ作成者は外国語で情報発信を行うことで、世界中の人々と交流を行うことができます。しかしながら、日本語のみによる情報発信では、グローバルな交流ができるブログを十分に活用することが困難だった。

このシステムは、こうした課題を克服するために、言語に依存しないメディア表現(視覚化)と、テキストの多言語化を組み合わせ、グローバルな情報発信・交流を可能にすることを目的に開発した。本システムにより、携帯電話のカメラで動画を撮影中に、携帯電話に向かって話すだけで魅力的なマルチメディアブログを簡易に作成することができ、グローバルな情報発信をより便利に快適に行えるようになる。さらに、このたび開発した技術は、携帯電話によるブログ作成のみに留まらず、多言語でのマルチメディアプレゼン(例えば、多国籍企業の幹部講演のWeb発信など)作成支援や、多言語による動画Web広告の作成支援等へも応用可能な技術となる。

※ 製品名および会社名は、各社の商標または登録商標です

投稿者:gotsuat 08:59| 流通