技術概要
本技術は、映像以外の特殊なデータを用いることなく、入力映像から効率的に要約映像を生成する画期的なシステムです。中核となるのは、ニューラルネットワーク(NN)が映像区間の重要度を自動で算出する学習装置および生成装置。映像を区間ごとに分割し、要素別特徴ベクトルを生成。学習済みのNNがその重要度を演算し、高い重要度の区間を連結することで、高品質な要約映像を自動生成します。これにより、膨大な映像コンテンツの管理・活用における時間とコストを大幅に削減し、メディア、監視、教育など幅広い分野でのDXを強力に推進するポテンシャルを秘めています。
メカニズム
本技術の要約映像生成装置は、まず入力映像を所定の区間に分割します。次に、分割された各区間映像から、予め定めた要素ごとの要素別特徴ベクトルを生成します。この特徴ベクトルは、予め学習したニューラルネットワーク(NN)モデルに入力され、各区間映像の要約映像としての重要度が演算されます。学習プロセスでは、要約に用いられた正例区間映像と用いられなかった負例区間映像のペアを使用し、正例の重要度から負例の重要度を減じた値が最大となるようにNNのパラメータが調整されます。最終的に、演算された重要度の高い区間から順に選択し、それらを連結することで高品質な要約映像が自動生成されます。
権利範囲
AI評価コメント
本特許は減点項目が一切なく、極めて高い知財価値を持つSランクです。2040年までの長期残存期間は、長期的な事業戦略の安定した基盤を提供します。拒絶理由通知を乗り越え登録に至った経緯は、審査官の厳しい審査をクリアした堅牢な権利性を示し、有力な代理人の関与も権利の質の高さを裏付けています。
| 比較項目 | 従来技術 | 本技術 |
|---|---|---|
| 特殊データ要否 (メタデータ等) | 多くの場合、要 | ◎不要 |
| 要約映像の生成精度 | 手動は高、ルールベースは中 | ◎高 |
| 編集・選定速度 | 手動は低、ルールベースは中 | ◎高速 |
| 導入・運用コスト | 手動は高、ルールベースは中 | ◎低 |
導入企業が年間2,000本の映像を制作し、1本あたりの要約・選定作業に平均2時間要すると仮定。人件費を年間600万円/人(月給50万円)とした場合、本技術により作業時間を50%短縮(1時間/本)できれば、年間2,000時間分の作業コスト削減が見込めます。この削減効果は年間約3,000万円と試算され、さらにコンテンツ公開サイクル短縮による機会損失削減効果として2,000万円上乗せすることで、年間5,000万円規模の経済効果が期待されます。
審査タイムライン
横軸: コンテンツ制作効率
縦軸: 導入・運用コストパフォーマンス