技術概要
本技術は、動画データの情報分類において、計算量の増大を抑制しつつ学習効果を高め、分類精度を向上させる革新的な情報分類装置、学習装置、及びプログラムです。入力された動画データをテンソルに変換後、複数の層からなるベースモデルと、動画データの全フレームとの相関情報を含む時間相関特徴統合中間テンソルを生成する「時間相関ブロック」を組み合わせることで、動画特有の時間軸情報を効率的に捉えます。これにより、従来の動画分析AIが抱えていた計算負荷の高さと時間情報活用の限界を同時に解決し、より精度の高い動画理解を実現します。
メカニズム
本技術の中核は「時間相関ブロック」にあります。このブロックは、ベースモデルの特定層から出力された中間テンソルを入力とし、参照信号と中間テンソルとの時間方向の相関を計算する時間相関計算部を備えます。計算された時間相関テンソルは時間相関統合部で一つのテンソルに統合され、時間相関特徴計算部で動画の時間相関特徴を示すテンソルが算出されます。最終的に、この時間相関特徴テンソルと元の中間テンソルを統合し、時間相関特徴統合中間テンソルとしてベースモデルの次層に出力します。この一連の処理により、少ない計算量で動画の全フレームにわたる時間的文脈を効果的に学習モデルに組み込むことが可能となります。
権利範囲
AI評価コメント
本特許は、残存期間の長さ、有力な代理人の関与、そして審査過程での拒絶理由克服といった全ての評価項目で減点ゼロのSランクを獲得しました。特に、先行技術が1件のみという事実は、技術の先駆性と独自性の高さを強く示しており、将来の事業展開において極めて強固な競争優位性を確立できる可能性を秘めています。
| 比較項目 | 従来技術 | 本技術 |
|---|---|---|
| 計算効率 | 既存のCNN-RNNモデルは高負荷 | ◎低計算量で高速処理 |
| 時間軸情報の活用 | フレーム単位の処理が主流 | ◎全フレームの時間相関を統合 |
| 分類精度 | 文脈理解に限界 | ◎時間相関で高精度化 |
| 導入柔軟性 | システム改修が必要な場合が多い | ○モジュール構造で組み込み容易 |
導入企業が動画コンテンツの分類・タグ付けに年間12,000時間費やしていると仮定します。本技術により、作業時間を80%削減し、かつ分類精度向上による誤分類率を5%改善することで、年間(12,000時間 × 0.8) × 5,000円/時間(人件費・機会損失)+ (1.2億円の売上 × 0.05) = 年間4,800万円のコスト削減と600万円の売上機会創出、合計5,400万円の経済効果が見込まれます。これは、業務効率化と新規事業機会創出を両立させる効果です。
審査タイムライン
横軸: 処理効率
縦軸: 分類精度