Audio source separation for various video contents


AudioSourceSeparation.png

[Abstract]

音の入力信号から背景音情報をリアルタイムに学習することで,人の声と背景音の音源信号を推定する遅延なし音源分離 の手法を提案する.本手法をデジタル映像機器に適用することで,映像コンテンツを視聴している際 に,人の声を聴き取りやすくする,背景音を静かにする,スポーツの臨場感を感じやすくする,歌の練習に用いると いった新しい機能をユーザに提供することを狙う.実際に,遅延なし動作で端末を選ばないため,処理が軽く,効果 をその場で体感しながら視聴できる効果を確認した.また,声と背景音を個別に学習するため,多様なコンテンツで 声と背景音を精度よく推定できる効果を確認した.

[Publications (Japanese) ]




otama1.png