nnabla ディープラーニングチャンネル

nnabla ディープラーニングチャンネル

[AI論文解説] MMDisCo: 音とアラインされた動畫生成!ICLR採擇論文を解説 | Sony's Research Minds

影片類型
一般
發布日期/時間
2026年4月11日 17:00
動畫長さ
26:14
觀看次數
295
點讚數
12
コメント數
-
エンゲージメント率
4.1%
データ確認日時
2026年4月17日 15:19

動畫概要

Sony's Research Mindsは、優れた研究を行っている方をお呼びして、その魅力を引き出す對談番組です
今回はICLR 2025採擇論文"MMDisCo"についての對談です
Akio Hayakawa, et al. "MMDisCo: Multi-Modal Discriminator-Guided Cooperative Diffusion for Joint Audio and Video Generation" in ICLR 2025
code: https://github.com/SonyResearch/MMDisCo
arXiv: https://arxiv.org/abs/2405.17842

【目次】
00:00 - Intro
00:41 - 概要
01:43 - 研究内容の紹介
02:43 - 背景
06:44 - Composable Approachの課題について
10:33 - 提案手法
18:47 - 實驗結果
24:00 - 將來の展望
25:34 - Outro

VIDEO -
Creative Direction & Cinematographer: Yuki Asukabe
1st Assistant Camera: Katsuya Sakoyama
Special Thanks: Backcasters

--
こちらのチャンネルは、ソニーの有志による最先端のディープラーニングの技術情報(講義、最先端論文紹介)などを發信するチャンネルです。チャンネル登録と應援よろしくおねがいします!
#ai #neuralnetworks #deeplearning
[AI論文解説] MMDisCo: 音とアラインされた動畫生成!ICLR採擇論文を解説 | Sony's Research Minds