シンポジウム2 講演3
Generative Adversarial Networksの基礎と応用
演者:
金子 卓弘(NTTコミュニケーション科学基礎研究所)
[抄録]
「高精細な画像が必要になったときに,データベースから探し出すのではなく新規に作り出したい.」「テキストだけから思い描く画像を生成できるようにしたい.」「顔画像を理想の芸能人のような髪型・表情に変換したい.」このように,画像を新規に生成・変換したいという場面は様々なケースで考えられるが,これらを実現するためには,画像のような複雑なデータを忠実に再現・表現できるようなモデルを構築することが必要になる.この問題を解く鍵となる技術として生成モデルの研究が古くから活発に行われているが,解くのは容易ではなく様々な課題が残されていた.ところが,近年,生成モデルが,発展著しい深層学習と組み合わさることによって大きなブレイクスルーが起きている.本講演では,これら深層生成モデルのうち代表的なものの一つであるGenerative Adversarial Networks (GAN) を取り上げ,基礎から応用まで幅広く説明する.GANは非常に高いポテンシャルを持ったモデルであり,GANによって初めてできるようになったタスク,高精度化に成功したタスクは数多く存在する.これらを幅広く紹介することで,聴衆の皆様の研究・開発のヒントになるような情報を少しでも提供できれば幸いである.