顔認識の超解像度!ブレークスルーに刮目せよ。

256ピクセルで、これほどの情報がとれるというのか。

マックス・スモラックス (寄稿者)

韓国科学技術院(KAIST)の研究者チームは、わずか16 x 16ピクセルの画像から人間の顔の詳細な肖像画を再現できるアルゴリズムを完成させたという。

このアルゴリズムは、低解像度アイコンから現実的な顔画像の再構成を扱う「超解像」領域のサブフィールドである「顔幻覚」としても知られる「顔超解像」に焦点を当てた一連の実験の最新のものだ。

KAISTチームは、(通常SRには採用されていない)プログレッシブトレーニングの進歩と、特定の場所を予測するフェイスヒートマップの巧妙な組み合わせによって、「顔超解像」への取り組みが現在のどの方法よりも正確であると主張している。以下の例をみると驚くかもしれない。

KAISTチームは、ArXivに掲載された論文で、「8倍の超解像顔画像を生成する新しい顔超解像度法を提案」と述べた。「プログレッシブトレーニング法を採用。これにより、ネットワークを連続したステップに分割し、それぞれが徐々に高解像度の出力を生成し、安定したトレーニングが可能になる。」

また、新しい顔のアテンションロスを考案。各ステップでそれを適用して、ピクセルの差とヒートマップの値を乗算することにより、顔の属性をより詳細に復元するそうだ。

「最後に、ランドマークヒートマップ抽出のための最先端の顔位置合わせネットワーク(FAN)の圧縮バージョンを提案します。提案されたFANを使用すると、顔のSR(超解像)に適したヒートマップを抽出でき、全体的なトレーニング時間も短縮できます。」

新しいアルゴリズムはすでに破壊的なインパクトを引き起こし始めている。TwitterやTwitchの顔文字から人間の顔を生成し、恐ろしい結果をもたらしている。ペパロニの代わりに人間の唇を添えたピザとか!

原文

Korean academics claim breakthrough in Face Super-Resolution

AI Business

Translating

PAGE TOP