関連記事:AIで画像からフェンスなどの障害を除去する手法が発表【CVPR2020】
視覚的質問回答についての新しい画像キャプションアプローチが登場しました!

背景
画像に対する質問回答などの視覚的質問回答(VQA)は多くの場合一般的な質問とそれに対する答えをキャプションします。このキャプションはこの分野の研究を牽引してきましたが、タスクの最終目的が不明確なことがあります。更に、異なるユーザーの質問に対する答えに対応できないことがあります。
Google ResearchのKenton Leeらは、新しい画像キャプションタスクであるCAPWAPを提案しています。
オリジナル記事の新着はSNSから