テキサス工科大、スマホで体型を判定するアルゴリズムの開発に成功(AI×マーケティング)【論文】

   
↓はてなブックマークで応援お願いします!
このエントリーをはてなブックマークに追加

背景)オンラインアパレルショッピングでの不満

最近では、技術の進歩に伴って、オンライン上でアパレル商品を購入する人が増加しています。しかし、サイズ、フィット感、返品作業、コストの問題など、オンラインショッピングならではの課題もあります。

消費者は自分の体にあったサイズか分からないために購入を躊躇したり、購入しても返品したりすることがしばしばあります。返品には、1着あたり合計で約10~15米ドルのコストがかかることもあり、消費者と企業の間で大きな負担となっています。

オンライン上でのアパレル商品が消費者個人にフィットするサイズかわからないという問題に対して、アメリカにあるテキサス工科大学のKamrul H. Foysalら研究者の発表を紹介します。

研究者らは、機械学習手法を用いて画像から体型を判断することを試みました。

テーマ)機械学習による画像情報からの人の体型判断

まずはKamrul H. Foysalらの研究におけるミッション・手法・結果をまとめました。

✔️ミッション
オンライン上のアパレル商品が個人にフィットするかを測りたい。

✔️解決手法
画像から体型を判断できるシステムを開発した。

✔️結果
体型検出精度で87.5%を達成した。

ミッションから説明していきます。

目的)アパレル商品のフィット感を判別する

衣服のフィット感は、個人の体型に大きく依存しています。そのため、オンライン上のアパレル商品はフィット感の悪さによる返品が比較的多く起こります。それに伴って消費者と小売業者の両方に時間と費用がかかり、ともに負担を背負うことになります。

アパレル商品のほとんどが幅広い体型に合うよう汎用的に作られているため、個人にパーソナライズされたフィット感を実現するには課題があります。個人に最適な衣服のフィット感を判別するには、人の体型の情報が重要になります。しかし現在の技術では、衣服のフィット感に関連する体型情報を提供することはできていません。

手法)機械学習手法による特徴ベクトルの分類

Kamrul H. Foysalらは、画像から人の体型を判断し、分類を行うシステムの開発を試みました。

データセットと前処理
データセットには、以下の4つの体型カテゴリそれぞれに対して20枚ずつ画像を用意しました。

・逆三角形型:肩幅がヒップよりも広い場合
・洋梨型:ヒップが肩よりも幅広の場合
・砂時計型:肩幅とヒップの幅が近く、ウエストが特に細い場合
・矩形型:肩、バスト、ウエスト、ヒップの幅が近く見える場合

これらの画像は、オンライン上で収集された160枚の画像からアパレルデザインの専門家が手作業で選定した画像です。
データセットに対しては、画像リサイズ、エッジ検出、平滑化の前処理を行いました。図1にエッジ検出後、平滑化後の画像をそれぞれ示します。

図1. (a) エッジ検出後の画像 (b) 平滑化後の画像

1. 特徴点抽出
前処理された画像に対して、Speeded Up Robust Features(SURF)を用いて特徴点抽出を行いました。
SURFによって、前処理により抽出された輪郭において支配的特徴を有していると判断された点が特徴ベクトルとして抽出されます。
図2に特徴点が抽出された画像を示します。

図2 特徴点が抽出された画像

2. 特徴ベクトルのクラスタリング
次に、SURFにより得られた78000個の特徴ベクトルを、k-means法を用いて500のクラスタに分類しました。
各クラスタの中心にある代表的特徴ベクトルをVisual Wordsとして辞書に登録します。この辞書に含まれる単語が一つの画像にどのくらい存在するか分析することによって画像を分類していきます。

3. 体型ごとの分類
入力画像の特徴ベクトルを抽出し、k-NN法(k近傍法)を用いて各画像に対して500語の特徴についてのヒストグラムを作成します。これは、入力画像に含まれる特徴量がそれぞれ辞書内のどのVisual Wordsに分類されるかで作成されます。
入力画像は、ヒストグラムで最も多く現れたVisual Wordsが4つのうちどのカテゴリに属するかで分類されます。

図3 (a)砂時計体型の入力画像 (b)500個のVisual Words出現ヒストグラム (c)入力画像に出現した上位3個のVisual Wordsの位置

結果)画像からの体型検出を高い精度で達成

結果、提案された手法は87.5%の精度を達成しました。

Bag-of-Featuresモデルでは、各カテゴリから最低252,343個の特徴量を抽出し、データベース全体で合計1,009,372個の特徴量(252,343個の特徴量 × 4カテゴリ)を得ました。表1に示すように、k-NN分類器は、逆三角形型と矩形型の体型を100%の精度で検出し、砂時計型と洋ナシ型の体型をそれぞれ67%、83%の精度で検出しました。この結果を平均して全体のテスト精度は87.50%となりました。

表1 Bag-of-Wordsを用いたk-NN分類器による4つの体系の分類結果

提案したBag-of-Featuresモデルとk-NN分類器を用いた機械学習法は87.50%の精度であるのに対し、分類タスクの基本的アプローチであるサポートベクターマシン(SVM)や基本的なニューラルネットワークである多層パーセプトロンMLP)はそれぞれ72.17%、62.50%の精度でした。

表1 実験手法と精度

従来は身体情報の具体的な数値によって体型検出を行っていましたが、本研究により画像からの情報のみで体型検出を行うことできるようになりました。

研究紹介は以上です。

本研究はスマホのアプリ用の技術として取り組まれています。オンライン上でのアパレル商品購入の際に自分の体型にあったものが簡単に探し出せるようになることが期待されます。より詳細な体型検出ができるようになり、1日も早く私たちが利用できる未来が実現するといいですね。


【ほかの記事もどうぞ】

この記事で取り扱った論文:Kamrul H. Foysal, Hyo Jung Chang, Francine Bruess, Jo Woon Chong, “SmartFit: Smartphone Application for Garment Fit Detection”,Electronics2021, 10(1), 97 – DOI


業界/カテゴリー

PAGE TOP