「そのサケ、偽物かも?」AIで魚の偽装を見破る試み(AI×食品)【論文】

ニジマスをサケとして売る悪徳業者の存在

こんにちは。釣りを趣味としながらAI開発を本業としています、つりくず(@kuzu_tsuri)です。今回は、釣りとはやや離れますが、魚の偽装をテーマにした論文を紹介したいと思います。

日本国内では、過去に食肉の偽装事件が世間を大きく騒がせたことはあれど、魚を偽装するという話はあまり耳にしたことがないかもしれません。しかし、世界レベルで見ると、残念ながら魚を偽装する悪徳業者が存在します。

ターゲットとなるのは、あの美味しいサケです。特に中国市場では、タイセイヨウサケの輸入量が非常に多く、供給量がしばしば不足する事態も発生しています。

そこで悪徳業者は、サケと似た魚肉を持つニジマスに着目しました。ニジマスはサケと比較して非常に安価で入手することが可能なため、サケにニジマスを混ぜて出荷することで、粗悪なサケ商品を流通させてしまっているのです。

このような問題を解決するため、中国農業大学のChenら研究者は、AIによるサケとニジマスの混合物検知に取り組みました。

機械とルールで魚の混合物を見破る

Chenらの研究のポイントは以下の通りです。

✔️ミッション
サケとニジマスの混合物をAIで見抜く。

✔️解決手法
機械学習による特徴量の選択モデルとルールベースによる分類モデルを組み合わせた。

✔️結果
誤差が8.7%の高精度なモデル構築に成功した。

研究の詳細を以下で述べます。

食品の偽装検知には時間がかかる

AIを利用しない既存の技術でも、サケとニジマスの混合物を検知することはできます。たとえば、「DNA解析」をすれば、比較的容易に検出することができます。

しかし、DNA解析は正確性が高いとはいえ、非常に時間がかかります。

DNA解析では、混合物を破砕し、遠心分離機を使ってDNAを抽出し、そこからサケとニジマスのDNAを識別する遺伝子配列を増幅させる必要があります。また、増幅させた遺伝子配列が偽陽性(間違ってニジマスの遺伝子が検出されてしまう現象)を示していないことも同時に証明する必要があります。

このような手法では、検査対象が増えるにつれ、時間とコストが非常にかかります。

一方で、DNA解析よりも簡単に混合物を検出する技術に「ラマン分光法」があります。ラマン分光法では、混合物を破砕し、光を当て、光の散乱を測定することで、混合物か否かを特定することができます。ただし、ラマン分光法は簡単に利用できるものの、残念ながらDNA解析と比較すると精度が低いです。

たとえば、下図のように、サケを検査した光の散乱の波形(赤線)は、ニジマスの波形(青線)はほぼ同じ形をしています。ラマン分光法は、サケとニジマスの混合物を見抜くタスクを行うという観点では有効な技術とは言い切れないのが現状なのです。

サケとニジマスに含まれる脂質のラマンスペクトルの比較

ラマン分光法に機械学習を組み込むことで検出精度アップを目指す

Chenらは、ラマン分光法から得られた波形に機械学習を適用することで、サケとニジマスの混合物をラマン分光法で検出しようと試みました。

データの収集

学習させるデータは下記の方法で収集しました。

  • サケとニジマスを取り寄せる
  • 取り寄せるサケに偏りが発生しないようにデンマーク産、スコットランド産、チリ産、ノルウェー産のサケをそれぞれ購入
  • 取り寄せるニジマスは中国の様々な地域で購入

さらに、購入したサケとニジマスを粉砕し、それぞれの比率が0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%となるように混合しました。結果、516サンプルを得ました。これらサンプルをラマン分光することで、各サンプルのスペクトルバンドを取得し、学習および評価データとしました。

特徴量の選択

データを取得したら、次は特徴量の選択を行います。今回の研究における特徴量とは、どの波形に注目するか?ということです。

波長の選択には、Recursive Feature Elimination(RFE)、遺伝的アルゴリズム(GA)、そしてSimulated Annealing(SA)を用いて次元を圧縮し、K平均法によってクラスタリングを実施しました。

その結果、遺伝的アルゴリズムとK means法の組み合わせが、最も精度が高く特徴量を選択できることが分かりました(下図参照)。

波長の選択に最も有効な手法を探索する実験結果

アルゴリズム×ルールで精度を高める

特徴量の選択が完了したら、次は分類モデルの構築を行います。ここでは、純粋なサケ、純粋なニジマス、混ぜ合わせたサンプルの分類を行うモデルを構築しました。

モデル構築の際には、代表的な回帰的なモデル(PLSR, Glmboost, Elasticnet, Ridge, Rqlasso, Msaene, Qrf, parRF, ランダムフォレスト, K近傍法)とツリーベースのモデル(条件付き推論ツリー, 勾配ブースティング)を利用しました。これらの様々なモデルを試すことで、最も有効なアプローチを探索しました。

しかし、結果として最も分類が良かったのは、ルールベースで振り分けを行うモデル (下図のCubistモデル)だったのです!

分類モデルによる実験結果

機械学習ベースでのモデルは誤差が10%以上となったのに対し、ルールベースのモデルは誤差は8.37%となりました。

ここからは推測ですが、今回実験したモデルの数が非常に多くなったのは、機械学習ベースの分類モデルで精度を出したかったのにも関わらず、ルールベースのモデルが最も精度が良かったためだと思われます。ルールベースを超えるモデルは存在しないのか探索を続けることで、実験したモデルが増えていった可能性があります。

研究紹介は以上です。

今回の研究で重要なことは、必ずしも機械学習のアプローチが現実世界で有効とは限らないということです。AIを現実世界に導入する際には、ルールベースで実施した方が精度が良かったり、組み合わせることで精度が上がったりする場合が多々あります。

今回の研究結果はニジマスとサケの混合物を見抜くといったテーマでしたが、食品偽装を見抜くという観点では非常に汎用性の高い結果といえます。

この研究成果をより多くの食品偽装の問題へ展開する際には、必ずしも機械学習のみのアプローチが有効な解決策ではないということを頭の片隅に置いておく必要がありそうです。

AI×魚」のほかの記事もどうぞ

▶ 釣りと海洋研究を革新!魚そっくり「ロボット魚」が活躍
▶ 撮影した魚の画像から体長を予測!「釣りに役立つ」AI技術
▶ 魚の声から魚種を予測!「AI搭載型ルアー」で爆釣も夢じゃない?


この記事で取り扱った論文:Chen et a., Rapid Identification of Rainbow Trout Adulteration in Atlantic Salmon by Raman Spectroscopy Combined with Machine Learning, modecules, 24(15) , 2851 - DOI


業界から探す

PAGE TOP