winner's_interview_ひろしまQuest2020:画像データを使ったレモンの外観分類(ステージ2)_giorno

レモンの生産量日本一を誇る広島県では、レモン栽培が重要産業のひとつとなっている。一方で高齢化が進み、レモン農地が急傾斜地に作られることもあって、農家の負担が大きくなっている課題を抱えていた。そこで、出荷における選別工数を削減することで、少しでも負荷を減らすことを目的に、画像データを用いてレモン等級を自動分類するアルゴリズムをコンペティションで募集する運びとなった。 本コンペティションで見事1位に輝いたgiornoさんに、本コンペティションへの参加を決めた経緯や、取り組みにおける工夫、参加することで得られた学びなどについて話を伺った。


▼動画はコチラ▼


AIでなら、こんなこともできるのかという感動。

私は現在、エンジニア職として働いていますが、業務の中でAIを活用する機会はほとんどありません。しかし、休日や勤務終了後の時間を利用して、社外のコンペティションには以前から参加していました。きっかけは、異動前の部署でのこと。2015年頃、私は自社の研究所に所属していたのですが、この研究所を通して、データ分析に取り組まれている方と知り合うことができました。そこの方たちにいろいろと話を聞くうち、機械学習やAIって面白そうかもと思い、徐々に興味を持ち始めました。 そこからは、ネットの情報や書籍に目を通したり、少しずつ自分からAIについて学び始めるようになりました。学習を進めるうちに、実際に手を動かして自分で作ってみたいという想いが強くなっていきました。そんな時にちょうどKDD 2015でデータマイニングに関するコンペティションが開催されることを知り、勇気を出して参加してみることに。これが初めて参加したコンペティションです。幸い、このコンペティションはチームでの参加が可能だったので、研究所を通して交流するようになった方々にも声をかけて一緒に参加することにしました。 仲間にいろいろ教えてもらいながら、手探りで進めましたが、楽しかった印象しか残っていません。大量のデータを分析して、テーマに沿った予測結果を自動で導き出す。AIを使うとこんなこともできるのかと、初めてプログラムを書いたときに似た感動と興奮を覚えました。

[014]Winners-Interview-1

苦い経験を糧に、ディープラーニングの資格を取得。

AIの魅力に気づいてからは、個人でもコンペティションに参加するようになっていきました。しばらくすると現在の部署へ異動となり、AIに知見のある方との日々の交流はなくなりましたが、AIへの興味は消えることなく、学習を続けていました。コンペティションとは違い、自学自習にもまた別の面白さを感じていたのです。それは、一つずつわからないことがわかるようになり、自分の幅が広がっていく感覚です。書籍で、今まで知らなかった技術やモデルを知る。その裏にある仕組みを理解して、実装できるようになる。そんな一歩ずつ前に進んでいく感覚が、日々の学習のモチベーションになっていたように思います。 当時は、コンペティションといえばKaggleを中心に参加していたのですが、知り合いからSIGNATEさんのことを聞き参加するようになりました。レモンコンペティションより前に開催された、ひろしまQuestの第一弾コンペティション「プロ野球データを用いた配球予測」にも参加しました。 残念ながら、結果はあまり芳しくありませんでした。自分なりに精度を上げるための仮説を立てて、それに従って特徴量を作成したつもりだったのですが、思ったほどは有効に働かなかったのです。悔しい想いもあり、コンペティション終了後には、直近で取得したディープラーニング系のエンジニアリング資格である「E資格※」の学習内容も改めて復習するなど、さらに勉強を重ねました。結果は出ませんでしたが、モチベーションアップにも繋がったので、配球予測コンペティションに参加してよかったと思っています。 ※E資格:一般社団法人日本ディープラーニング協会(JDLA)が認定するAI資格。ディープラーニングに関する理論や手法、実装に関する試験科目がある。

[014]Winners-Interview-2

数十種類に及ぶ画像処理を全て試す地道な努力が功を奏した。

レモンコンペティションが開催されると知った時は嬉しかったですね。前回参加した配球予測コンペティションが振るわなかったので、挽回しようと燃えていました。テーマや学習データに目を通してみた第一印象も、これならいけそうとワクワクしていました。クラス分類するだけのシンプルなテーマでしたし、E資格の取得に向けた学習の中で画像認識についても学んでいたので、今の私にうってつけのコンペティションだと思いましたし、結果が振るわなくてもコンペティション終了後に他の方の解法を見られれば今後の参考にできますし。 ですが、そんな前のめりな気持ちとは裏腹に、着手した当初は苦労の連続でした。特にベースラインに届くまでは、本当に大変でした。その原因は用意されたデータにありました。レモンの画像データが、綺麗に写っているものから、やや白飛びしているものまでバラバラなのです。それら全てをうまく処理するのが難しく、頭を悩ませましたね。 結果的には、データのオーギュメンテーションに力を入れることでなんとか乗り越えました。最初は単純に明度や彩度をいじってみたのですが、なかなか上手くいきませんでした。ではどうしたのかというと、シンプルに考え得る画像処理の効果を、数十時間かけ全て試してみたのです。その中から効果がありそうなものを取捨選択し、組み合わせることで精度を出せるようになりました。

[014]Winners-Interview-3

結果にも満足でき、学びも多いコンペティションだった。

画像処理以外で言えば、解き方自体を工夫しました。本コンペは、タスクとしては分類問題に当たるのですが、あえて回帰問題として解くことにしたのです。評価値が特殊だったので、分類と回帰どちらも試してみたところ、少しだけ回帰の方が精度が出ました。私を含め、上位3名のうち2名が回帰で解いていたので、アプローチとしては間違っていなかったと思っています。 画像処理と回帰での解法が効いて、ありがたいことに優勝できましたが、反省点もあります。実は、ステージ2のサブミットを行う際に、ステージ1で精度向上に寄与したものだけを取捨選択しており、画像の明度や彩度などいくつか除外してしまったものがあります。たしかにコンペティション上ではあまり効果はなかったものの、実際にこのモデルを運用する場面を想定すると残しておけば良かったかなと思っています。実際の現場では、コンペティションとは違い、どんな画像を処理することになるか分かりませんから。 ただ、結果には満足していますし、学びも多いコンペティションでした。他の入賞者の中には、画像処理時にレモンの背景を消している方もいらっしゃったのですが、実は私も同じような処理を試したもののうまくいきませんでした。結局採用しなかったのですが、ああすればうまくいったのかと勉強になりました。評価指標についても今回初めて知ったものだったので、今後の参考にしたいです。今後も、コンペティションに参加し続けて自分で解法を工夫することはもちろん、他の方の解法からも多くを学んでいきたいと思っています。

[014]Winners-Interview-4

今後の目標

AIの知識を幅広く身につけていきたいです。技術の進歩も早いですし、応用が効く範囲も広いので、学ばなければならないことも多いです。画像認識という領域だけでも、本コンペティションのテーマである画像分類の他に、物体検出やセグメンテーションといったまた別のタスクがあります。それらを幅広く学んで、いつか本業にも活かせるような機会を作りたいと思っています。 <ひろしまサンドボックス推進協議会事務局主催「ひろしまQuest2020:画像データを使ったレモンの外観分類(ステージ2)」の入賞者レポートはこちら> <ひろしまサンドボックス推進協議会事務局主催「ひろしまQuest2020:画像データを使ったレモンの外観分類(ステージ2)」表彰式の動画はこちら>

この記事をシェアする