理系や文系といった専攻分野に関係なく、誰でも平等にスキルを競い合える機会の提供を目的として、SIGNATEが主催する学生向けコンペティション「SIGNATE Student Cup」。このコンペティションへの参加条件はたった一つ。SIGNATE Campus会員であることだけだ。制限や制約なく、思う存分自身のスキルを試し、学び合い競い合うことができる場となっている。 2018年の初開催以降、AIやデータサイエンスへの関心の高まりを受けて毎年開催され、2021年で4回目の開催を迎えた。4回目のテーマは楽曲のジャンル推定。楽曲の特徴情報データをもとに、ジャンルを予測するモデルの精度を競い合う「予測部門」と、外部データも活用しながら新たなジャンル分類方法の探索を行う「インサイト部門」の2部門で開催された。 インサイト部門で見事1位に輝いたのが、今回お話を伺ったyama09さんだ。データサイエンススキルを競うコンペでありながら、モデル作成ではなく方法論の開発という新しいアプローチであるインサイト部門に、どのような思いで向き合ったのか。そして、コンペティションの参加を通じて得たものとは。
▼動画はコチラ▼
ビジネスでもプログラミングでも勝負できないなら掛け合わせればいい。
AIに興味を持ち始めたのは、学部3年生の頃でした。当時、私はすでに大学院への進学を決めていましたが、周りには進学せずに就職を選ぶ友人たちも多くいました。彼らから就職活動の話を聞いているうちに、今からでも何か準備しておいたほうがいいのではと思い始めました。進学はするものの、いずれは私も就職することになる。その時に、何か実績があった方が有利になりそうだなと。 そこからビジネスコンテストやプログラミングコンテストなど、様々なものに参加していきましたが、あまり思うような結果が残せていませんでした。そこで気付いたのが、自分はビジネスもデータサイエンスも特別得意なわけではないということ。それならば、どちらか一本で勝負するのではなく、合わせ技で勝負しようと。ビジネスとプログラミングどちらも活かせるもの。そして、就職活動で役に立つような実績を作ると考えると、コンテストが開催されているような領域がいい。そこに当てはまるのがデータサイエンスだったのです。
独力でAIを学び始めるも、初参加のコンペティションは惨敗。
理系ではありますが、専門的にデータサイエンスを学んだ経験はなかったので、書籍を読んだり、インターネットで調べたりしながら独力で少しずつ学習を進めました。ただ、それだけではどうしても実践的な知識が身につかない。仕組みや理論は分かっても、それを活用して目的に沿ったモデルを構築できるイメージがあまり湧きませんでした。そこで、SIGNATEさんが提供しているオンライン講座『SIGNATE Quest』を受けることにしたのです。実戦に近い練習問題も多く用意されていたので、書籍だけでは身につけることができなかった実践的な知識とプログラミングスキルを、ある程度身につけることができたように思います。 しかし、腕試しに初めて参加したSIGNATEのコンペティションでは惨敗でした。サブミットはできたものの、下から10番目くらいの順位だったと思います。順位は奮いませんでしたが、せっかく参加したからには何か得ないともったいない。そう思い、入賞された方の解法を読み込んで、コードを真似したり自分に足りていなかった部分を考察したり、他の方が行っているいいところは全部盗んでやるくらいの気持ちで復習を徹底しました。 入賞者の解法を読み込むことでプログラミングスキルを磨くことはできましたが、まだまだ基本知識も足りていないと痛感したので、オンライン講座『SIGNATE Quest』で知識の学び直しも行いました。ただ解くだけでなく、なぜその解き方が良いとされているのか、他にどんな解き方が考えられるのかといったところまで考えながら、データサイエンスの基礎を徹底的に叩き込んでいきました。
AIコンペティションで、あえてAIに縛られないというチャレンジ。
改めて学び直しをしましたが、本当に自分の物になっているのか。それを確認するために、いくつかコンペティションに参加しました。その内の一つが今回のコンペティション「SIGNATE Student Cup 2021春:楽曲のジャンル推定チャレンジ!!」でした。 このコンペティションは楽曲のジャンル推定を行う機械学習モデルを作成する「予測部門」と、ジャンル自体を何を基準に分類すべきかを考える「インサイト部門」の2つの部門があり、どちらの部門にも参加しました。参加を決めた当初、私はインサイト部門ではAI的アプローチとは異なるアイデアで楽曲ジャンルを分類できないかと考えていました。AIの王道アプローチで行う予測なら、予測部門ですればよく、インサイト部門では、敢えて違ったアプローチで勝負してみようと。 そこで、AIに縛られずにジャンル分類に使える方法について調べてみたところ、心理学が使えそうだなと思い至りました。例えば、音楽を使った医療セラピーのような論文が多くヒットしたので、音楽と心理学には深い関連性があるはずだと見当をつけたのです。 心理学を用いた音楽分類はどんなものがあるだろうか。発想を膨らませていると、ふと感情がキーになるのではと思いつきました。音楽のジャンルは定義自体が曖昧で、時代によって変わります。しかし、音楽から受ける印象については誰でも、どんな時代でもある程度共通しているはず。このことに気づいたとき、これでいこうと決めたのです。
ビジネス×プログラミングという自分らしい解法で1位に。
苦労したのは、楽曲から受ける印象をどう数値化するか。最終的には、印象と楽曲の構成要素の変換行列を作成して、その変換行列を用いて印象を得点化することでジャンル分類を行う手法をとりました。この行列計算に関しては、学部生時代にプログラミングを学んでいた経験を活かすことができたと思っています。 ビジネスコンテストで培った発想の転換力と、大学で学んでいたプログラミングの知見を活かして導き出した分類法。これは、ビジネスとプログラミング、そのどちらでもスペシャリストとして勝負はできない自分だからこそ思いつくことができた解法なのではないかと思います。 その結果、インサイト部門では1位をとることができ、予測部門でも入賞とはなりませんでしたが、参加者の上位20%以内にあたる銀メダルランクには到達しました。また、他の参加者の方の解法からも多くを学ぶことができました。特に、特徴量を導き出す数式や学習モデルのアンサンブルについては、独自の工夫を施している方が多く、大変勉強になりました。ただ、やはり予測部門の成果にはまだ少し未練があるので、AIモデルの作成スキルについては、今後もコンペティションを活用しながら、さらに伸ばしていきたいですね。
今後の目標
せっかく独力で身につけたスキルですし、データサイエンティストになってAIのスキルを活かしたいと思っています。ただ、ビジネスでAIの知見を活かすためには、ビジネススキルも必要不可欠。AIスキルも磨きつつ、それをどこまでビジネスに落とし込んでいけるかを突き詰めていきたいです。 <株式会社SIGNATE主催「SIGNATE Student Cup 2021春:楽曲のジャンル推定チャレンジ!!」の入賞者レポートはこちら>