2021年上半期 社内機械学習勉強会開催レポート

こんにちは、GMOアドマーケティングのS.Rです。

社内エンジニア限定で行っている、2021年上半期 の機械学習勉強会が無事に終わりました。今回はその勉強会について、みなさんへご報告させて頂きたいと思います。

前期までの勉強会の内容一覧

開催時間 勉強会の内容
2018年上半期 統計解析法を題材にした勉強会を開催
2018年下半期 機械学習/データマイニング/統計的パターン認識のアルゴリズム
及び、それらを実際の業務に適用するためのノウハウを学ぶ
2019年上半期 Deep Learningの基本知識やフレームワークの活用方法について学ぶ
2019年下半期  社内の本番データを利用して機械学習のモデルを実装
2019年下半期 GCPのクラウドを利用して実際の業務の課題解決を行う
2020年上半期 実戦的な広告のCTRを予測するモデルを実装する
2020年下半期  自然言語処理モデルを使ってキーワードと広告の相性を評価する

今期の勉強会の内容紹介

勉強会の課題の背景:クッキーレスの時代が来る

現在、各広告会社はブラウザのクッキーを利用してユーザーの行動履歴をトラッキングし、ユーザーの好みを予測して相対的に効果が大きい広告を出すことができます。しかしブラウザ市場で主にシェアを握っているGoogle、Appleなどの大手会社はプライバシーを重視する理由で、クッキーによるユーザーの行動履歴のトラッキングを厳しく制限するようになっています。さらに将来は完全にクッキートラッキングを禁止される予定もあります。これからはクッキーレスでユーザーとの相性が良い広告を出す方法を考える必要があります。

クッキートラッキングの代案

クッキートラッキングの代案の一つは、ユーザーの行動履歴を分析しないで広告が掲載されている記事と広告の相性を分析することです。例えば車のレビュー記事を見ている方はカーローンの広告をクリックする可能性があります。

 

弊社は自然言語処理の技術を利用して百万件の記事を指定されたカテゴリーへ分類するシステムを開発しました。今期の勉強会の内容は参加者と一緒に現状のシステムに使われている技術を勉強してシステムを改良してみるということです。

 

 

勉強会の流れ

今期の勉強会は二段階で実施しました。

勉強会の前半は現状のシステムの仕様を理解するために下記の4つのことを行いました

勉強会の後半は現状のシステムの改良を行いました。具体的に下記の5つのこととなります。

勉強会の結果発表

今回の勉強会では、参加者にやって頂けたモデルのハイパーパラメータのチューニングで記事の分類の精度を上げることができた参加者4名を表彰しました。受賞者には、運営側から2000円のアマゾンギフト券がプレゼントされました!

表彰されたメンバーの様子です。

まとめ

現状のシステムの仕様を理解→改良案を作る→改良案を実装の流れで前回より実戦的な2021年上半期の勉強会は終わりました。

今期の勉強会で実際のプロダクトを改良することができました。