超短期の対策で統計検定2級に合格した話

みなさんこんにちは。GMOアドマーケティングのM.H.と申します。このたび統計検定2級に合格しましたので、合格までの体験記を簡単に書いていこうと思います。

なぜ統計検定を受けようと思ったか

まず、統計検定を受けようと思った経緯として
  • 機械学習を用いた最適化業務にあたり、アウトプットされた結果が統計的に本当に意味があるのか?という疑問に対して、正確なエビデンスとして示すために検定する必要があったこと
  • 大規模なデータについて分析業務へのアサイン比率が増えてきたこと
  • データサイエンスの知識を深めて自分の専門性を向上させるための足がかりとする
と言う点がありました。大学では既に機械学習モデルや統計学に関して、独学で勉強して自身の研究にも応用するなどしていましたが、体系的に学んだり、客観的に観てスキルを証明できる形で残したりなどはしてこなかったため、ちょうど良い機会だと思い受験に踏み切りました。

ある程度知識はあったので飛び級で準1級から受けてみようかと最初は思っていましたが、2級と比べてかなり出題範囲が広くなり、加えて2級で学ぶ知識量でデータ分析業務などには十分活かせると考えたため、一旦は2級を受験することにしました。結果から言うと2級から受験して正解だったと思います。

筆者の簡単なプロフィール

大学では情報工学を専攻していました。受ける講義の中には統計学について学ぶものもありましたが、当時はそこまで重要視していなかったこともあり正直頭からはだいぶ抜けていたと思います。

研究は機械学習をメインに進めてました。必然的に統計的な知識もある程度は必要になってくるので、研究室にある本からかいつまんで独学で勉強はしていました。ただし2、3年前の話なのでこちらも記憶は薄れている状態でした。

統計検定2級の出題範囲やその他詳細について

大学で学ぶ統計学のうち、おおよそ2年次までの範囲となります。公式が公表している出題範囲表はこちらから確認できます。

ざっくり言うと、箱ひげ図や度数分布表など高校までに学ぶ統計の基礎部分にはじまり、条件付き確率やベイズ定理、共分散辺りの計算問題と、t分布やカイ二乗分布、F分布など各種分布を使った区間推定・検定が出てきます。また、フィッシャー3原則、標本抽出法、検出力についてなどの知識も問われます。

現在は新型コロナ禍を経て、紙で解くPBT方式(Paper Based Testing)ではなく会場内のパソコンで解答するCBT方式(Computer Based Testing)に完全移行しており、会場で配られる計算用紙で計算しつつどんどんパソコンに解答を入力していく形式になっています。雰囲気的には自動車教習所でやる効果測定みたいな感じでした。

試験時間は90分、問題数はおよそ35問程度です。キーボードで入力する問題が数問あり、そのほかはラジオボタンから正解を選択する問題で、1問につき大体5、6個の選択肢が存在します。先述の通り計算問題や検定問題など、時間が取られる問題がいくつか出題されるため、問題文を見て何をすべきかがスッと出てくるレベルでないとどんどん時間を浪費して最終的に足りなくなってしまう可能性があります。過去問を解いたりして実際に手を動かすことで、問題のパターンを把握しつつ時間分配をシミュレーションしておくのがおすすめです。

合格点は100点中60点です。紙の試験だった時は70点だったらしいですが引き下げられたようです。6割と聞くとなんだかいけそうな感じはしますが、やはり時間との戦いになる可能性は高く、確実に稼げる問題を落とさないようにしておくべきかと思います。

ちなみに合格率は一番最後のPBT方式試験で34.1%とのことですが、これは試験方式も変わったのであまり気にしない方がいいと思います。

使った教材と勉強時間

統計検定2級合格に向けて使用した教材ですが、よくある参考書的な書籍を購入して勉強などはしませんでした。代わりに、Youtubeにアップされている動画やwebコンテンツを利用しました。2級の範囲であれば、いろんな形式の教材がインターネット上にゴロゴロ転がっていますし、要点を押さえてくれている教材も多々ありました。そのうちメインでインプットに使っていたコンテンツを以下に紹介していきます。

とけたろうチャンネル


Twitterやブログ、YouTubeと様々なメディアで統計学について情報を発信している とけたろう さんのYouTubeチャンネルです。
2級の内容に関しては全網羅されており、各分野の要点を分かりやすく解説してくれています。なぜそうなるのか?を視覚・聴覚的にインプットしやすく、元々統計学を全くかじってこなかった人でもすんなり知識を吸収できると思います。
また、各動画内で実際の統計検定2級の過去問の類題や演習問題も紹介、解説しているのもとても良いです。

こちらは再生と停止を繰り返してメモをとったりしながらおおよそ10時間程度でコンテンツを観終えました。

統計WEB

こちらの「統計学の時間」コンテンツでは統計検定2級+αの内容を勉強することができます。こちらも要点を抑えた解説が多くあり、良質なコンテンツだと思います。
各分野には練習問題がありますのでここでも実際に手を動かして解いてみるのがおすすめです。

分野ごとにページが分かれており、コンテンツ全体として体系的にまとまっているので、基本的には演習問題を解いていてその都度分からないことがあったり、要点を簡単に確認したいときに利用していました。

あつまれ統計の森

こちらでは統計検定のPBT方式時代の過去問と、その解説が載っています。
実際には過去問演習に一番大きく比重を置いて勉強時間をかけました。2018年と2019年の各2回分と、2021年の6月の計5回分をこなし、総合的には20時間程度費やしました。

先述の通り計算問題や検定問題など、時間が取られる問題がいくつか出題されるため、問題文を見て何をすべきかがスッと出てくるレベルでないとどんどん時間を浪費して最終的に足りなくなってしまう可能性があります。過去問を解いたりして実際に手を動かすことで、問題のパターンを把握しつつ時間分配をシミュレーションしておくのがおすすめです。

米国データサイエンティストが教える統計学超入門講座【Udemy】

こちらはUdemyで受講できる有料の講座です。2級を取るだけなら必須ではないと思いますが、こちらの講座では自前のPC環境にDockerを導入しJupyter Notebook内でPythonコードを書いていくことで、統計知識を業務に活かしていくための方法を習得することができます。講座名に「超入門」とありますが、使う統計的知識はほぼ2級レベルとなります。

今回そもそも統計検定を受けようと思った理由が、業務上統計知識が必要になるためだったので、似た境遇の方で金銭に余裕がある場合は是非受講をおすすめします。

こちらは統計検定の勉強を本格的に始める前から少しずつ進めていました。講座全体の時間としては15時間程度です。

また、該当講座は社内のデジタル人材育成制度を活用して受講しました。この制度は、社内パートナー全員がテクノロジーや知識をより深く理解することで広告の新しい価値を創り出していくことを目的としたものになっており、自分が受けたいUdemyやCourseraなどのオンライン学習講座や資格受験の費用を負担してくれる制度です。
買い切りタイプのオンライン講座であればいつでも必要な時に試聴することができるため、今回の統計検定受験時はもちろん、今後の業務で改めて必要となった場合に確認が可能であり非常に有意義な制度だと思い活用しました。

2級を受けた感想とこれから

ここまで紹介してきたコンテンツを全部合わせ、約2週間程度勉強して無事合格することができました。YouTubeの動画やWebページだと通勤時間中に進めたり、寝る前にちょっと時間をとって進めたりできるので、かなり効率良く学習することができたと思います。

6月中旬に合格してから早速勉強した統計知識を業務で活用する場面もあり、取ってよかった資格だと思いました。今後は統計検定準1級・1級の受験も考えておりますので、その時が来たら再び筆を執りたいと思います!