Column連載コラム
2022.04.04
データサイエンティストのキャリアにおける統計検定の意義
講師の中澤です。
賛否両論あると思いますが、個人的にタイトルのオチは、「2級以上なら未経験から就職、転職する際、年次が浅いときのアピール材料にはなり得る」というものになります。
キャリアチェンジ:〇
キャリアアップ:△
といった具合です。
データサイエンティストやっていて、準1級までは持っていて、1級は勉強中という程度の目線で書いてみます。
■統計検定とデータサイエンティストの実務
明確に決まっていませんが”データサイエンティスト”という職種で期待される作業はだいたい
・企画、提案
・分析設計
・実装
・レポーティング
・報告・提案
くらいに大別されると思います(もちろん所属する組織によります)。
その中で統計検定の知識がクリティカルに活きるのは「実装」のフェーズだと考えています。キャリアの序盤で担当するのも大体が「実装」フェーズです。そういう意味で親和性があるといってもいいと思います。データサイエンティストの業務のほとんどはデータの加工、前処理といわれるもので、mustになるスキルはプログラミングスキルです。その後の集計結果などを解釈するときに「ん?なんか変だな」とか気づく時の嗅覚として統計検定で学ぶ基礎統計量などの知識が使えると思います。
ただし、統計検定で学ぶ内容がすべてドンピシャで実務に役立つかといわれると、そうじゃないことのほうが多いです。
例えば統計検定を学んでいくなかでは母集団に分布を仮定したうえで、推定・検定をするという経験を多くします。現場でこの手のアプローチをとることは稀です。この辺は基本情報技術者をとっても役に立たないというエンジニアがいるのと同じです。
■検定種別の役立ち度
2級
最低限のリテラシーの証明になるんじゃないかと思います。
私がプロジェクトを進めていく中でチームに来た新人が「統計検定2級持ってます」と言っていれば最低限の知識はある、または勉強の意欲はあるんだな、ということで少し安心します。未経験から転職するときでも多少のアピールにできると思います。
ただ、データサイエンティストやってる人でも結構な人が持ってるので昇進のアピールになったりとかはあまり期待できないと思います。一方、分析の発注側とかコンサルタントが持っていると心強いです。
準1級
実務と一番相性がいいんじゃないかと思います。
多変量解析を中心に各手法を理論の理解が必要になってきます。そういったあたりで適切な手法選択や分析結果を解釈したり説明する際に役立ちます。また、機械学習的アプローチについても触れるので広く浅い知識が得られます。実務の中で、「あ~、○○法が使えそうかも?」という具合に引き出しが増えると思います。試験的にも、実際計算させられることはないにしろ、多少は微積分や行列がわかってないと受からないです。
データサイエンティストの中でも持ってる人がかなりレアなので持ってると「お?」と言ってもらえることが多いです。
1級
実務に使える度で言うと一番ない気がしますがポテンシャルは一番あります。
大学院入試レベルの試験で、試験で出題される問題はほとんどが計算問題です。積分、行列がわからないと門前払いになります。実務で母集団に確率分布を仮定することがなかったり、自前で各種推定量を算出することもないので、この手の学びを実務で使うことはほぼないと思います。
ただしメリットはとても大きいです。勉強の過程で統計学で使う数学を習得できるので、データ分析の手法などに関する勉強をする際に書籍やネットの記事、論文が読めるようになります。ということで実務の中でのとてつもない自走力がつきます。年1回しか受験チャンスがないし、かなり難しいですが挑戦の価値は一番あると感じます。私の知人で1級持ってる方はだいたい”バケモノ”です。仮に経験のない業務でも、ものすごい吸収力で猛追してきます。
■データサイエンティストの長期的なキャリアを考えた時の統計検定
これまで、キャリアが浅いうちを想定しての役立ち度合など雑多に書いてきました。基本的に”作業者”レベルには大なり小なり役立つだろうというのが私の所感です。が、もっと上位のデータサイエンティストとしてやっていく、キャリアアップ的な目線でいうとそれは話が違ってきます。
結局、プロとしてビジネスの世界でデータサイエンティストをやっていくなら、「で、どう儲けるの?」という視座、利益にどう貢献できるのかという視点をもってアプローチできるかどうかが最初の分水嶺になるように感じます。統計検定1級保有、数学の博士号を持っている、Kaggle(データ分析コンペ)のタイトルホルダーなどなど、すごい知識やスキルを持っているにもかかわらず作業者どまりになってしまう人もいます。知識、スキルドリブンになってしまって、自分の持っている豊富な知識やスキルをビジネスにうまく適用できないパターンです。
ビジネスのいち手段として限り、どんな手を使ってもいいから利益を改善したり、ミッションやビジョンを果たすようなアプローチが正義です。”ディープラーニング”とか”AI”、”DX”と言われますが、Excelの単純なクロス集計で結果が出るならそのアプローチを取れるということが結局大事です。
終わりにかえて、取れるなら取っておけばいいという話。
直前で、やや否定的とも取れる書き方をしましたが、「じゃあ統計検定取る意味ないですか?」と言われたらそんなことはないです。むしろ取れるなら取っておいて損はないです。どんどん取るといいと思います。
一つの節目は準1級かと思います(1級は少し毛色が違います) 。2級を取ったら、あと少し背伸びすれば準1級を狙えます。∫やΣを見ても敬遠しないでください。実際に計算するところまでは求められませんから。
なんにせよ今後の学びの助けにもなるし、意欲のアピールもできるという意味で、キャリアが浅いほど挑戦する価値が高いと思います。
※下記のリンクから、データサイエンスと資格についてのコラムをご覧いただけます。
【データサイエンスと資格の話】その① 業務にデータ分析を取り入れたい方におすすめしたい資格の話