Column連載コラム
2021.10.04
【講師自己紹介】大学時代の専攻と、これまで携わった業務
■はじめに
データサイエンスアカデミーで兼任講師を務めております、元村と申します。普段はグループ会社のデータフォーシーズでデータサイエンティストとして働いており、その傍らでデータサイエンスアカデミーの講師を務めております。
初めての投稿という事で、自己紹介として以下の2点について述べていきます。
・大学時代の専攻について
・これまで携わった業務について
■大学時代の専攻について
ここでは大学時代の専攻に触れつつ、なぜデータサイエンティストを目指そうと思ったのかについても述べていきます。
私は理工学の学士号、情報学の修士号を取得しておりますが、学部でも修士でも専攻は数学であり、その中でも解析学を専攻しておりました。「解析学という分野を初めて聞いた」という方もいらっしゃるかもしれませんが、「微分積分から発達していった分野」と思ってもらえれば大丈夫です。私が研究していた内容について簡単に説明しますと、シャボン膜の形状についての理論的な研究をしておりました。難しい話については省略しますが、詳しく知りたい方は「極小曲面」と検索していただくと、どのような研究がなされているかが分かるかと思います。
数学を専攻していたという事で、大学時代に統計学の講義を履修したり、プログラミング(C言語など)について多少かじったりはしたものの、データサイエンスの講義を履修したり研究でデータ解析を行ったりという事は全くありませんでした。そのため、「大学時代にデータ解析に関する何かを行って、この業界に興味を持った」タイプの人間ではありません。
そんな私がデータサイエンティストを目指そうと思った動機ですが、当時就職活動をしていた私には「数学の研究で培った”問題解決力”を活かしたい」という考えがありました。これを軸に色々な職業について調べていたところ、データサイエンティストという職業に出会い、「”問題解決力”が活かせそう」と思いましたので、この業界へと足を踏み入れた形になります。
実際、業務をしていて「”問題解決力”が活かせている」と感じる場面はあります。例をひとつ挙げますと、「この仮説を検証したいので、こういうロジックで解析をお願いします」といった依頼が来る場合があります。その際、提示されたロジックが妥当であるかなどを批判的に考察した上で、必要に応じてお客様とディスカッションをしたり、逆にこちらからロジックの提案を行ったりしております。
また、機械学習の理論背景などを理解するため個人的に勉強をするのですが、そういう場面において数学で培った素養がダイレクトに活きてくる場合があります。このように、数学で培った素養や”問題解決力”が日々の業務に活かされているので、この業界に入って良かったと感じております。
■これまで携わった業務について
ここでは私の携わった業務をいくつか紹介しつつ、データサイエンティストにとってこういう事も大事であると個人的に思っている点について述べていきます。
・IoT製品の利用状況
プログラミング言語として R を用いて、某企業が提供しているIoT製品の利用状況を解析し、ダッシュボード作成まで行うプロジェクトに従事しておりました。「ダッシュボード」と言いますと自動車の内装部品をイメージされる方もいらっしゃるかもしれませんが、IT業界におけるダッシュボードとは、データを解析した結果などをまとめて表示してくれる機能の事を指します。ダッシュボード作成を行う方法としては、Python や R などでダッシュボードを作るためのライブラリを利用する以外にも、Tableau や Google データポータル のような「BIツール」を利用するという方法もあります。
データを解析するだけでなく、「どのようにお客様に説明するか、どのように解析結果を可視化するか」などといった「結果の見せ方」も、データサイエンティストにとっては大事になってきます。
また、新しいツールや解析技術というのは日々生まれてくるものです。自分が現時点で習得している知識・技術だけで満足してしまうと、時代の流れに取り残されてしまうかもしれません。そうならないためにも、色々なツールに習熟したり、新しい技術を積極的に取り入れていったり、といった貪欲な姿勢が求められると思います。
・天候データを利用した小売業の需要予測
プログラミング言語として Python を用いて、某小売店の需要予測を行うプロジェクトに従事しておりました。この予測のポイントですが、小売店から受領した売上や会員状況のデータだけでなく、天候のデータを利用して予測を行っております。こういう予測をする際に、小売店側で天候データを準備されている、という事は無いかと思います。私が携わったプロジェクトの場合、天候データを販売している企業から購入することで、天候データの準備を行いました。
このように、お客様の方で保有しているデータ以外にも、他の企業から購入するなどしたデータ(=外部データ)も利用することで、より多角的な視点からのデータ解析ができるようになります。ですが、ただ闇雲にデータを使ったからと言って、良い解析が出来る訳ではありません。どのようなデータを適切に利用すれば良いかについて、しっかりと吟味する必要があります。
■おわりに
今回、自己紹介として以下の2点について述べました。
・大学時代の専攻について
・これまで携わった業務について
今後もこちらの方に記事を投稿してまいります。その際には「データサイエンスで使われる知識やツールの話」「もう少し実務に寄り添った話」などについて記事にしていければと思いますので、よろしくお願いいたします。
※講師のプロフィールはこちらで紹介しています