山陽リレーコラム「平井の丘から」
みなさん データサイエンスを勉強しましょう 岩本隆志
近年、データサイエンスの応用分野は広がり続けています。金融分野ではフィンテックと呼ばれる改革が進み、スポーツの世界でも選手の練習メニューから戦術に至るまでデータを用いた分析がなされています。
データサイエンスを用いた業務の大まかな流れは、「データを用いて仮説を立て、検証すること」です。これだけ聞くとたいしたことがないように感じてしまうかもしれません。しかし、そこで得られる結果が人間のレベルをはるかに超えることが明確となってきたため、あらゆる企業がデータサイエンスを用いた業務を行うようになってきました。これまで理系分野とされてきたデータサイエンスの知識は、文理に関わりなく必要となりつつあります。
例えば、製品を販売する仕組みを作るマーケティングの分野のデータ分析について、Date Science Academyのコラム1)では以下のように示されています。
マーケティングの分野において分析としてなりやすいのは施策の効果があったのかというものがよくテーマになります。セールを実施して購買数は増えたのか、CMを流したことで利用者は増えたのかといったというテーマですね。...(中略)...しかし、本当に「セールやCM」に効果があったのかを検証するためには、その他のバイアスを除いて対象の施策の効果を検証しなければなりません。...(中略)...手に入るデータは様々な制約によりバイアスがかかっています。バイアスを除かずに分析を行ってしまうと効果検証を他の要因の影響により、結果が捻じ曲げられてしまうことが往々にして起こりえます。
このバイアス(偏り)を可視化して確認し、除去するためには、プログラミングの知識が必要となります。ですが、心配する必要はありません。データサイエンスで一番有名なプログラミング言語であるPython(パイソン)は、初心者にも非常に親しみやすく、コツさえつかめば誰でもプログラミングが可能なものです。
例えば、「顔認証のプログラムを作りたい」と思ったとき、他のプログラミング言語であれば数百行のプログラミングコードを記述する必要がありますが、Pythonでは、7・8行でできてしまいます。Pythonには、500を超えるさまざまなプログラムの集まりであるライブラリがあり、それを呼び出すだけで自由自在に複雑な処理ができてしまいます。このあたりが、Pythonを用いたプログラミングの楽しさなのかもしれません。
2022年はもうすぐ終わりを迎えます。来年以降も変化が激しい時代が続くと思いますが、皆様もこの変化についていきましょう。
1)引用:https://data-science-academy.org/column/20220830/ D4c Academy KK 閲覧日2022年12月7日