仮説設計の重要性とポイント

データアナリティクス

データ分析において「仮説」を設計することの重要性

皆さんこんにちは。データアナリストのりゅうと申します。

先日下記の記事にて、データアナリストの業務内容や求められる能力について解説させていただきました。

データアナリストとは?

その中の、仮説設計に対するポイントや必要な理由について今回はまとめていきます。

なお、今回まとめる内容は下記の参考文献をもとに作成させていただいておりますので興味がありましたらぜひ読んでみてください。

「それ、根拠あるの?」と言わせないデータ・統計分析ができる本

仮説がなぜ必要か

仮説が必要な理由は大きく分けて3つあります。

仮説が必要な3つの理由

  • 無駄な分析を避けることができる
  • 分析の目的が明確になる
  • 大局的な視点でストーリを作りやすい

無駄な分析を避けることができる

先日の記事でも記載させていただきました、「優秀なデータアナリトとは、無駄な分析をスパッと切ることができる人」に繋がります。

ある程度やるべきことがまとまったら考えすぎずに作業する、というのももちろん重要ですが、それは仮説あっての話です。

仮説が無いと、設計図が無いまま家具を組み立てるくらいグラグラした分析になってしまい非常に危険です。

「何を明らかにしたいのか」という目的と、「おそらくこういうことが言えるのではないか」という仮説を持ち、仮説を検証するために分析をするということを忘れないでください。

分析の目的が明確になる

上でも少し解説しましたが、「仮説」よりも前の段階に大前提としての「目的」が存在しています。

しかし、複雑なSQLを書いていたり、複数の関数をスプレッドシートで扱うなど試行錯誤していると、目的がいまいち分からなくなってしまうというのはよくある話ではあります。

そのため、仮説がしっかり設計されていると、「明らかにしたいもの」と「そのために何をするべきか」が絶対に揺らぐことはないので、ここをぶらさないようにしましょう。

大局的な視点でストーリーを作りやすい

最後は、広い視野で物事を考えるために仮説が必要だということをお話しします。

「選択肢を狭めずに広い視野を持つ」「AかBかではなくCも考える」というような表現は皆さんもどこかで目にしたことがあると思います。

要するに狭い視野じゃダメだよということを言われているのですが、どうしても目の前の作業に熱中するとこれらは疎かになりがちです。

聞き飽きたような表現ではありますが、広い視野で物事を捉えるためにも仮説設計が必要だということです。

 

仮説を分析につなげる4つのポイント

仮説を効果的に分析につなげるためのポイントは4つあります。

ポイント

  • 複数の仮説を用意する
  • MECE
  • 現状の制約条件に捉われない
  • 最初から100点を狙わない

複数の仮説を用意する

前回解説させていただいたデータアナリストとは?の記事でも少し触れましたが、1つの目的に対して仮説は複数用意します。

ディズニーリゾートの来場人数は天気と関係があるかもしれない。はたまた周辺のホテルの予約数と関係があるかもしれない。

上記のように関係がありそうな事柄を複数まとめ確度が高そうなものから優先度をつけて順次検証していきましょう。

MECE

MECEとはMutually Exclusively and Collectively Exhaustiveの略で一言でまとめると「漏れなくダブりなく」です。

仮説を設計し、調べる予定の母数には漏れがないか、ダブりがないか。

基礎的な部分ですが、ここの確認を絶対に怠らないようにしましょう。

現状の制約条件に捉われない

現状の制約条件とは要するに、手元にデータがない、調べたことがないなどです。

これらを理由に仮説を最初から排除してしまうのはとても危険です。

データがないならその部分の調査から始めてはどうか、調べたことがないならある程度仮説を作ってやってみるのはどうかなど、分析を進めるためのポジティブ思考も重要です。

最初から100点を狙わない

最後に完璧を求めすぎないという点です。

出された仮説はもちろん間違っていることもあります。

発明王エジソンが「これは『失敗』ではない。成功しないということを発見した『成功』だ。」のような言葉を残していますが同じようなことが分析においても言えると思っています。

「この仮説はXXの理由で間違っていた」ということがわかっただけでもデータ分析の成果の1つと言えますのでめげずに頑張りましょう。

もちろん仕事には締め切りがありますので、確度の高い仮説を出したいですが、考えすぎて先に進まないなどよりは100点を狙わないでどんどん仮説を出して検証する方が生産性の高い分析が出来ます。

仮説の重要性まとめ

今回はデータ分析の「目的」→「仮説」→「手段」の流れにおける仮説の重要性について解説させていただきました。

難しく考えすぎてしまって時間をロスしてしまったり、確度が低すぎる仮説で無駄な分析をしてしまったなど、初めは多くの問題点があると思います。

分析をしていく中で、この「仮説設計」のある種のコツのようなものが自分の中で固まってくるとより生産性の高い分析をできると思い、僕は日々頑張っております。

最後までご視聴いただきありがとうございました!

 

-データアナリティクス
-

© 2024 Ryu'sHelloWorld Powered by AFFINGER5