相関係数とは?分析方法や具体例、注意点などを解説
ビジネスにおいてマーケティングやデータを扱う業務に携わる方であれば、相関係数という言葉を聞いたことがあるかと思います。
相関係数とは、2つの変数(データ)間の関係を表す係数のことで、それらを用いて分析することを相関分析と言います。例えば「気温が上がるとアイスクリームの売上が上がる」ことも相関関係であり、日常生活において、物事が関係しているように見えることがよくあります。ビジネスにおいては気温とアイスクリームのようなわかりやすいものばかりではないため、物事の関連性の洞察を得るためには重要な分析となっています。
本記事では、その相関係数について、意味や事例などを解説していますので、ぜひご一読ください。
目次
相関係数について
本章では、相関係数がどのようなことなのか、説明していきます。
相関とはどのようなことか?
相関とは2つの異なるデータの関係性を表すことです。一方のデータの数値が増加(もしくは減少)すると、もう一方のデータの数値も増加する(もしくは減少する)ような二つの数値の関係性を表しているのです。
その関係性(相関)は「正の相関」 「負の相関」 「無相関」の3つに分けることができます。
相関関係
- 「正の相関」 :片方の値が変化したとき、もう一方の値も同様の変化をすること。
- 「負の相関」 :片方の値が変化したとき、もう一方の値は反対の変化をすること。
- 「無相関」 :言葉の通り、相関がないこと。
またそれを散布図で表すと、以下のようになります。
正の相関:右肩上がりの傾向
負の相関:右肩下がりの傾向
無相関:散らばっている(傾向なし)
相関係数とはどのようなことか?
相関係数は2つの変数(データ)間の関係(相関)を定量的に示した指標のことです。その2つの要素が互いに関係していることを以下のような係数で表します。
※係数の算出方法は次の章で解説します。
相関係数が1に近いほど強い正の相関があり、-1に近いほど、強い負の相関があることを意味します。
また、相関係数が0に近いほど相関がないことを意味します。
相関係数の算出方法について
相関係数は以下の計算式によって求められます。
※ピアソンの積率相関係数
Excelでは「=CORREL(配列1,配列2)」という関数で計算することができます。
改めて散布図で表すと、以下のようになります。
相関分析を行う際に、外れ値を考慮する必要があります。外れ値とは、ほかのデータと比べた際に極端に異なっている値のことです。外れ値を含んだまま相関係数を計算すると、正しい数値が出せないことがあるため、場合によっては外れ値を除外することによって、より明確な結果を得ることができます。そのため、散布図を作り確認することを推奨します。
相関係数の具体例と解釈時の注意点
本章では、相関係数を使った具体例と解釈する際に注意すべき点について、説明していきます。
相関係数を活用できる場面
相関係数は、2つのデータ間(変数)で関係があるのかを調べたいときに活用します。
変数間の関係性を明らかにするだけではなく、明確な関連性が明らかになっていない仮説検証に使われたり、説明変数(独立変数)と目的変数(従属変数)の関係を確認することで、回帰分析などの予測モデルの基盤を作る場合にも利用されます。
相関係数の具体例と相関マトリクス
相関係数の具体例をカレールウについての調査データを用いて説明します。
以下の表は、あるカレールウに対するイメージの回答をExcelで計算した相関マトリクスです。
表を見ると、「X1:コクがある」と「X2:スパイス感が強い」は、相関係数が0.857であり、強い正の相関があることがわかります。
一方、「X3:香りがよい」と「X4:本格的」の相関係数は-0.325のため、弱い負の相関があります。また、「X7:リーズナブル」と「X8:高級感がある」の相関係数は、-0.027と0に近いため、相関はほとんどないことが確認できます。
このように相関係数を求めることによって、あらゆる要素がどの程度関係しているのか定量的に把握することができます。
解釈時の注意点①因果関係
因果関係は、要素同士が原因と結果の関係にあることを指します。相関関係は双方向に関係していますが、因果関係は一方通行の関係です。そのため相関関係があるからといって因果関係もあるとは限りません。
相関関係の代表的な例としてアイスクリームの売上と気温の関係がありますが、因果関係に当てはめると以下のようになります。
解釈時の注意点②疑似相関
疑似相関とは、2つの要素に関係性がないにも関わらず、別の要素の影響で相関関係があるように見えてしまう「見せかけの相関」のことを指します。直接関係のない要素Aと要素Bが全く別の要素であるCの影響によって、あたかも強い関係があるように見えることがあります。
そのため別の要素が影響している可能性がある場合、一概に「相関関係がある」と判断することはできません。
こちらも代表的な例にアイスクリームの売上と水難事故の関係があります。
アイスクリームの売上が最も高い時期と水難事故が多発する時期が重なっており、一見相関があるように見えますが、この2つの要素には「気温」という第3の変数が関係しているため、「疑似相関」であると言えます。
まとめ
今回は相関係数の意味や事例について解説しました。
相関係数は、売上や満足度などの数値に対して、それぞれの要素がどの程度関係しているのか定量的に示す指標です。市場調査を行い、その結果から相関関係を分析することによって、マーケティングや商品開発時の方向性を決める際などに役立てることができます。
市場調査やデータ分析において、お悩みなどございましたら、お気軽に弊社までお問い合わせください。
(digmar編集部)