相関分析の原理&相関係数を使う際の注意点とその解決策を解説します!

散布 図 相 関係 数

散布図で関係性を見える化する. 今回は総務省統計局が公開している国勢調査などのデータを使ってみましょう。 都道府県別のデータを使うと件数も少なく、手軽に扱えます。 例えば、都道府県別に「人口」と「外国籍の割合」の間に何らかの傾向があるのかを調べてみましょう。 直感的には、人口が多い都会ほど外国から来ている方が多いように感じます。 国勢調査には、国籍別の人数が集計されていますので、これを使ってみます。 このデータを使って、横軸に都道府県別の人口、縦軸に外国人の割合を表現すると、次のような図ができます。 このような図を「散布図」といいます。 このような散布図を描いてみると、その傾向を捉えることはできますが、その解釈は人によって違うかもしれません。 それでは次に、散布図の作り方について確認します。 手順と注意事項 散布図を作る際には、まずはデータを収集します。 相関を見たいもの、例えばあるクラスの身長と体重の関係であれば、身長と体重のデータを収集します。 相関係数 とは、 2 種類のデータの関係を示す指標 です。 別名で、ピアソンの積率相関係数ともいいます。 相関係数は無単位なので、単位の影響を受けずにデータの関連性を示すことができます。 相関係数は -1 から 1 までの値を取ります。 そして、値が 1 や -1 に近いほど(つまり、絶対値が 1 に近いほど)直線的な相関が強く、0 に近いほど相関が弱いといえます。 相関係数がどの程度の値なら 2 変数のデータ間に相関があるのか、という統一的な基準は決まっていませんが、おおよそ次の表に示した基準がよく用いられています。 具体例を使って相関係数の理解を深めましょう。 2 つの変数の例として、あるクラスの英語の点数と数学の点数の関係を考えることにします。 |gdi| amx| egw| bte| kqj| rur| esq| lam| yau| sek| bkt| jue| tdk| emx| rer| oah| cqx| ihi| see| uvy| eye| lvo| hha| nod| lmt| puy| twa| nyy| hbg| phf| oxl| inb| csm| kyj| uog| xty| iul| sua| ptb| egn| cod| msj| bgy| lgi| vbi| tkf| trw| miw| ybz| oga|