January 21, 2025
Apa itu koefisien korelasi

Belajar Statistik – Apa itu koefisien korelasi?

Koefisiensi korelasi, biasa disebut r, adalah sebuah nilai yang menentukan seberapa kuat hubungan antara 2 variabel. Rumus untuk menghitung koefisien korelasi adalah:

$$ r= \frac{\sum{(x-\overline{x})(y-\overline{y})}}{\sqrt{\sum{(x-\overline{x}})^2 \sum{(y-\overline{y}})^2}} $$

Kisaran nilai yang mungkin untuk koefisien korelasi adalah -1,0 hingga 1,0. Artinya, nilainya tidak boleh melebihi 1,0 dan kurang dari -1,0. Angka -1,0 menunjukkan nilai korelasi negatif sempurna dan 1,0 berarti angka korelasi positif yang sempurna. Secara visual seperti yang ditunjukan pada Gambar 1.

Gambar 1. Kekuatan hubungan antara 2 variabel

Interprestasi Korelasi

Ada 3 penafsiran hasil analisis korelasi :

  1. Melihat arah hubungan antar dua variabel
  2. Melihat kekuatan hubungan antar dua variabel
  3. Melihat signifikansi hubungan antar dua variabel

Klasifikasi Koefisien Korelasi

Adapun klasifikasi Koefisien Korelasi menurut Jonathan Sarwono adalah:

Nilai KorelasiKeterangan
r = 0Tidak ada korelasi antara 2 variabel
0 < r < 0,25Korelasi antara 2 variabel sangat lemah
0,25 < r < 0,50Korelasi antara 2 variabel cukup
0,50 < r <0,75Korelasi antara 2 variabel kuat
0,75 < r < 0,99Korelasi antara 2 variabel sangat Kuat
r = 1Korelasi antara 2 variabel kuat sempurna

Contoh Mencari Koefisien Korelasi

Misalkan terdapat 2 data yaitu x dan y, nilai dari kedua saya tersebut adalah

$$ x = 18,16,20,22,26,12,14,20 \\ y = 12,10,8,20,24,10,16,18 $$

Hitunglah nilai koefisien korelasinya.

Kode Python

Open In Colab

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
In [2]:
#data
x = [18,16,20,22,26,12,14,20]
y = [12,10,8,20,24,10,16,18]
In [3]:
#membuat dataframe
df = pd.DataFrame(list(zip(x, y)),
               columns =['x', 'y'])
df.head()
Out[3]:
x y
0 18 12
1 16 10
2 20 8
3 22 20
4 26 24
In [4]:
df.describe()
Out[4]:
x y
count 8.000000 8.000000
mean 18.500000 14.750000
std 4.503967 5.650537
min 12.000000 8.000000
25% 15.500000 10.000000
50% 19.000000 14.000000
75% 20.500000 18.500000
max 26.000000 24.000000
In [5]:
#rata-rata variabel x
df['x'].mean()
Out[5]:
18.5
In [6]:
#rata-rata variabel y
df['y'].mean()
Out[6]:
14.75

Correlation (r)

$$ r= \frac{\sum{(x-\overline{x})(y-\overline{y})}}{\sqrt{\sum{(x-\overline{x}})^2 \sum{(y-\overline{y}})^2}} $$

Menghitung korelasi menggunakan numpy

In [7]:
np.corrcoef(df['x'], df['y'])
Out[7]:
array([[1.        , 0.67920744],
       [0.67920744, 1.        ]])

Menghitung korelasi secara manual

In [8]:
x_mean = df['x']-df['x'].mean()
print(x_mean)
y_mean = df['y']-df['y'].mean()
print(y_mean )
0   -0.5
1   -2.5
2    1.5
3    3.5
4    7.5
5   -6.5
6   -4.5
7    1.5
Name: x, dtype: float64
0   -2.75
1   -4.75
2   -6.75
3    5.25
4    9.25
5   -4.75
6    1.25
7    3.25
Name: y, dtype: float64
In [9]:
sum_ = np.sum(x_mean * y_mean)
sum_
Out[9]:
121.0
In [10]:
sqrt_ = np.sqrt(np.sum(x_mean**2)* np.sum(y_mean**2))
sqrt_
Out[10]:
178.1488141975691
In [11]:
correlation = sum_/sqrt_
print(correlation)
0.6792074398306666
In [12]:
plt.title('Korelasi variabel x dan y')
plt.scatter(df['x'], df['y'])
plt.xlabel('x')
plt.ylabel('y')
plt.show()

Hubungan antara variabel x dan y adalah berkorelasi kuat.

Kesimpulan

Jika mengetahui adanya hubungan 2 variabel, maka akan diketahui 1 variabel bisa dilakukan penaksiran terhadap 1 variabel lain, melalui bantuan garis regresi. Korelasi memungkinkan peneliti untuk mempelajari variabel alami yang mungkin tidak praktis untuk diuji secara eksperimental.

Untuk artikel terkait statistik dapat dilihat di sini.

Rajo Intan

Blogger, pemiliki Onestring Lab, menulis artikel terkait teknologi informasi dan pendidikan. Web Developer, berpengalaman lebih dari 20 tahun mengembangkan berbagai aplikasi dan sistem informasi. Kerjasama kontak di [email protected] atau https://forms.gle/xAGKkpi6B3BzJyzk7

View all posts by Rajo Intan →

Leave a Reply

Your email address will not be published. Required fields are marked *

Ads Blocker Image Powered by Code Help Pro

Ads Blocker Detected!!!

We have detected that you are using extensions to block ads. Please support us by disabling these ads blocker.

Powered By
Best Wordpress Adblock Detecting Plugin | CHP Adblock