Scatter plot (diagram sebar) digunakan untuk mengetahui tingkat eratnya hubungan antara 2 (dua) variabel dan menentukan jenis hubungan antara 2 (dua) variabel, apakah hubungan positif, hubungan negatif atau tidak ada hubungan sama sekali. Scatter plot, juga dikenal sebagai diagram sebar, adalah diagram grafis yang dibangun dari dua sumbu X dan Y (variabel X dan variabel Y). Nilai dari pasangan variabel ini direpresentasikan sebagai titik. Oleh karena itu, Scatter plot sering disebut sebagai diagram sebar . Diagram ini dapat menunjukkan jenis hubungan. Biasanya, diagram sebar digunakan untuk membuktikan atau menyangkal hubungan sebab-akibat.
Seorang peneliti sedang mempelajari jamur. Mereka telah menemukan cincin jamur dan memberi label koordinat. Biasanya jamur menyebar keluar dari pusat jamur awal. Dengan koordinat di bawah ini, peneliti ingin menjawab pertanyaan: Kira-kira di manakah letak pusat pertumbuhan jamur? Buat bagan yang memungkinkan peneliti memperkirakan pusat pertumbuhan.
Contoh Kasus
Data
Berikut ini adalah data yang diberikan. X dan Y merupakan variabel koordinat lokasi pertumbuhan jamur.
x = [4.61, 5.08, 5.18, 7.82, 10.46, 7.66, 7.6, 9.32,
14.04, 9.95, 4.95, 7.23, 5.21, 8.64, 10.08, 8.32,
12.83, 7.51, 7.82, 6.29, 0.04, 6.62, 13.16, 6.34,
0.09, 10.04, 13.06, 9.54, 11.32, 7.12, -0.67, 10.5,
8.37, 7.24, 9.18, 10.12, 12.29, 8.53, 11.11, 9.65,
9.42, 8.61, -0.67, 5.94, 6.49, 7.57, 3.11, 8.7, 5.28,
8.28, 9.55, 8.33, 13.7, 6.65, 2.4, 3.54, 9.19, 7.51,
-0.68, 8.47, 14.82, 5.31, 14.01, 8.75, -0.57, 5.35,
10.51, 3.11, -0.26 , 5.74,8.33, 6.5, 13.85, 9.78, 4.91,
4.19, 14.8, 10.04, 13.47, 3.28]
y = [-2.36, -3.41, 13.01, -2.91, -2.28, 12.83, 13.13,
11.94, 0.93, -2.76, 13.31, -3.57, -2.33, 12.43, -1.83,
12.32, -0.42, -3.08, -2.98, 12.46, 8.34, -3.19, -0.47,
12.78, 2.12, -2.72, 10.64, 11.98, 12.21, 12.52, 5.53,
11.72, 12.91, 12.56, -2.49, 12.08, -1.09, -2.89, -1.78,
-2.47, 12.77, 12.41, 5.33, -3.23, 13.45, -3.41, 12.46,
12.1, -2.56, 12.51, -2.37, 12.76, 9.69, 12.59, -1.12,
-2.8, 12.94, -3.55, 7.33, 12.59, 2.92, 12.7, 0.5,
12.57, 6.39, 12.84, -1.95, 11.76, 6.82, 12.44, 13.28,
-3.46, 0.7, -2.55, -2.37, 12.48, 7.26, -2.45, 0.31, -2.51]
Kode Program
Kode program berikut ini digunakan untuk melakukan import library yang akan digunakan.
import matplotlib.pyplot as plt
Selanjutnya, memasukan data yang telah diberikan sebelumnya.
x = [4.61, 5.08, 5.18, 7.82, 10.46, 7.66, 7.6, 9.32,
14.04, 9.95, 4.95, 7.23, 5.21, 8.64, 10.08, 8.32,
12.83, 7.51, 7.82, 6.29, 0.04, 6.62, 13.16, 6.34,
0.09, 10.04, 13.06, 9.54, 11.32, 7.12, -0.67, 10.5,
8.37, 7.24, 9.18, 10.12, 12.29, 8.53, 11.11, 9.65,
9.42, 8.61, -0.67, 5.94, 6.49, 7.57, 3.11, 8.7, 5.28,
8.28, 9.55, 8.33, 13.7, 6.65, 2.4, 3.54, 9.19, 7.51,
-0.68, 8.47, 14.82, 5.31, 14.01, 8.75, -0.57, 5.35,
10.51, 3.11, -0.26 , 5.74,8.33, 6.5, 13.85, 9.78, 4.91,
4.19, 14.8, 10.04, 13.47, 3.28]
y = [-2.36, -3.41, 13.01, -2.91, -2.28, 12.83, 13.13,
11.94, 0.93, -2.76, 13.31, -3.57, -2.33, 12.43, -1.83,
12.32, -0.42, -3.08, -2.98, 12.46, 8.34, -3.19, -0.47,
12.78, 2.12, -2.72, 10.64, 11.98, 12.21, 12.52, 5.53,
11.72, 12.91, 12.56, -2.49, 12.08, -1.09, -2.89, -1.78,
-2.47, 12.77, 12.41, 5.33, -3.23, 13.45, -3.41, 12.46,
12.1, -2.56, 12.51, -2.37, 12.76, 9.69, 12.59, -1.12,
-2.8, 12.94, -3.55, 7.33, 12.59, 2.92, 12.7, 0.5,
12.57, 6.39, 12.84, -1.95, 11.76, 6.82, 12.44, 13.28,
-3.46, 0.7, -2.55, -2.37, 12.48, 7.26, -2.45, 0.31, -2.51]
Terakhir, ini merupakan kode untuk menampilkan diagram sebar.
plt.title('Area Pertumbuhan Jamur')
plt.scatter(x, y)
plt.show()
Berikut ini merupakan tampilan scatter plot yang dihasilkan dari kode program
Contoh Kode Program Scatter Plot
Berikut ini merupakan contoh kode program dalam pemanfaatan scatter plot.
import matplotlib.pyplot as plt
lemon_diameter = [6.44, 6.87, 7.7, 8.85, 8.15, 9.96, 7.21, 10.04, 10.2, 11.06]
lemon_weight = [112.05, 114.58, 116.71, 117.4, 128.93, 132.93, 138.92, 145.98, 148.44, 152.81]
lime_diameter = [6.15, 7.0, 7.0, 7.69, 7.95, 7.51, 10.46, 8.72, 9.53 , 10.09]
lime_weight = [112.76, 125.16, 131.36, 132.41, 138.08, 142.55, 156.86, 158.67, 163.28, 166.74]
plt.title('Lemons vs. Limes')
plt.xlabel('Diameter (cm)')
plt.ylabel('Weight (g)')
plt.scatter(lemon_diameter, lemon_weight, color='y')
plt.scatter(lime_diameter, lime_weight, color='g')
plt.legend(['lemons', 'limes'])
plt.show()
Berikut ini merupakan tampilan diagram sebar yang dihasilkan dari kode program
Kesimpulan
Bila diperhatikan pada pola titik yang terlihat pada diagram sebar maka akan dapat disimpulkan apakah kedua variabel tersebut memiliki hubungan atau tidak? Jika memiliki hubungan apakah hubungan postif atau negatif. Hubungan positif atinya semakin tinggi nilai x maka semakin tinggi pula nilai y sedangkan hubungan negatif adalah apabila salah variabel meninggi nilainya maka variabelnya lainnya menjadi merendah.
Tentu saja cara yang sudah dijelaskan hanya merupakan salah satu dari sekian banyak cara yang disediakan oleh Matplotlib itu sendiri terkait diagram sebar. Kunjungi tautan ini untuk mengetahui tema data science lainnya. Semoga bermanfaat.