January 15, 2025
Scatter Plot – Visualisasi Data dengan Matplotlib

Belajar Data Science – Visualisasi Data dengan Scatter Plot Matplotlib

Scatter plot (diagram sebar) digunakan untuk mengetahui tingkat eratnya hubungan antara 2 (dua) variabel dan menentukan jenis hubungan antara 2 (dua) variabel, apakah hubungan positif, hubungan negatif atau tidak ada hubungan sama sekali. Scatter plot, juga dikenal sebagai diagram sebar, adalah diagram grafis yang dibangun dari dua sumbu X dan Y (variabel X dan variabel Y). Nilai dari pasangan variabel ini direpresentasikan sebagai titik. Oleh karena itu, Scatter plot sering disebut sebagai diagram sebar . Diagram ini dapat menunjukkan jenis hubungan. Biasanya, diagram sebar digunakan untuk membuktikan atau menyangkal hubungan sebab-akibat.

Seorang peneliti sedang mempelajari jamur. Mereka telah menemukan cincin jamur dan memberi label koordinat. Biasanya jamur menyebar keluar dari pusat jamur awal. Dengan koordinat di bawah ini, peneliti ingin menjawab pertanyaan: Kira-kira di manakah letak pusat pertumbuhan jamur? Buat bagan yang memungkinkan peneliti memperkirakan pusat pertumbuhan.

Contoh Kasus

Data

Berikut ini adalah data yang diberikan. X dan Y merupakan variabel koordinat lokasi pertumbuhan jamur.

x = [4.61, 5.08, 5.18, 7.82, 10.46, 7.66, 7.6, 9.32, 
14.04, 9.95, 4.95, 7.23, 5.21, 8.64, 10.08, 8.32, 
12.83, 7.51, 7.82, 6.29, 0.04, 6.62, 13.16, 6.34, 
0.09, 10.04, 13.06, 9.54, 11.32, 7.12, -0.67, 10.5, 
8.37, 7.24, 9.18, 10.12, 12.29, 8.53, 11.11, 9.65, 
9.42, 8.61, -0.67, 5.94, 6.49, 7.57, 3.11, 8.7, 5.28, 
8.28, 9.55, 8.33, 13.7, 6.65, 2.4, 3.54, 9.19, 7.51, 
-0.68, 8.47, 14.82, 5.31, 14.01, 8.75, -0.57, 5.35, 
10.51, 3.11, -0.26 , 5.74,8.33, 6.5, 13.85, 9.78, 4.91, 
4.19, 14.8, 10.04, 13.47, 3.28] 

y = [-2.36, -3.41, 13.01, -2.91, -2.28, 12.83, 13.13,
 11.94, 0.93, -2.76, 13.31, -3.57, -2.33, 12.43, -1.83, 
 12.32, -0.42, -3.08, -2.98, 12.46, 8.34, -3.19, -0.47, 
 12.78, 2.12, -2.72, 10.64, 11.98, 12.21, 12.52, 5.53, 
 11.72, 12.91, 12.56, -2.49, 12.08, -1.09, -2.89, -1.78, 
 -2.47, 12.77, 12.41, 5.33, -3.23, 13.45, -3.41, 12.46, 
 12.1, -2.56, 12.51, -2.37, 12.76, 9.69, 12.59, -1.12, 
 -2.8, 12.94, -3.55, 7.33, 12.59, 2.92, 12.7, 0.5, 
 12.57, 6.39, 12.84, -1.95, 11.76, 6.82, 12.44, 13.28, 
 -3.46, 0.7, -2.55, -2.37, 12.48, 7.26, -2.45, 0.31, -2.51]

Kode Program

Kode program berikut ini digunakan untuk melakukan import library yang akan digunakan.

import matplotlib.pyplot as plt

Selanjutnya, memasukan data yang telah diberikan sebelumnya.

x = [4.61, 5.08, 5.18, 7.82, 10.46, 7.66, 7.6, 9.32, 
14.04, 9.95, 4.95, 7.23, 5.21, 8.64, 10.08, 8.32, 
12.83, 7.51, 7.82, 6.29, 0.04, 6.62, 13.16, 6.34, 
0.09, 10.04, 13.06, 9.54, 11.32, 7.12, -0.67, 10.5, 
8.37, 7.24, 9.18, 10.12, 12.29, 8.53, 11.11, 9.65, 
9.42, 8.61, -0.67, 5.94, 6.49, 7.57, 3.11, 8.7, 5.28, 
8.28, 9.55, 8.33, 13.7, 6.65, 2.4, 3.54, 9.19, 7.51, 
-0.68, 8.47, 14.82, 5.31, 14.01, 8.75, -0.57, 5.35, 
10.51, 3.11, -0.26 , 5.74,8.33, 6.5, 13.85, 9.78, 4.91, 
4.19, 14.8, 10.04, 13.47, 3.28] 

y = [-2.36, -3.41, 13.01, -2.91, -2.28, 12.83, 13.13,
 11.94, 0.93, -2.76, 13.31, -3.57, -2.33, 12.43, -1.83, 
 12.32, -0.42, -3.08, -2.98, 12.46, 8.34, -3.19, -0.47, 
 12.78, 2.12, -2.72, 10.64, 11.98, 12.21, 12.52, 5.53, 
 11.72, 12.91, 12.56, -2.49, 12.08, -1.09, -2.89, -1.78, 
 -2.47, 12.77, 12.41, 5.33, -3.23, 13.45, -3.41, 12.46, 
 12.1, -2.56, 12.51, -2.37, 12.76, 9.69, 12.59, -1.12, 
 -2.8, 12.94, -3.55, 7.33, 12.59, 2.92, 12.7, 0.5, 
 12.57, 6.39, 12.84, -1.95, 11.76, 6.82, 12.44, 13.28, 
 -3.46, 0.7, -2.55, -2.37, 12.48, 7.26, -2.45, 0.31, -2.51]

Terakhir, ini merupakan kode untuk menampilkan diagram sebar.

plt.title('Area Pertumbuhan Jamur')
plt.scatter(x, y)
plt.show()

Berikut ini merupakan tampilan scatter plot yang dihasilkan dari kode program

Scatter Plot - Diagram Sebar

Contoh Kode Program Scatter Plot

Berikut ini merupakan contoh kode program dalam pemanfaatan scatter plot.

import matplotlib.pyplot as plt

lemon_diameter = [6.44, 6.87, 7.7, 8.85, 8.15, 9.96, 7.21, 10.04, 10.2, 11.06] 
lemon_weight = [112.05, 114.58, 116.71, 117.4, 128.93, 132.93, 138.92, 145.98, 148.44, 152.81] 
lime_diameter = [6.15, 7.0, 7.0, 7.69, 7.95, 7.51, 10.46, 8.72, 9.53 , 10.09] 
lime_weight = [112.76, 125.16, 131.36, 132.41, 138.08, 142.55, 156.86, 158.67, 163.28, 166.74]

plt.title('Lemons vs. Limes')
plt.xlabel('Diameter (cm)')
plt.ylabel('Weight (g)')
plt.scatter(lemon_diameter, lemon_weight, color='y')
plt.scatter(lime_diameter, lime_weight, color='g')
plt.legend(['lemons', 'limes'])
plt.show()

Berikut ini merupakan tampilan diagram sebar yang dihasilkan dari kode program

Kesimpulan

Bila diperhatikan pada pola titik yang terlihat pada diagram sebar maka akan dapat disimpulkan apakah kedua variabel tersebut memiliki hubungan atau tidak? Jika memiliki hubungan apakah hubungan postif atau negatif. Hubungan positif atinya semakin tinggi nilai x maka semakin tinggi pula nilai y sedangkan hubungan negatif adalah apabila salah variabel meninggi nilainya maka variabelnya lainnya menjadi merendah.

Tentu saja cara yang sudah dijelaskan hanya merupakan salah satu dari sekian banyak cara yang disediakan oleh Matplotlib itu sendiri terkait diagram sebar. Kunjungi tautan ini untuk mengetahui tema data science lainnya. Semoga bermanfaat.

Rajo Intan

Blogger, pemiliki Onestring Lab, menulis artikel terkait teknologi informasi dan pendidikan. Web Developer, berpengalaman lebih dari 20 tahun mengembangkan berbagai aplikasi dan sistem informasi. Kerjasama kontak di onestringlab@gmail.com atau https://forms.gle/xAGKkpi6B3BzJyzk7

View all posts by Rajo Intan →
Ads Blocker Image Powered by Code Help Pro

Ads Blocker Detected!!!

We have detected that you are using extensions to block ads. Please support us by disabling these ads blocker.

Powered By
100% Free SEO Tools - Tool Kits PRO