Pada artikel ini akan dibahas mengenai mean, media, modus dan populasi pada data statistik.
Jupyter Notebook
import library numpy
import numpy as np
import matplotlib.pyplot as plt
Membuat data
# angka dari 7 - 10 sebanyak 20 buah
data = np.random.randint(7,10,20)
data
Mean adalah nilai rata-rata dari sebuah data. $$\bar{X} = \frac{\sum_{}{}X_i} n$$
dimana X = data observasi; n = jumlah observasi
# mean atau rata-rata
np.mean(data)
Median adalah nilai tengah dari data ketika data tersebut telah diurutkan.
data = np.sort(data)
print(data)
np.median(data)
Mode adalah nilai yang paling sering muncul dalam suatu data.
# Nilai mode dicari dengan fungsi mode
import statistics
mode = statistics.mode(data)
mode
Populasi dan Sampel
Populasi merupakan keseluruhan dari data yang ada.
Sampel merupakan sebagian dari populasi.
# populasi data angka dari 1 sampai 9 sebanyak 100 buah
populasi = np.random.randint(1,10,100)
populasi
print("Mean :",np.mean(populasi))
print("Median :",np.median(populasi))
print("Mode :",statistics.mode(populasi))
Mengambil sampel dari populasi
sampel = np.random.choice(populasi, 20)
sampel
print("Mean :",np.mean(sampel))
print("Median :",np.median(sampel))
print("Mode :",statistics.mode(sampel))
Mengambil sampel beberapa kali dari populasi
sampel_1 = np.random.choice(populasi, 15)
sampel_2 = np.random.choice(populasi, 15)
sampel_3 = np.random.choice(populasi, 15)
sampel_4 = np.random.choice(populasi, 15)
# memuat sampel-sampel ke dalam list
data_sampel = [sampel_1, sampel_2, sampel_3, sampel_4]
mean_sampel = []
for x in data_sampel:
mean_sampel.append(np.mean(x))
mean_sampel
print("Mean dari sample", np.mean(mean_sampel))
print("Mean dari populasi", np.mean(populasi))
Terlihat mean populasi tidak jauh berbeda dari mean sampel
Kesimpulan
Mean adalah rata-rata, median adalah nilai tengah dan modus adalah nilai yang paling sering muncul dalam suatu data. Untuk artikel lain terkait dengan statistik silahkan lihat kumpulan artikelnya disini.