UKURAN PEMUSATAN, LETAK, DAN SEBARAN DATA

Ukuran Pemusatan Data

Salah satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan (Central Tendency). Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran pemusatan data (tendensi sentral). Terdapat tiga ukuran pemusatan data yang sering digunakan, yaitu :

Mean (Rata-rata hitung/rata-rata aritmetika)
Median
Mode

Mean (arithmetic mean)

Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah mean saja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan dengan persamaan berikut :

Sampel :

Populasi :

Keterangan :

∑ = lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N = banyaknya data populasi.

x¯ = nilai rata-rata sampel μ = nilai rata-rata populasi Mean

x¯ (dibaca "x-bar") jika kumpulan data ini merupakan contoh (sampel) dari populasi, sedangkan jika semua data berasal dari populasi, mean dilambangkan dengan μ (huruf kecil Yunani mu).

a. Rata-rata hitung (Mean) untuk data tunggal

Contoh :

Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9

Jawab :

Nilai rata-rata dari data yang sudah dikelompokkan bisa dihitung dengan menggunakan formula berikut :

Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i n = banyaknya sampel data

x¯ = nilai rata-rata sampel

Mean dari data distribusi Frekuensi atau dari gabungan:

Distribusi Frekuensi: Rata-rata hitung dari data yang sudah disusun dalam bentuk tabel distribusi frekuensi dapat ditentukan dengan menggunakan formula yang sama dengan formula untuk menghitung nilai rata-rata dari data yang sudah dikelompokkan, yaitu :

Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i

x¯ = nilai rata-rata sampel

Contoh :

Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).

Kelas ke-	Nilai Ujian	fi
1	31 - 40	2
2	41 - 50	3
3	51 - 60	5
4	61 - 70	13
5	71 - 80	24
6	81 - 90	21
7	91 - 100	12
	Jumlah	80

Jawab:

Buat daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi.

Kelas ke-	Nilai Ujian	f_i	x_i	f_ix_i
1	31 - 40	2	35.5	71.0
2	41 - 50	3	45.5	136.5
3	51 - 60	5	55.5	277.5
4	61 - 70	13	65.5	851.5
5	71 - 80	24	75.5	1812.0
6	81 - 90	21	85.5	1795.5
7	91 - 100	12	95.5	1146.0
	Jumlah	80		6090.0

Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan menggunakan data aktualnya.

**Rata-rata Gabungan atau rata-rata terboboti (Weighted Mean)**

Rata-rata gabungan (disebut juga grand mean, pooled mean, atau rata-rata umum) adalah cara yang tepat untuk menggabungkan rata-rata hitung dari beberapa sampel.

Contoh :

Tiga sub sampel masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162. Berapa rata-ratanya?

Jawab :

Median

Median dari n pengukuran atau pengamatan x1, x2 ,..., xn adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data.

Median tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti salah satu prosedur berikut ini:

Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data
Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data

a. Median data tunggal:

Untuk menentukan median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan formula berikut :

dimana n = banyaknya data pengamatan.

Median apabila n ganjil :

Contoh :

Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10

Jawab :

data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10
banyaknya data (n) = 11
posisi Me = ½(11+1) = 6
jadi Median = 7 (data yang terletak pada urutan ke-6)

Nilai Ujian	2	4	5	6	6	7	7	7	8	9	10
Urutan data ke-	1	2	3	4	5	6	7	8	9	10	11
						↑

Median apabila n genap :

Contoh :

Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9

Jawab :

data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
banyaknya data (n) = 10
posisi Me = ½(10+1) = 5.5
Data tengahnya: 6 dan 7
jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)

Nilai Ujian	2	4	5	6	6		7	7	7	8	9
Urutan data ke-	1	2	3	4	5		6	7	8	9	10
						↑

Mode

Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data:

Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal.
Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.

Meskipun suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat ditentukan secara analitis.

Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama.
Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus
untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.

a. Modus Data Tunggal :

Contoh :

Berapa modus dari nilai ujian matematika kelas 3 SMU berikut ini :

2, 4, 5, 6, 6, 7, 7, 7, 8, 9
2, 4, 6, 6, 6, 7, 7, 7, 8, 9
2, 4, 6, 6, 6, 7, 8, 8, 8, 9
2, 4, 5, 5, 6, 7, 7, 8, 8, 9
1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Jawab :

2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
2, 4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
2, 4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan.
2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua.
1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya

b. Mode dalam Distribusi Frekuensi :

M o = b + p (b 1 b 1 + b 2)

dimana :

Mo = modal = kelas yang memuat modus

b = batas bawah kelas modal

p = panjang kelas modal

bmo = frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)

b1= bmo – bmo-1 = frekuensi kelas modal – frekuensi kelas sebelumnya

b2 = bmo – bmo+1 = frekuensi kelas modal – frekuensi kelas sesudahnya

Contoh :

Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas!

Jawab :

Kelas ke-	Nilai Ujian	fi
1	31 - 40	2
2	41 - 50	3
3	51 - 60	5
4	61 - 70	13
			→ b1 = (24 – 13) = 11
5	71 - 80	24	← kelas modal (frekuensinya paling besar)
			→ b2 =(24 – 21) =3
6	81 - 90	21
7	91 - 100	12
8	Jumlah	80