UKURAN PEMUSATAN, LETAK, DAN SEBARAN DATA

Ukuran Pemusatan Data

Salah satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan (Central Tendency). Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran pemusatan data (tendensi sentral). Terdapat tiga ukuran pemusatan data yang sering digunakan, yaitu :
  • Mean (Rata-rata hitung/rata-rata aritmetika)
  • Median
  • Mode

Mean (arithmetic mean)

Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah mean saja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan dengan persamaan berikut :
Sampel : 
Populasi :
Keterangan :
= lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N = banyaknya data populasi.
x¯  = nilai rata-rata sampel μ = nilai rata-rata populasi Mean

x¯ (dibaca "x-bar") jika kumpulan data ini merupakan contoh (sampel) dari populasi, sedangkan jika semua data berasal dari populasi, mean dilambangkan dengan μ (huruf kecil Yunani mu).

a. Rata-rata hitung (Mean) untuk data tunggal

Contoh :
Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
Jawab :

Nilai rata-rata dari data yang sudah dikelompokkan bisa dihitung dengan menggunakan formula berikut :
Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i n = banyaknya sampel data
x¯ = nilai rata-rata sampel

Mean dari data distribusi Frekuensi atau dari gabungan:

Distribusi Frekuensi: Rata-rata hitung dari data yang sudah disusun dalam bentuk tabel distribusi frekuensi dapat ditentukan dengan menggunakan formula yang sama dengan formula untuk menghitung nilai rata-rata dari data yang sudah dikelompokkan, yaitu :
Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i
x¯ = nilai rata-rata sampel

Contoh :
Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
Kelas ke-Nilai Ujianfi
131 - 402
241 - 503
351 - 605
461 - 7013
571 - 8024
681 - 9021
791 - 10012

Jumlah80

Jawab:
Buat daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi.

Kelas ke-Nilai Ujianfixifixi
131 - 40235.571.0
241 - 50345.5136.5
351 - 60555.5277.5
461 - 701365.5851.5
571 - 802475.51812.0
681 - 902185.51795.5
791 - 1001295.51146.0

Jumlah80
6090.0
Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan menggunakan data aktualnya.

Rata-rata Gabungan atau rata-rata terboboti (Weighted Mean)

Rata-rata gabungan (disebut juga grand meanpooled mean, atau rata-rata umum) adalah cara yang tepat untuk menggabungkan rata-rata hitung dari beberapa sampel.
Contoh :
Tiga sub sampel masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162. Berapa rata-ratanya?
Jawab :

Median

Median dari n pengukuran atau pengamatan x1, x2 ,..., xn adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data. 

Median tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti salah satu prosedur berikut ini:
  • Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data
  • Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data

a. Median data tunggal:

Untuk menentukan median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan formula berikut :
dimana n = banyaknya data pengamatan.
Median apabila n ganjil :
Contoh :
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
Jawab :

  • data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
  • setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10
  • banyaknya data (n) = 11
  • posisi Me = ½(11+1) = 6
  • jadi Median = 7 (data yang terletak pada urutan ke-6)
Nilai Ujian245667778910
Urutan data ke-1234567891011












Median apabila n genap :
Contoh :
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
Jawab :
  • data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
  • setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
  • banyaknya data (n) = 10
  • posisi Me = ½(10+1) = 5.5
  • Data tengahnya: 6 dan 7
  • jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)
Nilai Ujian2456677789
Urutan data ke-12345678910









Mode

Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data:
  • Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
  • Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal.
  • Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.
Meskipun suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat ditentukan secara analitis.
  • Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama.
  • Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus
  • untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.

a. Modus Data Tunggal :

Contoh :
Berapa modus dari nilai ujian matematika kelas 3 SMU berikut ini :
  • 2, 4, 5, 6, 6, 7, 7, 7, 8, 9
  • 2, 4, 6, 6, 6, 7, 7, 7, 8, 9
  • 2, 4, 6, 6, 6, 7, 8, 8, 8, 9
  • 2, 4, 5, 5, 6, 7, 7, 8, 8, 9
  • 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Jawab :
  • 2, 4, 5, 6, 6, 777, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
  • 2, 4, 666777, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
  • 2, 4, 666, 7, 888, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan.
  • 2, 4, 55, 6, 7788, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua.
  • 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya

b. Mode dalam Distribusi Frekuensi :



dimana :
Mo = modal = kelas yang memuat modus
b = batas bawah kelas modal
p = panjang kelas modal
bmo = frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)
b1= bmo – bmo-1 = frekuensi kelas modal – frekuensi kelas sebelumnya
b2 = bmo – bmo+1 = frekuensi kelas modal – frekuensi kelas sesudahnya

Contoh :
Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab :

Kelas ke-Nilai Ujianfi
131 - 402
241 - 503
351 - 605
461 - 7013



→ b1 = (24 – 13) = 11
571 - 8024← kelas modal (frekuensinya paling besar)



→ b2 =(24 – 21) =3
681 - 9021
791 - 10012
8Jumlah80

  • Kelas modul =kelas ke-5
  • b = 71-0.5 = 70.5
  • b1 = 24 -13 = 11
  • b2 = 24 – 21 = 3
  • p = 10




PENGUKURAN LETAK DATA

Menurut Andi (2007: 69), Ukuran letak (ukuran lokasi) dimaksudkan sebagai besaran atau ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data. Andi juga di dalam bukunya (2007: 69) menjelaskan bahwa, yang termasuk ukuran lokasi (ukuran letak) antara lain adalah kuartil, desil dan persentil.

Dapat disimpulkan bahwa, ukuran nilai letak adalah beberapa nilai yang letaknya sedemikian rupa sehingga dalam suatu rangkaian data atau suatu distribusi frekuensi sehingga nilai itu membagi rangkaian data atau distribusi frekuensi menjadi beberapa bagian yang sama. Ada empat ukuruan nilai letak yang membagi serangkaian data atau distribusi menjadi dua bagian yang sama yaitu 50% dari keseluruhan data nilainya terletak dibawah nilai median dan 50% lagi nilainya terletak dbeberapa nilai yang letaknya sedemikian rupa sehingga dalam suatu rangkaian data atau suatu distribusi frekuensi sehingga nilai itu membagi rangkaian data atau distribusi frekuensi menjadi beberapa bagian yang sama. Ada empat ukuruan nilai letak yang membagi serangkaian data atau distribusi menjadi dua bagian yang sama yaitu 50% dari keseluruhan data nilainya terletak dibawah nilai median dan 50% lagi nilainya terletak diatas nilai medianiatas nilai median.Menurut Andi (2007: 69), Ukuran letak (ukuran lokasi) dimaksudkan sebagai besaran atau ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data.

Kuartil
Kuartil adalah nilainilai tertentu yang membagi serangkaian data atau suatu distribusi frekuensi menjadi empat bagian yang sama. Perhatikan gambar berikut ini :
Pada gambar 1, jika garis putus-putus tersebut pada gambar dianggap sebagai serangkaian data atau suatu distribusi frekuensi, maka Nilai Median membagi tepat data menjadi dua bagian, yaitu 50% disebelah kiri, maupun 50% disebelah kanan.

Desil
Desil adalah nilai-nilai yang membagi serangkaian data atau suatu distribusi (digambarkan dengan garis putusputus) dibagi menjadi 10 (sepuluh) bagian yang sama besarnya, yaitu masingmasing 10%.

Presentil
Persentil adalah nilai-nilai yang membagi serangkaian data atau suatu distribusi menjadi 100 (seratus) bagian yang sama besarnya, yaitu masing-masing sebesar 
1%.

PERHITUNGAN UKURAN LETAK DATA

Untuk menentukan atau menghitung ukuran letak data, baik Kuartil, Desil serta Persentil, dibedakan atas dua metode yang disesuaikan atas jenis atau kondisi data, yaitu ;

Data Tidak Berkelompok
Secara umum, untuk data tidak berkelompok, maka data mentah (raw data) yang diperoleh dari hasil penelitian atau observasi, harus terlebih dahulu melalui proses pengurutan dari dari data terkecil sampai dengan data terbesar. Untuk selanjutnya, data yang sudah diuratkan ini kita namakan data berurut.

Data Berkelompok
Sedangkan untuk data berkelompok, maka prosesnya dimulai setelah proses distribusi frekuensi (tabel distribusi frekuensi) selesai atau dengan kata lain, data mentah (raw data) yang diperoleh dari hasil penelitian atau observasi harus mengalami proses distribusi frekuensi sampai menghasilkan tabel frekuensi distribusi terlebih dahulu sebelum memproses atau menghitung ukuran letak data untuk data berkelompok.

Kuartil Data Tak Berkelompok 

Setelah data mentah mengalami proses pengurutan data, maka langkah selanjutnya dalam menentukan kuartil untuk data tak berkelompok yaitu dengan cara mencari kuartil ke-i (Qi) dengan rumus ;
Dimana :
Qi = Kuartil ke-i
i = 1,2 dan 3
n = Banyak nya data (dimana n ≥ 4)

Contoh 1 :
Seorang manajer produksi dari sebuah pabrik yang menghasilkan susu bubuk formula untuk bayi, memeriksa sebuah sampel acak 10 kaleng susu formula untuk diperiksa berat nettonya. Data yang diperoleh (dalam gram) adalah; 501, 503, 497, 506, 502, 505, 504, 498, 500, 502. Hitunglah nilai kuartil berat sampel tersebut.

Penyelesaian :
- Data mentah diurutkan terlebih dahulu (dari yang terkecil sampai dengan yang terbesar), sebagai berikut :

- Tentukan nilai Qi ;   
Kuartil pertama (Q1) ?
Kuartil kedua (Q2) ?
Kuartil ketiga (Q3) ?


Interpresetasi Nilai Kuartil :



  • Nilai kuartil pertama (Q1) sebesar 499,5, artinya 25% dari data observasi mempunyai nilai sama atau lebih kecil dari 499,5. 
  • Nilai kuartil kedua (Q2) sebesar 502, artinya 50% dari data observasi mempunyai nilai sama atau lebih kecil dari 502. 
  • Nilai kuartil pertama (Q3) sebesar 504,25, artinya 75% dari observasi mempunyai nilai sama atau lebih kecil dari 504,25.


Desil Data Tak Berkelompok

Sama dengan kuartil, setelah data mentah mengalami proses pengurutan data, maka langkah selanjutnya dalam menentukan desil untuk data belum atau tidak  berkelompok yaitu dengan cara mencari desil ke-i (Di) dengan rumus :
Dimana : 
Di = Desil ke-i 
i = 1,2,3, sampai dengan 9. 
n = Banyak nya data (dimana n   10) 

Dengan menggunakan contoh 1 diatas, hitunglah nilai desil pertama (D1), desil ketiga (D3), desil kelima (D5),dan desil kedelapan (D8), berat sampel yang terdapat pada contoh 1 tersebut. 


Penyelesaian :

- Data mentah diurutkan terlebih dahulu (dari yang terkecil sampai dengan yang terbesar, sebagai berikut:

- Tentukan nilai Di :






Interpresetasi Nilai Desil : 



  • Nilai desil pertama (D1) sebesar 497,1, artinya 10% dari data observasi mempunyai nilai sama atau lebih kecil dari 497,1. 
  • Nilai desil ketiga (D3) sebesar 500,3, artinya 30% dari data observasi mempunyai nilai sama atau lebih kecil dari 500,3. 
  • Nilai desil pertama (D5) sebesar 502, artinya 50% dari data observasi mempunyai nilai sama atau lebih kecil dari 502. 
  • Nilai desil pertama (D8) sebesar 504,8 artinya 80% dari data observasi mempunyai nilai sama atau lebih kecil dari 504,8.

Persentil Data Tak Berkelompok

Sama dengan kuartil dan desil, setelah data mentah mengalami proses pengurutan data, maka langkah selanjutnya dalam menentukan persentil untuk data belum atau tak berkelompok yaitu dengan cara mencari persentil ke-i (Pi) dengan rumus :
Dimana : 
Pi = Persentil ke-i 
i = 1,2,3, sampai dengan 99. 
n = Banyak nya data (dimana n  100) 

Untuk presentil data tak berkelompok segaja tidak di berikan contoh mengingat data yang diperlukan cukup banyak, yaitu sebanyak 100 atau lebih data. Selain akan membuat tidak effektifnya pembahasan, perhitungan data persentil untuk data tak berkelompok sangat jarang dilakukan mengingat jumlah data penelitian yang lebih dari 30 (tergantung subjektifitas peneliti) biasanya langsung dibuatkan tabel distribusi frekuensinya dalam penyajian data.

Komentar

Postingan populer dari blog ini

PENDUGAAN INTERVAL (ESTIMASI)

Perancangan Sistem Informasi Rekam Medis Rumah Sakit

KORELASI DAN REGRESI BERGANDA