UKURAN PEMUSATAN, LETAK, DAN SEBARAN DATA
Ukuran Pemusatan Data
Salah satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan (Central Tendency). Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran pemusatan data (tendensi sentral). Terdapat tiga ukuran pemusatan data yang sering digunakan, yaitu :
- Mean (Rata-rata hitung/rata-rata aritmetika)
- Median
- Mode
Mean (arithmetic mean)
Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah mean saja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan dengan persamaan berikut :
Sampel :
Populasi :
Keterangan :
∑ = lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N = banyaknya data populasi.
x¯ = nilai rata-rata sampel μ = nilai rata-rata populasi Meana. Rata-rata hitung (Mean) untuk data tunggal
Contoh :
Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
Jawab :
Nilai rata-rata dari data yang sudah dikelompokkan bisa dihitung dengan menggunakan formula berikut :
Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i n = banyaknya sampel data
x¯ = nilai rata-rata sampelMean dari data distribusi Frekuensi atau dari gabungan:
Distribusi Frekuensi: Rata-rata hitung dari data yang sudah disusun dalam bentuk tabel distribusi frekuensi dapat ditentukan dengan menggunakan formula yang sama dengan formula untuk menghitung nilai rata-rata dari data yang sudah dikelompokkan, yaitu :
Keterangan : ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i
x¯ = nilai rata-rata sampel
Contoh :
Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
Kelas ke- | Nilai Ujian | fi |
1 | 31 - 40 | 2 |
2 | 41 - 50 | 3 |
3 | 51 - 60 | 5 |
4 | 61 - 70 | 13 |
5 | 71 - 80 | 24 |
6 | 81 - 90 | 21 |
7 | 91 - 100 | 12 |
Jumlah | 80 |
Jawab:
Buat daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi.
Kelas ke- | Nilai Ujian | fi | xi | fixi |
1 | 31 - 40 | 2 | 35.5 | 71.0 |
2 | 41 - 50 | 3 | 45.5 | 136.5 |
3 | 51 - 60 | 5 | 55.5 | 277.5 |
4 | 61 - 70 | 13 | 65.5 | 851.5 |
5 | 71 - 80 | 24 | 75.5 | 1812.0 |
6 | 81 - 90 | 21 | 85.5 | 1795.5 |
7 | 91 - 100 | 12 | 95.5 | 1146.0 |
Jumlah | 80 | 6090.0 |
Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan menggunakan data aktualnya.
Rata-rata Gabungan atau rata-rata terboboti (Weighted Mean)
Rata-rata gabungan (disebut juga grand mean, pooled mean, atau rata-rata umum) adalah cara yang tepat untuk menggabungkan rata-rata hitung dari beberapa sampel.
Contoh :
Tiga sub sampel masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162. Berapa rata-ratanya?
Jawab :
Median
Median dari n pengukuran atau pengamatan x1, x2 ,..., xn adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data.
Median tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti salah satu prosedur berikut ini:
Kuartil
Desil
Presentil
Interpresetasi Nilai Kuartil :
Dimana :
Di = Desil ke-i
i = 1,2,3, sampai dengan 9.
n = Banyak nya data (dimana n ≥ 10)
Dengan menggunakan contoh 1 diatas, hitunglah nilai desil pertama (D1), desil ketiga (D3), desil kelima (D5),dan desil kedelapan (D8), berat sampel yang terdapat pada contoh 1 tersebut.
Penyelesaian :
- Data mentah diurutkan terlebih dahulu (dari yang terkecil sampai dengan yang terbesar, sebagai berikut:
- Tentukan nilai Di :
Interpresetasi Nilai Desil :
- Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data
- Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data
a. Median data tunggal:
Untuk menentukan median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan formula berikut :
dimana n = banyaknya data pengamatan.
Median apabila n ganjil :
Contoh :
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
Jawab :
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10
- banyaknya data (n) = 11
- posisi Me = ½(11+1) = 6
- jadi Median = 7 (data yang terletak pada urutan ke-6)
Nilai Ujian | 2 | 4 | 5 | 6 | 6 | 7 | 7 | 7 | 8 | 9 | 10 |
Urutan data ke- | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
↑ |
Median apabila n genap :
Contoh :
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
Jawab :
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
- banyaknya data (n) = 10
- posisi Me = ½(10+1) = 5.5
- Data tengahnya: 6 dan 7
- jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)
Nilai Ujian | 2 | 4 | 5 | 6 | 6 | 7 | 7 | 7 | 8 | 9 | ||||||||
Urutan data ke- | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||||||
↑ |
Mode
Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data:
- Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
- Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal.
- Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.
Meskipun suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat ditentukan secara analitis.
- Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama.
- Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus
- untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.
a. Modus Data Tunggal :
Contoh :
Berapa modus dari nilai ujian matematika kelas 3 SMU berikut ini :
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Jawab :
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan.
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua.
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya
b. Mode dalam Distribusi Frekuensi :
dimana :
Mo = modal = kelas yang memuat modus
b = batas bawah kelas modal
p = panjang kelas modal
bmo = frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)
b1= bmo – bmo-1 = frekuensi kelas modal – frekuensi kelas sebelumnya
b2 = bmo – bmo+1 = frekuensi kelas modal – frekuensi kelas sesudahnya
Contoh :
Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab :
Kelas ke- | Nilai Ujian | fi | |
1 | 31 - 40 | 2 | |
2 | 41 - 50 | 3 | |
3 | 51 - 60 | 5 | |
4 | 61 - 70 | 13 | |
→ b1 = (24 – 13) = 11 | |||
5 | 71 - 80 | 24 | ← kelas modal (frekuensinya paling besar) |
→ b2 =(24 – 21) =3 | |||
6 | 81 - 90 | 21 | |
7 | 91 - 100 | 12 | |
8 | Jumlah | 80 |
- Kelas modul =kelas ke-5
- b = 71-0.5 = 70.5
- b1 = 24 -13 = 11
- b2 = 24 – 21 = 3
- p = 10
PENGUKURAN LETAK DATA
Menurut Andi (2007: 69), Ukuran letak (ukuran lokasi)
dimaksudkan sebagai besaran atau ukuran untuk mendapatkan gambaran yang lebih
jelas berdasarkan letak data dari sekumpulan data yang dipunyai. Ukuran ini
sangat berarti dalam rangka melakukan analisis data. Andi juga di dalam bukunya (2007: 69) menjelaskan bahwa,
yang termasuk ukuran lokasi (ukuran letak) antara lain adalah kuartil, desil
dan persentil.
Dapat disimpulkan bahwa, ukuran nilai letak adalah beberapa
nilai yang letaknya sedemikian rupa sehingga dalam suatu rangkaian data atau
suatu distribusi frekuensi sehingga nilai itu membagi rangkaian data atau distribusi
frekuensi menjadi beberapa bagian yang sama. Ada empat ukuruan nilai letak yang
membagi serangkaian data atau distribusi menjadi dua bagian yang sama yaitu 50%
dari keseluruhan data nilainya terletak dibawah nilai median dan 50% lagi
nilainya terletak dbeberapa
nilai yang letaknya sedemikian rupa sehingga dalam suatu rangkaian data atau
suatu distribusi frekuensi sehingga nilai itu membagi rangkaian data atau distribusi
frekuensi menjadi beberapa bagian yang sama. Ada empat ukuruan nilai letak yang
membagi serangkaian data atau distribusi menjadi dua bagian yang sama yaitu 50%
dari keseluruhan data nilainya terletak dibawah nilai median dan 50% lagi
nilainya terletak diatas nilai medianiatas nilai median. Menurut Andi (2007: 69), Ukuran letak (ukuran lokasi) dimaksudkan sebagai besaran atau ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data.
Kuartil adalah nilainilai tertentu yang membagi serangkaian
data atau suatu distribusi frekuensi menjadi empat bagian yang sama. Perhatikan
gambar berikut ini :
Pada gambar 1, jika garis putus-putus tersebut pada gambar
dianggap sebagai serangkaian data atau suatu distribusi frekuensi, maka Nilai
Median membagi tepat data menjadi dua bagian, yaitu 50% disebelah kiri, maupun
50% disebelah kanan.
Desil adalah nilai-nilai yang membagi serangkaian data atau
suatu distribusi (digambarkan dengan garis putusputus) dibagi menjadi 10
(sepuluh) bagian yang sama besarnya, yaitu masingmasing 10%.
Presentil
Persentil adalah nilai-nilai yang membagi serangkaian data atau suatu distribusi menjadi 100 (seratus) bagian yang sama besarnya, yaitu masing-masing sebesar
1%.
PERHITUNGAN UKURAN LETAK DATA
Untuk menentukan atau menghitung ukuran letak data, baik
Kuartil, Desil serta Persentil, dibedakan atas dua metode yang disesuaikan atas
jenis atau kondisi data, yaitu ;
Data Tidak
Berkelompok
Secara umum, untuk data tidak berkelompok, maka data mentah
(raw data) yang diperoleh dari hasil penelitian atau observasi, harus terlebih
dahulu melalui proses pengurutan dari dari data terkecil sampai dengan data
terbesar. Untuk selanjutnya, data yang sudah diuratkan ini kita namakan data
berurut.
Data Berkelompok
Sedangkan untuk data berkelompok, maka prosesnya dimulai
setelah proses distribusi frekuensi (tabel distribusi frekuensi) selesai atau
dengan kata lain, data mentah (raw data) yang diperoleh dari hasil penelitian
atau observasi harus mengalami proses distribusi frekuensi sampai menghasilkan
tabel frekuensi distribusi terlebih dahulu sebelum memproses atau menghitung
ukuran letak data untuk data berkelompok.
Kuartil Data Tak Berkelompok
Setelah data mentah mengalami proses pengurutan data, maka
langkah selanjutnya dalam menentukan kuartil untuk data tak berkelompok yaitu
dengan cara mencari kuartil ke-i (Qi) dengan rumus ;
Dimana :
Qi = Kuartil ke-i
i = 1,2 dan 3
n = Banyak nya data (dimana n ≥ 4)
Contoh 1 :
Seorang manajer produksi dari sebuah pabrik yang
menghasilkan susu bubuk formula untuk bayi, memeriksa sebuah sampel acak 10
kaleng susu formula untuk diperiksa berat nettonya. Data yang diperoleh (dalam
gram) adalah; 501, 503, 497, 506, 502, 505, 504, 498, 500, 502. Hitunglah nilai
kuartil berat sampel tersebut.
Penyelesaian :
- Data mentah diurutkan terlebih dahulu (dari yang terkecil
sampai dengan yang terbesar), sebagai berikut :
Interpresetasi Nilai Kuartil :
- Nilai kuartil pertama (Q1) sebesar 499,5, artinya 25% dari data observasi mempunyai nilai sama atau lebih kecil dari 499,5.
- Nilai kuartil kedua (Q2) sebesar 502, artinya 50% dari data observasi mempunyai nilai sama atau lebih kecil dari 502.
- Nilai kuartil pertama (Q3) sebesar 504,25, artinya 75% dari observasi mempunyai nilai sama atau lebih kecil dari 504,25.
Desil Data Tak Berkelompok
Sama dengan kuartil, setelah data mentah mengalami proses pengurutan data, maka langkah selanjutnya dalam menentukan desil untuk data belum atau tidak berkelompok yaitu dengan cara mencari desil ke-i (Di) dengan rumus :Dimana :
Di = Desil ke-i
i = 1,2,3, sampai dengan 9.
n = Banyak nya data (dimana n ≥ 10)
Dengan menggunakan contoh 1 diatas, hitunglah nilai desil pertama (D1), desil ketiga (D3), desil kelima (D5),dan desil kedelapan (D8), berat sampel yang terdapat pada contoh 1 tersebut.
Penyelesaian :
- Data mentah diurutkan terlebih dahulu (dari yang terkecil sampai dengan yang terbesar, sebagai berikut:
- Tentukan nilai Di :
Interpresetasi Nilai Desil :
- Nilai desil pertama (D1) sebesar 497,1, artinya 10% dari data observasi mempunyai nilai sama atau lebih kecil dari 497,1.
- Nilai desil ketiga (D3) sebesar 500,3, artinya 30% dari data observasi mempunyai nilai sama atau lebih kecil dari 500,3.
- Nilai desil pertama (D5) sebesar 502, artinya 50% dari data observasi mempunyai nilai sama atau lebih kecil dari 502.
- Nilai desil pertama (D8) sebesar 504,8 artinya 80% dari data observasi mempunyai nilai sama atau lebih kecil dari 504,8.
Persentil Data Tak Berkelompok
Sama dengan kuartil dan desil, setelah data mentah mengalami proses pengurutan data, maka langkah selanjutnya dalam menentukan persentil untuk data belum atau tak berkelompok yaitu dengan cara mencari persentil ke-i (Pi) dengan rumus :
Dimana :
Pi = Persentil ke-i
i = 1,2,3, sampai dengan 99.
n = Banyak nya data (dimana n ≥ 100)
Untuk presentil data tak berkelompok segaja tidak di berikan contoh mengingat data yang diperlukan cukup banyak, yaitu sebanyak 100 atau lebih data. Selain akan membuat tidak effektifnya pembahasan, perhitungan data persentil untuk data tak berkelompok sangat jarang dilakukan mengingat jumlah data penelitian yang lebih dari 30 (tergantung subjektifitas peneliti) biasanya langsung dibuatkan tabel distribusi frekuensinya dalam penyajian data.
Komentar
Posting Komentar