Penjelasan Lengkap Tentang Box-Plot
Langkah awal dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan beberapa pengukuran lainnya. Terdapat beberapa teknik untuk mempelajari karakteristik dan distribusi data tersebut. Diantaranya adalah stem-leaf plot, histogram, density trace, probability plot dan box-plot. Namun, pada seri tulisan ini, kita akan membahas terlebih dahulu mengenai box-plot.
.png)
Apa itu Box-Plot?
Box-plot atau boxplot (juga dikenal sebagai diagram box-and-whisker) merupakan suatu box (kotak berbentuk bujur sangkar). Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara grafik dari data numeris melalui lima ukuran sebagai berikut:
- Nilai
observasi terkecil,
- Kuartil
terendah atau kuartil pertama (Q1), yang memotong 25% dari data terendah
- Median
(Q2) atau nilai pertengahan,
- Kuartil
tertinggi atau kuartil ketiga (Q3), yang memotong 25% dari data terbesar
- Niilai
observasi terbesar.
Dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari observasi. Boxplot dapat digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan asumsi distribusi statistik yang mendasarinya. Karenanya, boxplot tergolong dalam statistik non-parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat dispersi (penyebaran) dan skewness (kecondongan) dalam data. Dalam penggambarannya, boxplot dapat digambarkan secara horizontal maupun vertikal.
Bagian Pada Box-Plot !
- Garis
horizontal bagian bawah box menyajikan kuartil pertama (Q1), sementara
bagian atas menyajikan kuartil ketiga (Q3). Bagian dari box adalah
bidang yang menyajikan interquartile range (IQR), atau bagian pertengahan
dari 50 % observasi. Panjang box ditentukan oleh IQR ini. IQR adalah
ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi (jika
boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR
ini, menunjukkan data semakin menyebar.
- Garis
tengah yang melewati box menyajikan median dari data. Median adalah ukuran
yang terkenal untuk lokasi variabel (nilai pusat atau rata-rata).
- Garis
yang memperpanjang box dinamakan dengan whiskers. Whiskers menunjukkan
nilai yang lebih rendah dan lebih tinggi dari kumpulan data yang berada
dalam IQR (kecuali outlier). Panjang garis Whisker bagian atas ini adalah
kurang dari atau sama dengan Q3 + (1.5 x IQR). Panjang garis Whisker
bagian bawah ini adalah lebih besar atau sama dengan Q1 – (1.5 x IQR).
Masing-masing garis whisker dimulai dari akhir box.
- Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim.
Suatu nilai dikatakan outlier jika:
Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)
Atau
Q1 – (1.5 x IQR) > outlier ≥ Q1 – (3 x IQR)
Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR). Sebagaimana yang dikemukakan sebelumnya, selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/lebar box), boxplot juga dapat digunakan untuk menilai kesimetrisan data. Jika data simetris, garis median akan berada di tengah box dan whisker pada bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak simetris (condong), median tidak akan berada di tengah box dan salah satu dari whisker lebih panjang dari yang lainnya.
Nah, Itulah pembahasan tentang pengertian apa itu box-plot dan bagian-bagiannya, semoga dapat bermanfaat untuk dijadikan referensi . Cukup sekian artikel kali ini.
Mantap
BalasHapusTerimakasih sobat
Hapus