Lompat ke konten Lompat ke sidebar Lompat ke footer

Penjelasan Lengkap Tentang Box-Plot

Langkah awal dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan beberapa pengukuran lainnya. Terdapat beberapa teknik untuk mempelajari karakteristik dan distribusi data tersebut. Diantaranya adalah stem-leaf plot, histogram, density trace, probability plot dan box-plot. Namun, pada seri tulisan ini, kita akan membahas terlebih dahulu mengenai box-plot.


Apa itu Box-Plot?


Box-plot atau boxplot (juga dikenal sebagai diagram box-and-whisker) merupakan suatu box (kotak berbentuk bujur sangkar). Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara grafik dari data numeris melalui lima ukuran sebagai berikut:
  • Nilai observasi terkecil, 
  • Kuartil terendah atau kuartil pertama (Q1), yang memotong 25% dari data terendah
  • Median (Q2) atau nilai pertengahan, 
  • Kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25% dari data terbesar
  • Niilai observasi terbesar.


Dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari observasi. Boxplot dapat digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan asumsi distribusi statistik yang mendasarinya. Karenanya, boxplot tergolong dalam statistik non-parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat dispersi (penyebaran) dan skewness (kecondongan) dalam data. Dalam penggambarannya, boxplot dapat digambarkan secara horizontal maupun vertikal.



Bagian Pada Box-Plot !


  • Garis horizontal bagian bawah box menyajikan kuartil pertama (Q1), sementara bagian atas menyajikan kuartil ketiga (Q3). Bagian dari box adalah bidang yang menyajikan interquartile range (IQR), atau bagian pertengahan dari 50 % observasi. Panjang box ditentukan oleh IQR ini. IQR adalah ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi (jika boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR ini, menunjukkan data semakin menyebar.
  • Garis tengah yang melewati box menyajikan median dari data. Median adalah ukuran yang terkenal untuk lokasi variabel (nilai pusat atau rata-rata).
  • Garis yang memperpanjang box dinamakan dengan whiskers. Whiskers menunjukkan nilai yang lebih rendah dan lebih tinggi dari kumpulan data yang berada dalam IQR (kecuali outlier). Panjang garis Whisker bagian atas ini adalah kurang dari atau sama dengan Q3 + (1.5 x IQR). Panjang garis Whisker bagian bawah ini adalah lebih besar atau sama dengan Q1 – (1.5 x IQR). Masing-masing garis whisker dimulai dari akhir box.
  • Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim.


Suatu nilai dikatakan outlier jika:

Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)

Atau

Q1 – (1.5 x IQR) > outlier ≥ Q1 – (3 x IQR)



Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR). Sebagaimana yang dikemukakan sebelumnya, selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/lebar box), boxplot juga dapat digunakan untuk menilai kesimetrisan data. Jika data simetris, garis median akan berada di tengah box dan whisker pada bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak simetris (condong), median tidak akan berada di tengah box dan salah satu dari whisker lebih panjang dari yang lainnya.


Nah, Itulah pembahasan tentang pengertian apa itu box-plot dan bagian-bagiannya, semoga dapat bermanfaat untuk dijadikan referensi . Cukup sekian artikel kali ini.

2 komentar untuk "Penjelasan Lengkap Tentang Box-Plot"