Artikel Statistik Deskriptif

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna Pengklasifikasian menjadi statistika deskriptif dan statistika inferensia dilakukan berdasarkan aktivitas yang dilakukan.
Statistika deskriptif hanya memberikan informasi mengenai data yang dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan apapun tentang gugus induknya yang lebih besar. Contoh statistika deskriptif yang sering muncul adalah, tabel, diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran. Dengan Statistika deskriptif, kumpulan data yang diperoleh akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari kumpulan data yang ada. Informasi yang dapat diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.
Statistika deskriptif berkenaan dgn bagaimana data dapat digambarkan dideskripsikan) atau disimpulkan baik secara numerik (misal menghitung rata-rata dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik) utk mendapatkan gambaran sekilas mengenai data tersebut sehingga lebih mudah dibaca dan bermakna.
Statistik deskriptif menggunakan prosedur numerik dan grafis dalam meringkas gugus data dengan cara yang jelas dan dapat dimengerti
Terdapat dua metode dasar dalam statistik deskriptif, yaitu numerik dan grafis.
  • Pendekatan numerik dapat digunakan untuk menghitung nilai statistik dari sekumpulan data, seperti mean dan standar deviasi. Statistik ini memberikan informasi tentang rata-rata dan informasi rinci tentang distribusi data.
  • Metode grafis lebih sesuai daripada metode numerik untuk mengidentifikasi pola-pola tertentu dalam data, dilain pihak, pendekatan numerik lebih tepat dan objektif. Dengan demikian, pendekatan numerik dan grafis satu sama lain saling melengkapi, sehingga sangatlah bijaksana apabila kita menggunakan kedua metode tersebut secara bersamaan.
Terdapat tiga karakteristik utama dari variabel tunggal:
  • Distribusi data (distribusi frekuensi)
  • Ukuran pemusatan/tendensi sentral (Central Tendency)
  • Ukuran penyebaran (Dispersion)
Distribusi Data
Pengaturan, penyusunan, dan peringkasan data dengan membuat tabel seringkali membantu, terutama pada saat kita bekerja dengan sejumlah data yang besar. Tabel tersebut berisi daftar nilai data yang mungkin berbeda (baik data tunggal ataupun data yang sudah dikelompok-kelompokan) beserta nilai frekuensinya. Frekuensi menunjukkan banyaknya kejadian/kemunculan nilai data dengan kategori tertentu. Distribusi data yang sudah diatur tersebut sering disebut dengan distribusi frekuensi. Dengan demikian, Distribusi frekuensi didefinisikan sebagai daftar sebaran data (baik data tunggal maupun data kelompok), yang disertai dengan nilai frekuensinya. Data dikelompokkan ke dalam beberapa kelas sehingga ciri-ciri penting data tersebut dapat segera terlihat.
Distribusi frekuensi yang paling sederhana adalah distribusi yang menampilkan daftar setiap nilai dari variabel yang disertai dengan nilai frekuensinya. Distribusi frekuensi dapat digambarkan dalam dua cara, yaitu sebagai tabel atau sebagai grafik. Distribusi juga dapat ditampilkan dengan menggunakan nilai persentase. Penyajian distribusi dalam bentuk grafik lebih mempermudah dalam melihat karakteristik dan kecenderungan tertentu dari sekumpulan data. Grafik data kuantitatif meliputi Histogram, Poligon Frekuensi dll, sedangkan grafik untuk data kualitatif meliputi Bar Chart, Pie Chart dll.

Distribusi frekuensi akan memudahkan kita dalam melihat pola dalam data, namun demikian, kita akan kehilangan informasi dari nilai individunya.

Ukuran pemusatan/tendensi sentral (Central Tendency)
Salah satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat pengamatan. Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran tendensi sentral.
Terdapat tiga jenis ukuran tendensi sentral yang sering digunakan, yaitu:
  • Mean
  • Median
  • Mode
Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah mean saja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Mean dipengaruhi oleh nilai ekstrem.
Median adalah nilai yang membagi himpunan pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di atas median. Median dari n pengukuran atau pengamatan x1, x2 ,…, xn adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data. Median tidak dipengaruhi oleh nilai ekstrem.
Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem.
Ukuran Penyebaran
Ukuran nilai pusat (average) merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki sifat-sifat berikut:
  • Harus mempertimbangkan semua gugus data
  • Tidak boleh terpengaruh oleh nilai-nilai ekstrim.
  • Harus stabil dari sampel ke sampel.
  • Harus mampu digunakan untuk analisis statistik lebih lanjut.
Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai ekstrem. Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka mean, median dan modus yang semua sama dengan 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus yang tidak berubah. Meskipun median dan modus lebih baik dalam hal ini, namun mereka tidak memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik.
Kapan akan menggunakan nilai pusat yang berbeda
Nilai ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat distribusi frekuensi dan tujuan. Jika data kualitatif, hanya modus yang dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui jenis tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita dapat menggunakan modus. Di sisi lain, jika data bersifat kuantitatif, kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut.
Jika data bersifat kuantitatif, kita harus mempertimbangkan sifat distribusi frekuensi gugus data tersebut.
  • Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modus merupakan ukuran pusat yang tepat.
  • Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus.
  • Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik.
  • Ketika kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik.
Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata yang paling tepat.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s