Top Banner
Descriptive Statistics Harun Al Rasyid
34

(4) Dr Harun - Descriptive Statistics

Feb 18, 2016

Download

Documents

deskriptif
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: (4) Dr Harun - Descriptive Statistics

Descriptive Statistics

Harun Al Rasyid

Page 2: (4) Dr Harun - Descriptive Statistics

• Secara garis besar, statistik dibagi menjadi dua komponen utama, yaitu Statistik Deskriptif dan Statistik inferensial•Statistik deskriptif menggunakan prosedur numerik dan grafis dalam meringkas gugus data dengan cara yang jelas dan dapat dimengerti•Statistik inferensial menyediakan prosedur untuk menarik kesimpulan tentang populasi berdasarkan sampel yang kita amati

Page 3: (4) Dr Harun - Descriptive Statistics

• Statistik Deskriptif membantu kita untuk menyederhanakan data dalam jumlah besar dengan cara yang logis. •Data yang banyak direduksi dan diringkas sehingga lebih sederhana dan lebih mudah diinterpretasi.

Page 4: (4) Dr Harun - Descriptive Statistics

dua metode dasar dalam statistik deskriptif•Pendekatan numerik• Statistik ini memberikan informasi tentang rata-rata

dan informasi rinci tentang distribusi data

•Metode grafis• lebih sesuai daripada metode numerik untuk

mengidentifikasi pola-pola tertentu dalam data• pendekatan numerik lebih tepat dan objektif• Saling melengkapi

Page 5: (4) Dr Harun - Descriptive Statistics

tiga karakteristik utama dari variabel tunggal•Distribusi data (distribusi frekuensi)•Ukuran pemusatan/tendensi sentral (Central Tendency)•Ukuran penyebaran (Dispersion)

Page 6: (4) Dr Harun - Descriptive Statistics

Distribusi Data• Pengaturan, penyusunan, dan peringkasan data dengan membuat tabel seringkali membantu, terutama pada saat kita bekerja dengan sejumlah data yang besar.• Tabel tersebut berisi daftar nilai data yang mungkin berbeda (baik data tunggal ataupun data yang sudah dikelompok-kelompokan) beserta nilai frekuensinya.

Page 7: (4) Dr Harun - Descriptive Statistics

• Frekuensi menunjukkan banyaknya kejadian/kemunculan nilai data dengan kategori tertentu.•Distribusi data yang sudah diatur tersebut sering disebut dengan distribusi frekuensi.•Distribusi frekuensi dapat digambarkan dalam dua cara, yaitu sebagai tabel atau sebagai grafik.

Page 8: (4) Dr Harun - Descriptive Statistics

•Mengetahui distribusi data dari variabel yang kita ukur adalah penting•Distribusi data akan menentukan bagaimana data yang kita miliki akan dianalisis• Apakah data terlihat ok?• Apakah variabel continuous bisa dibiarkan saja ataukah harus dikelompokkan?

Page 9: (4) Dr Harun - Descriptive Statistics

•Dari distribusi data kita bisa mendapatkan ringkasan dari pengukuran statistik•Untuk data yang bersifat continuous kita bisa mendapatkan infromasi:• Centrality: mean, median, modus• Variability: range, percentiles, standard deviation

•Untuk data yang kategorikal kita bisa mendapatkan: • Frekuensi, persentase

Page 10: (4) Dr Harun - Descriptive Statistics

Central tendency• Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran tendensi sentral• Terdapat tiga jenis ukuran tendensi sentral yang sering digunakan, yaitu:• Mean• Median• Mode (modus)

Page 11: (4) Dr Harun - Descriptive Statistics

Rata-rata hitung (Mean)•Metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral.•Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. •Mean dipengaruhi oleh nilai ekstrem.

Page 12: (4) Dr Harun - Descriptive Statistics

Median• nilai yang membagi himpunan pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di atas median.• Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data. •Median tidak dipengaruhi oleh nilai ekstrem.

Page 13: (4) Dr Harun - Descriptive Statistics

Mode (Modus)• data yang paling sering muncul/terjadi. •Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. •Modus digunakan baik untuk tipe data numerik atau pun data kategorik. •Modus tidak dipengaruhi oleh nilai ekstrem.

Page 14: (4) Dr Harun - Descriptive Statistics

•Ukuran nilai pusat (average) merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki sifat-sifat berikut:• Harus mempertimbangkan semua gugus data• Tidak boleh terpengaruh oleh nilai-nilai ekstrim.• Harus stabil dari sampel ke sampel.• Harus mampu digunakan untuk analisis statistik lebih

lanjut.

Page 15: (4) Dr Harun - Descriptive Statistics

•Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, karena rata-rata dipengaruhi oleh nilai ekstrem.

Page 16: (4) Dr Harun - Descriptive Statistics

• Contoh: kita memiliki data • 2; 4; 5; 6; 6; 6; 7; 7; 8; 9

•mean, median dan modus yang semua sama dengan 6• Jika nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah.

Page 17: (4) Dr Harun - Descriptive Statistics

•Meskipun median dan modus lebih baik dalam hal ini, namun mereka tidak memenuhi persyaratan lainnya. •Oleh karena itu Mean merupakan ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik.

Page 18: (4) Dr Harun - Descriptive Statistics

Kapan kita menggunakan mean, median atau modus?• Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modus merupakan ukuran pusat yang tepat.• Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus.

Page 19: (4) Dr Harun - Descriptive Statistics

• Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik.

Page 20: (4) Dr Harun - Descriptive Statistics
Page 21: (4) Dr Harun - Descriptive Statistics

Variability• Range• Merupakan perbedaan antara nilai terbesar dan

terkecil dalam suatu kelompok data baik data populasi atau sampel• Range = Nilai terbesar – nilai terkecil• Range hanya memperhitungkan dua nilai, yaitu nilai

maksimum dan nilai minimum dan tidak memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan sebagai indikator dari ukuran penyebaran. • Range sangat dipengaruhi oleh nilai-nilai ekstrim.

Page 22: (4) Dr Harun - Descriptive Statistics

•Simpangan kuartil (Quartile Deviation)• Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data, dihilangkan.• Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem.

Page 23: (4) Dr Harun - Descriptive Statistics

• Varians• Rata – rata hitung deviasi kuadrat setiap data

terhadap rata – rata hitungnya

(X - µ )2

2= N

µ = (∑ X) / N

X = Nilai data pengamatanµ = Nilai rata – rata hitungN = Jumlah total data

Page 24: (4) Dr Harun - Descriptive Statistics

•Standard deviation (Simpangan baku)• Akar kuadrat dari varians dan menunjukan standar penyimpangan data terhadap nilai rata-ratanya

(X - µ )2

= N

atau = ²

Page 25: (4) Dr Harun - Descriptive Statistics

•A low standard deviation indicates that the data points tend to be very close to the mean, whereas high standard deviation indicates that the data are spread out over a large range of values.

Page 26: (4) Dr Harun - Descriptive Statistics

Ukuran Kecondongan (Skewness)• Rata-rata = median = modus : Simetris• Rata-rata < median < modus : Menceng ke kiri (skewed to the left)• Rata-rata > median > modus : Menceng ke kanan (skewed to the right)

Page 27: (4) Dr Harun - Descriptive Statistics

Ukuran Keruncingan (Kurtosis)• Keruncingan disebut juga ketinggian kurva• Pada distribusi frekuensi di bagi dalam tiga bagian :• Leptokurtis = Sangat runcing• Mesokurtis = Keruncingan sedang• Platykurtis = Kurva datar

Page 28: (4) Dr Harun - Descriptive Statistics

NORMAL DISTRIBUTION•Distribusi probabilitas normal merupakan salah satu distribusi yang paling penting dalam statistika. • Banyak peristiwa atau kejadian di alam yang memiliki karakteristik seperti yang di modelkan pada distribusi normal ini. •Distribusi ini mempunyai nilai yang jumlahnya tidak terbatas dalam skala atau jarak tertentu.

Page 29: (4) Dr Harun - Descriptive Statistics

• Pada hakikatnya proses kejadian di alam dengan berbagai macam pengukuran menunjukkan gejala normal sebagaimana berlakunya Hukum Bilangan Besar (Law of Large Numbers), dimana kejadian di alam dan perilaku manusia beraneka ragam, namun demikian satu sama lain pada dasarnya akan saling menyesuaikan.

Page 30: (4) Dr Harun - Descriptive Statistics

•Dengan hukum bilangan besar tersebut, peristiwa atau kejadian dapat saling mengimbangi sehingga grafik dari kejadian berbentuk simetris, sisi kanan dan kiri saling melingkupi.

Page 31: (4) Dr Harun - Descriptive Statistics
Page 32: (4) Dr Harun - Descriptive Statistics

•Central Limit Theorem• semakin banyak data yang diambil akan semakin

mendekati ditribusi normal.•Untuk itu perlu adanya pengujian distribusi normal atau tidak sebelum menggunakan metode statistika parametrik. • Apabila tidak memenuhi distribusi normal, maka bisa ditambah datanya, dilakukan transformasi, atau dapat menggunakan alternative metode statistika non-parametrik.

Page 33: (4) Dr Harun - Descriptive Statistics
Page 34: (4) Dr Harun - Descriptive Statistics