Home >Documents >(4) Dr Harun - Descriptive Statistics

(4) Dr Harun - Descriptive Statistics

Date post:18-Feb-2016
Category:
View:225 times
Download:0 times
Share this document with a friend
Description:
deskriptif
Transcript:

PowerPoint Presentation

Descriptive StatisticsHarun Al RasyidSecara garis besar, statistik dibagi menjadi dua komponen utama, yaitu Statistik Deskriptif dan Statistik inferensialStatistik deskriptif menggunakan prosedur numerik dan grafis dalam meringkas gugus data dengan cara yang jelas dan dapat dimengertiStatistik inferensial menyediakan prosedur untuk menarik kesimpulan tentang populasi berdasarkan sampel yang kita amatiStatistik Deskriptif membantu kita untuk menyederhanakan data dalam jumlah besar dengan cara yang logis. Data yang banyak direduksi dan diringkas sehingga lebih sederhana dan lebih mudah diinterpretasi. dua metode dasar dalam statistik deskriptifPendekatan numerikStatistik ini memberikan informasi tentang rata-rata dan informasi rinci tentang distribusi data

Metode grafislebih sesuai daripada metode numerik untuk mengidentifikasi pola-pola tertentu dalam datapendekatan numerik lebih tepat dan objektifSaling melengkapitiga karakteristik utama dari variabel tunggalDistribusi data (distribusi frekuensi)Ukuran pemusatan/tendensi sentral (Central Tendency)Ukuran penyebaran (Dispersion)

Distribusi DataPengaturan, penyusunan, dan peringkasan data dengan membuat tabel seringkali membantu, terutama pada saat kita bekerja dengan sejumlah data yang besar.Tabel tersebut berisi daftar nilai data yang mungkin berbeda (baik data tunggal ataupun data yang sudah dikelompok-kelompokan) beserta nilai frekuensinya.Frekuensi menunjukkan banyaknya kejadian/kemunculan nilai data dengan kategori tertentu.Distribusi data yang sudah diatur tersebut sering disebut dengan distribusi frekuensi.Distribusi frekuensi dapat digambarkan dalam dua cara, yaitu sebagai tabel atau sebagai grafik.Mengetahui distribusi data dari variabel yang kita ukur adalah pentingDistribusi data akan menentukan bagaimana data yang kita miliki akan dianalisisApakah data terlihat ok?Apakah variabel continuous bisa dibiarkan saja ataukah harus dikelompokkan?Dari distribusi data kita bisa mendapatkan ringkasan dari pengukuran statistikUntuk data yang bersifat continuous kita bisa mendapatkan infromasi:Centrality: mean, median, modusVariability: range, percentiles, standard deviationUntuk data yang kategorikal kita bisa mendapatkan: Frekuensi, persentaseCentral tendencySetiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran tendensi sentralTerdapat tiga jenis ukuran tendensi sentral yang sering digunakan, yaitu:MeanMedianMode (modus)

Rata-rata hitung (Mean)Metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral.Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Mean dipengaruhi oleh nilai ekstrem.Mediannilai yang membagi himpunan pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di atas median.Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data. Median tidak dipengaruhi oleh nilai ekstrem.Mode (Modus)data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategorik. Modus tidak dipengaruhi oleh nilai ekstrem.Ukuran nilai pusat (average) merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki sifat-sifat berikut:Harus mempertimbangkan semua gugus dataTidak boleh terpengaruh oleh nilai-nilai ekstrim.Harus stabil dari sampel ke sampel.Harus mampu digunakan untuk analisis statistik lebih lanjut.

Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, karena rata-rata dipengaruhi oleh nilai ekstrem.Contoh: kita memiliki data 2; 4; 5; 6; 6; 6; 7; 7; 8; 9mean, median dan modus yang semua sama dengan 6Jika nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah.

Meskipun median dan modus lebih baik dalam hal ini, namun mereka tidak memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik.Kapan kita menggunakan mean, median atau modus?Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modus merupakan ukuran pusat yang tepat.Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus.

Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik.

VariabilityRangeMerupakan perbedaan antara nilai terbesar dan terkecil dalam suatu kelompok data baik data populasi atau sampelRange = Nilai terbesar nilai terkecilRange hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan sebagai indikator dari ukuran penyebaran. Range sangat dipengaruhi oleh nilai-nilai ekstrim.Simpangan kuartil (Quartile Deviation)Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data, dihilangkan.Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem.VariansRata rata hitung deviasi kuadrat setiap data terhadap rata rata hitungnya

(X - )2 2= N = ( X) / NX = Nilai data pengamatan = Nilai rata rata hitungN = Jumlah total dataStandard deviation (Simpangan baku)Akar kuadrat dari varians dan menunjukan standar penyimpangan data terhadap nilai rata-ratanya

(X - )2 = Natau = A low standard deviation indicates that the data points tend to be very close to the mean, whereas high standard deviation indicates that the data are spread out over a large range of values.Ukuran Kecondongan (Skewness)Rata-rata = median = modus : SimetrisRata-rata < median < modus : Menceng ke kiri (skewed to the left)Rata-rata > median > modus : Menceng ke kanan (skewed to the right)

Ukuran Keruncingan (Kurtosis)Keruncingan disebut juga ketinggian kurvaPada distribusi frekuensi di bagi dalam tiga bagian :Leptokurtis = Sangat runcingMesokurtis= Keruncingan sedangPlatykurtis= Kurva datar

NORMAL DISTRIBUTIONDistribusi probabilitas normal merupakan salah satu distribusi yang paling penting dalam statistika. Banyak peristiwa atau kejadian di alam yang memiliki karakteristik seperti yang di modelkan pada distribusi normal ini. Distribusi ini mempunyai nilai yang jumlahnya tidak terbatas dalam skala atau jarak tertentu. Pada hakikatnya proses kejadian di alam dengan berbagai macam pengukuran menunjukkan gejala normal sebagaimana berlakunya Hukum Bilangan Besar (Law of Large Numbers), dimana kejadian di alam dan perilaku manusia beraneka ragam, namun demikian satu sama lain pada dasarnya akan saling menyesuaikan.

Dengan hukum bilangan besar tersebut, peristiwa atau kejadian dapat saling mengimbangi sehingga grafik dari kejadian berbentuk simetris, sisi kanan dan kiri saling melingkupi.

Central Limit Theoremsemakin banyak data yang diambil akan semakin mendekati ditribusi normal.Untuk itu perlu adanya pengujian distribusi normal atau tidak sebelum menggunakan metode statistika parametrik. Apabila tidak memenuhi distribusi normal, maka bisa ditambah datanya, dilakukan transformasi, atau dapat menggunakan alternative metode statistika non-parametrik.

Embed Size (px)
Recommended