Pengantar & Statistika Deskriptif MA 2081 Statistika Dasar 26 J i 2012 26 Januari 2012 Utriweni Mukhaiyar
Pengantar & Statistika Deskriptif
MA 2081 Statistika Dasar26 J i 201226 Januari 2012
Utriweni Mukhaiyar
IlustrasiIlustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Desa u Ja eb a p e Ju Ju gust Sep O t op es2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.822002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.732003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.022004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata curah hujan setiap tahun.2. Penyebaran tingkat curah hujan setiap bulan pada tahun tertentu.3. Bulan tertentu yang memiliki tingkat curah hujan yang khusus.
STATISTIKA DESKRIPTIF
2
4. Signifikansi perbedaan tingkat curah hujan antara tahun-tahun yang diamati.
INFERENSI STATISTIKA
St ti tik d St ti tikStatistik dan Statistika
Statistik : nilai-nilai ukuran data yang mudah dimengerti.Contoh : o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di o statistik (mis. rata rata) nilai elevasi pasang surut air laut di
selat Makassar (m), o statistik (mis. variansi) hasil pengukuran tinggi gelombang
(cm) menggunakan AWLR (Automatic Water Level Recorder)S i i ik ( i ) il i i i k i d o Statisitik (mis. range) nilai tinggi pasang maksimum dan surut minimum (m)
Statistika il b k it d l Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
3
Jenis jenis StatistikaJenis-jenis Statistika
i ik d k i if d b k1. Statistika deskriptif: metode yang berkaitandengan pengumpulan dan penyajian data.
2. Statistika inferensi: metode yang berkaitandengan analisis sampel untuk penarikandengan analisis sampel untuk penarikankesimpulan tentang karakteristik populasi.
4
Populasi dan Sampelp p
Populasi
SampelSampel
setiap obyek populasi memilikip y p p m mkemungkinan/kesempatan yang sama untuk terpilih
Sampel Acak
hasil pengukuran atau pengamatan Data
5
Contoh Populasi dan SampelContoh Populasi dan Sampel Akan dilakukan pengamatan tentang rata-rata curah hujan p g g j
di Jawa Barat.
PopulasiPopulasiSeluruh titik di wilayah Jawa Barat
Kendala: - sangat banyak, -menghabiskanwaktu, -menghabiskan biaya
K id h P n mbil nK id h P n mbil nJawa Barat
?
Kaidah PengambilanSampel (Teknik
Sampling)
Kaidah PengambilanSampel (Teknik
Sampling)
Keterwakilan sampel ataspopulasi ??
Keterwakilan sampel ataspopulasi ??
SampelContoh: setiap Kabupaten/Kotamadya di Jawa Barat diambil beberapa titik pengamatan
6
Jenis-jenis ObservasiJenis jenis Observasi
OBSERVASI / DATAOBSERVASI / DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
Tidak mengenal urutandan operasi aritmatika
Mengenal urutan danoperasi aritmatika
Berhubungan dengan‘proses menghitung’, dan
pengamatan atas
Didasarkan padasuatu selang/interval
sehingga meliputihimpunan terhitung. semua bilangan riil
Jenis bencana yang terjadi di suatu daerah
Jenjang pendidikan (SD, SMP, SMA,...), tingkatan
d h (K l h
Banyaknya gempa yang terjadi di suatu daerah
dalam 1 hari banyaknya
Intensitas gempa yang terjadi setiap hari di
t il h ti k t
7
j(banjir, longsor, gempa, dll), jenis batuan, dll
daerah (Kelurahan, Kecamatan Kab./Kota, Provinsi, Negara), dll
dalam 1 hari, banyaknya hari hujan dalam satu
bulan di suatu daerah, dll
suatu wilayah, tingkat curah hujan harian di
suatu daerah, dll
© 2012 by UM
St ti tik D k i tifStatistika Deskriptif
Metode Tujuan : Metodepengolahan danpenyajian suatu
gugus data
Tujuan : memberikan
informasi yang berguna.
Informasi berupa : bentuk
distribusi data
8
Karakteristik DistribusiKarakteristik Distribusi1. PARAMETER DISTRIBUSI
Ukuran Pemusatan
mean, median, modus, kuartil atas, kuartil
bawah dllDISTRIBUSI
Ukuran Penyebaran
bawah, dllRange, simpangan baku, variansi, jangkauan antar
kuartil, dll
Kemencengan
Kelancipan
skewness
kurtosis
2. BENTUK DISTRIBUSI Simetris
Menceng/skew
mean = median
Menceng/skew Positif
Menceng/skew Negatif
BerpuncakTunggal
BerpuncakJamak
mean > median
mean < median
9
gggJ
# modus > 1 # modus = 1
CONTOH KASUSCONTOH KASUSData rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
x1 x2 x12x7 x10Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49
x(1) x(2) x(12)X(7) x(10)
10 Adakah perbedaan dari penyajian kedua data di atas?minimum maksimum
Uk P t & P b D t Ukuran Pemusatan & Penyebaran Data Ukuran pemusatan data
statistik yang memberikan informasi dimana data terkumpul dengan ukuran/jumlah tertentu.
C h M ( ) k l b h k l h Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median), kuartil atas, modus, persentil, ...
Ukuran penyebaran data Ukuran penyebaran data
statistik yang memberikan informasi bagaimana data menyebar di sekitar pusat data.y p
Contoh : range (jangkauan data), IQR (jangkauan antar kuartil), variansi, standar deviasi (simpangan baku), ...
11
Uk P t D t Ukuran Pemusatan Data 1. Mean (rata-rata)( )
1 n
ix xn
1in
Contoh :
1 2 12...12
x x xx
278.59 279.78 ... 267.82 222.1712
12
50% data (50% data (akhirakhir))50 % data (50 % data (awalawal))29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
X2. Median
Nil i t h b i d k l k d t
X(6.5)
Nilai tengah yang membagi dua kelompok data sama banyak.
3 M d
med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58
3. ModusNilai yang paling sering muncul.
13
modus tidak ada
4. Kuartil25 %25 % 25 %25 % 25 %25 % 25 %25 %29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
q d qKuartil bawah (q1) :
q1 q2 = med q3
1 14
nq x
1 12 1 1 3 4 334 4
1 70.474
q x x x x x4
2 (6 5)12 1 254.58 q x x2 2( 1) 1
4 2n nq x x
Kuartil tengah (q2) :
2 (6.5)12 12
254.58
q x x
3 3( 1)nq x
Kuartil atas (q3) :14
3 3(12 1) 3 9 10 994 4
3 305.214
q x x x x x4
5. Persentil
29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
p25 p50 = med p75
• Persentil ke-i : ( 1)i nx
• Persentil ke-50 :50( 1) 1x x
( 1)100
i n
median
50( 1) 1100 2
n nx x
• Persentil ke-25 dan Persentil ke-75?
15 kuartil ataskuartil bawah
Ukuran Penyebaran Data Ukuran Penyebaran Data
Data : x x2 x3 xData : x1, x2, x3, ..., xnRataan : x
Ukuran penyebaran data yang Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat datadari pusat data.
Tidak memberikan informasi apa- ( )n
ix xpapa, karena : 1
( )ii
( ) 0n n
i ix x x nx nx nx Jumlah Kuadrat (JK)
16
1 1i i
2
1( )
n
ii
x x
Ukuran Penyebaran DataUkuran Penyebaran Data1. Jangkauan data (Range)
2n
R = datamax – datamin
2. Variansi
R = 508.49 – 29.08 = 479.41
12 2 2
1 1
1 1( ) 1 1
n
in ni
i ii i
xs x x x
n n n
2 20663.8s
?
3 Si B k ( d d d i i )JKXX
20663.8 143.75 s3. Simpangan Baku (standard deviation)
s = √s2
k k l17
4. Jangkauan antar kuartildq = q3 – q1 dq = q3 – q1 = 234.74
Data PencilanData PencilanData yang nilainya berbeda jauh dari kelompok data yang lain.
Bagaimana mendeteksi data pencilan ??1. Hitung dq
2 Hitung BBP = q1 – k dq
dq = 234.74
BBP = 70.47–(1.5)(234.74 ) = -281.65
Pilih nilai k = 3/2 (optional)2. Hitung BBP q1 k.dq
3 Hitung BAP = q + k dq
( )( )
BAP = 305 21 + (1 5)(234 74) = 657 323. Hitung BAP = q3 + k.dq
4. Pencilan bawah < BBP
BAP = 305.21 + (1,5)(234.74) = 657.32
tidak ada pencilan bawah
185. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIKCount (banyak data, n) 12Sum (jumlah data) 2666.01Average (rata-rata) 222.17
mean < medianmean < medianMedian (kuartil tengah) 254.58Mode (modus) -Minimum 29.08
mean < medianmean < median
Maximum 508.49Range 479.41Standard Deviation 143.75 Menceng
kiri/negatif ???Menceng
kiri/negatif ???Variance 20663.8Skewness 0.303*Kurtosis -0.181*
kiri/negatif ???kiri/negatif ???
25th Percentile (persentil-25) 70.46550th Percentile (persentil-50) 254.5875th Percentile (persentil-75) 305.205Interquartile Range (dk) 234.74
* Perhitungan dengan Mic. Excel19
Penyajian DataPenyajian Data
1. Tabel Distribusi Frekuensi2. Pie Chart3. Dot Plot4. Histogram5 Diagram Batang Daun (stem leaf)5. Diagram Batang – Daun (stem - leaf)6. Diagram Kotak –Titik (box plot)7. dll…
Penyajian data dalam bentuk grafik dapat dilakukan secara
Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.
20
Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
Tabel Distribusi FrekuensiTabel Distribusi Frekuensi Data banyaknya pelanggan yang datang ke sebuah
k d h d b l l 20y y p gg y g g
mini market di 15 hari tertentu pada bulan Juli 2011.26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval
Titik Tengah Kelas
Frekuensi (f) Frekuensi Kumulatif
21 35 28 1 121-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15PRINSIP DASAR
PELUANG
21Bagaimana bentuk histogramnya?
PELUANG
Pie ChartPie Chart
10%
9%
58%23%
Pie chart merupakan grafik yang berbentuk lingkaran yang ti t kili i t tmana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data
22
y ydalam bentuk proporsi dari satu kelompok data.
Dot PlotDot Plot
2,5
3
3,5si
0,5
1
1,5
2
frek
uens
Cara menggambarkan data dalam bentuk titik dengan
00 20 40 60 80 100
nilai
Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutan
Titik ditumpuk diatas nilai data yang digambarkan.
23
p y g g
Histogram Histogram
Histogram adalah gambar berdasarkan distribusi g gfrekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle)
24
(rectangle). Daerah setiap rectangle sebanding dengan frekuensinya.
Diagram Batang-Daun(St L f)(Stem-Leaf)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Stem atau batang, mirip dengan grup data padahi t d k l f t d i i d f k ihistogram, sedangkan leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang adadalam bilangan yang membentuk harga data, sedangkan digit di
25
g y g g g gbelakangnya akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak-TitikDiagram Kotak Titik(Box-Plot)
95100 max
85
95
76
60
70
80
90max
q2
q3
mean
26
47,5
20
30
40
50
min
q1
Box Plot digunakan untuk menyelidiki distribusi tanpa k d d h d
0
10
menggunakan grup data seperti pada histogram dan diagram batang daun.
Box Plot terdiri dari: data i q1 q2 (median) q3 dan
26
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak.
Pencilan pada Box Plot
* pencilan atasBAP (pagar atas)
upper whisker
q2
q3
mean
maksimum
lower whisker
q1
minimumlower whisker
**
pencilan bawahBBP (pagar bawah)
27
Kelemahan dan KeunggulanKelemahan dan KeunggulanKELEMAHAN KEUNGGULAN
C DOT PLOT
Tidak efektif untuk ukuran data yang besar
Cepat
Nilai data asli dapat diperkirakan
Lama Histogram peluang dapat memberi gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Nilai data tidak nampak
tentang distribusi populasi
Tidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
BATANG-DAUN Menuntut ketelitian mencatat daun
Cepat
Tidak memerlukan perhitungan
Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai parameterp g g p
BOX PLOT
Membutuhkan perhitungan yang panjang
Terdiri dari parameter-parameter
Box plot dapat memberi gambaran tentangbentuk distribusi populasi
Efektif untuk membandingkan bentuk distribusi
28
p pdari data yang sudah diurutkan
gbeberapa kelompok data sekaligus
Bentuk Distribusi IdealN lNormal
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
K t i 3 (d l ft t t t k t i l 0
29
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
Latihan 1Latihan 1 Suatu jenis polimer digunakan dalam sistem evakuasi pesawat terbang.
Penting diperhatikan bahwa polimer tersebut harus mampu melawanproses penuaan. Diambil dua puluh sampel polimer yang kemudian dibagiatas dua percobaan. Percobaan pertama (batch 1) yang melibatkan 10
l d k k dsampel dikenakan proses percepatan penuaan dengan temperatur tinggiselama 10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak dikenakanproses apa-apa. Kekuatan daya rentang (dalam psi) sampel-sampel tersebutdiukur dan dicatat sebagai berikutdiukur dan dicatat sebagai berikut.
Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205
Q: Apakah percobaan proses penuaan memberikan
30Sumber: Walpole (2006), hal.13
Q: Apakah percobaan proses penuaan memberikan dampak pada kekuatan daya rentang polimer?
Latihan 1Latihan 1
K l k i ik kiK l k i ik ki- Keluarkan sari numerik yang mungkin- Keluarkan sari numerik yang mungkinUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATASUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKUVARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???
Pilih plot yang informatif untuk menjawab pertanyaan tersebutPilih plot yang informatif untuk menjawab pertanyaan tersebut
31
Misal: BOXPLOT
SARI NUMERIKBatch.1 Batch.II
Mean 222,10 209,90SARI NUMERIK Variansi 23,6556 42,1000Simp.Baku 4,86 6,49
Min. 216 201Max. 229 219Q1 218 204,25
Median 221,5 210Q3 226,5 214,75
226.5229230 230
216218
221.5
210
215
220
225
214.75
219
210210
215
220
225
Batch 1195
200
205
210
201
204.25
210
195
200
205
210
@ UM32
195 Batch 2195
APA YANG DAPAT DISIMPULKAN??
Latihan 2Latihan 2 Berikut adalah data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2002 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Desa u Ja eb a p e Ju Ju gust Sep O t op es2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.732003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.022004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6
Q: Untuk tiap-tiap tahun1. Keluarkan sari numerik data di atas.2. Hitung variansi dengan 2 cara, bandingkan.3. Buat box plot.4. Ceritakan hasil olahan data Anda.
33 Sumber: Walpole (2006), hal.29, NO.1.24
Dikumpul Senin, 6 Februari 2012Dikumpul Senin, 6 Februari 2012
Transformasi Data (pengayaan)Transformasi Data (pengayaan)
Transformasi dilakukan untuk mendapatkan bentuk distribusiyang lebih simetris.
T f T T k Transformasi TanggaTukey
-1/x2 -1/x √x log (x) x x2 x3 10x
data awal untuk bentuk distribusi : skewness negatif
untuk bentuk distribusi : skewness positif
Data contoh kasus : skewness = 0 5 (menceng kiri)
Merenggangkan data‐data yang berharga kecildan merapatkan data‐data yang berharga besar
Merapatkan data‐data yang berharga kecil danmerenggangkan data‐data yang berharga besar
34
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x.
Transformasi Data (pengayaan) Contoh KasusContoh Kasus
x y = x2
Lebih mendekati simetris (skew = 0) 873759
756913693481
Lebih mendekati simetris (skew 0) dibanding sebelum transformasi
(skew = -0,5)
49699583
2401476190256889 k 0 1883
873995
6889756915219025
skew = -0,18
837683
6
6889577668896 6
35
2646
6762116
transformasi
** Ketika data ditransformasi, maka satuandari data juga akan berubah
Latihan 3Latihan 3
Mencari, mengumpulkan, mengolah, menganalisis dan menarik kesimpulan atas data Anda sendiri.
Sumber data: buku teks, TA, data praktikum, koran, majalah, i dll ( b ik di ik d l hinternet, dll (sebaiknya disesuaikan dengan permasalahan yang mungkin dihadapi di prodi masing‐masing).Ceritakan tentang data tersebut (histori data).
Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Rabu, 8 Februari 2012Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Rabu, 8 Februari 2012
36
Contoh Tugas AContoh Tugas A Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181 Analisis Data Tahun
2010.
70,5 75,5 68 85,5 84,5 78,5 58,5 82 75,5 84 64,5
53 69,5 92,5 62 68,5 74,5 59,5 83 79,5 89,5 79, , , , , , ,
53 54 84 66 79 78,5 84 80,5 74,5 74,5 64
74,5 73 75 82 73 67,5 70 68 75 70,5 74,5
70,5 62 61,5 81 58,5 43,5 74,5 39 77 87 71
Histori data:
Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah terdiri dari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008 prodi Matematika ITB
UTS 1 dilaksanakan pada hari Rabu, 13 Oktober 2010.
Pelaksanaan ujian adalah paralel dengan kelas 01.
Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan Ganda dan 2 soal Pilihan Benar-Salah, dan Bagian II terdiri dari 3 soal ESEI. Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan).
37
g
Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni Mukhaiyar
Lampiran Tugas A
@ UM38
Referensi Referensi
h l h l Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering, 8th Ed., 2007.Engineering, 8th Ed., 2007.
39