Statistik Deskriptif Mata Kuliah Statistika Rekayasa, Keandalan, dan Resiko Tahun Pelajaran 2010-2011
Statistik Deskriptif
Mata Kuliah Statistika Rekayasa, Keandalan, dan ResikoTahun Pelajaran 2010-2011
3
Statistik Deskriptif
Tahapan statistik yg meliputi kegiatan:
•mengumpulkan,
•mengklasifikasikan,
•meringkas,
•menginterpretasikan, dan
•menyajikan data dari suatu kelompok yg terbatas,
tanpa menganalisa dan menarik kesimpulan yg bisa berlaku bagi kelompok yg lebih luas.
5
2.1.1. Pengumpulan Data
2.1.1.1. Data Kualitatif/Data Atribut adalah data yang bukan berupa angka atau bilangan sehingga tidak dapat dilakukan operasi matematik.
Contoh:
Data Jenis vegetasi laut
5
Data kualitatif dibedakan menjadi 2 tipe:
Data Nominal/Data Kategori: data hasil survey pada suatu objek yg hanya memiliki satu kategori.
Contoh: jenis kelamin bayi
Data Ordinal: data hasil survey pada suatu objek yg menghasilkan lebih dari satu kategori.
Contoh: selera terhadap suatu produk makanan, suka, tidak suka, sangat suka, dan seterusnya.
5
2.1.1. Pengumpulan Data
2.1.1.1. Data Kuantitatif adalah data yang berupa
angka atau bilangan sehingga dapat dilakukan
operasi matematik.
6
Data Kuantitatif dibedakan menjadi 2 tipe:
a. Data diskrit: data yg diperoleh dari suatu pencacahan/numerasi.
Data ini berbentuk bilangan-bilangan bulat 0,1,2,3,4,5,...dst.
contoh: data sensus jumlah bangunan lepas pantai
6
b. Data kontinu: data kuantitatif yang secara teoritis dapat bernilai berapapun di antara 2 nilai yang diketahui.
Data yg umumnya didapat dari suatu pengukuran dg suatu instrumen (alat ukur).
7
2.1.2. Pengorganisasian Data
2.1.2.1. Data Mentah (Row Data)
data terkumpul yg belum diorganisasikan secara numerik.
2.1.2.2. Jajaran Data (Data Array)
pengorganisasian data yg paling sederhana, yaitu dg mengurutkan nilai numerik secara:
•menaik (ascendingi)
•menurun (descending)
8
2.1.3. Penyajian Data
Tabel dan diagram statistik digunakan untuk:
menyajikan data yg sudah diringkas
menyingkapkan hubungan-hubungan antar variabel
menginterpretasikan dan mengkomunikasikan fakta-fakta angka
kepada pihak yg membutuhkannya.
8
Data statistik dapat disajikan dalam berbagai bentuk, antara lain,
•Histogram
•Pie diagram
•Grafik batang
•Diagram garis
Penyajian data sangat penting karena akan mempengaruhi sudut pandang konsumen.
© 2002 Prentice-Hall, Inc. Chap 2-14
Using “chart junk” Failing to provide a relative
basis in comparing data between groups
Compressing the vertical axis Providing no zero point on the vertical
axis
Errors in Presenting Data
© 2002 Prentice-Hall, Inc. Chap 2-15
“Chart Junk”
Good Presentation
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Minimum Wage Minimum Wage
0
2
4
1960 1970 1980 1990
$
Bad Presentation
© 2002 Prentice-Hall, Inc. Chap 2-16
No Relative Basis
Good PresentationA’s received by
students.A’s received by
students.
Bad Presentation
0
200
300
FR SO JR SR
Freq.
10
30
FR SO JR SR
%
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
© 2002 Prentice-Hall, Inc. Chap 2-17
Compressing Vertical Axis
Good PresentationQuarterly Sales Quarterly Sales
Bad Presentation
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
© 2002 Prentice-Hall, Inc. Chap 2-18
No Zero Point on Vertical Axis
Good Presentation
Monthly SalesMonthly Sales
Bad Presentation
0
39
42
45
J F M A M J
$
36
39
42
45
J F M A M J
$
Graphing the first six months of sales.
36
10
2.2.1. Distribusi Frekuensi
Suatu metode pengorganisasian data tunggal dengan mengelompokkannya dalam kelas-kelas interval.
Data yg telah diorganisasikan dalam bentuk distribusi frekuensi juga disebut sebagai data kelompok (grouped data)
Breaking stress (kN.m2)
Jumlah (f) persentase
900-999 4 4
1000-1099 19 19
. . . . . . . . . . . . . . . . .
Total (N) 100 100%
Tabel 1.Pengujian breaking stress logam x
11
Agar informasi dari data asli tidak hilang, maka komponen-
komponen berikut harus diperhatikan.
•Interval kelas: interval yg mendefinisikan sebuah kelas,
Contoh: 900-999, 1000-1099,
•Angka-angka di ujung kelas seperti 900 dan 999, 1000 dan
1099 disebut batas kelas (class limit)
11
•Kelas yg tidak memiliki batas di salah satu ujungnya
disebut sebagai kelas terbuka,
contohnya “65 tahun ke atas”.
•batas nyata kelas (Class Boundary) didapat dg membagi-
dua jumlah batas atas suatu kelas interval dg batas kelas nyata
interval kelas berikutnya.
Contoh, 899,5 sampai 999,5.
12
•Lebar interval kelas (c) adalah selisih antara batas bawah nyata dg batas atas nyata kelas.
Contoh: dari tabel (1)
c = 999,5-899,5 = 1099,5 – 999,5 = 100
•Nilai tengah kelas (Class Midpoint/ Class Mark)
Diperoleh dg membagi-dua jumlah dari batas kelas bawah dan batas kelas atas suatu interval kelas.
Contoh: interval kelas 900-999⇨
class midpoint (900+999)/2=949,5⇨
13
2.2.2. Penyusunan Distribusi Frekuensi
1. Menghitung Range (R) = Max – Min
2. Menentukan jumlah kelas (k)
k = 1 + 3,3 x log n
⇨ n:jumlah data; k harus berupa bilangan bulat
3. Menentukan lebar interval kelas (c) = R/k
4. Membuat kolom sebagai berikut:
Interval Kelas Nilai Tengah Kelas Frekuensi
. . . . . . . . . . . .
. . . . . . . . . . . .
14
Contoh: Hasil pengukuran kecepatan angin (knots)
• Range = 5 – 3 = 2• Kelas (k) = 1+ 3.3 log 104 = 7,7 ⇨ 8• Lebar interval (I) = R/k = 2/8 = 0,25
3,5 3 3 3 3 3,5 3,5 3,5 3 3,5 3,5 3,5 3,5
3,5 4 4 4 4 3,5 3,5 3,5 4 3,5 3,5 3,5 3,5
3,5 4 4 4 4 3,5 3,5 3,5 4 3,5 3,5 3,5 3,5
3,6 4 4 4 4 3,6 3,6 3,6 4 3,6 3,6 3,6 3,6
3,6 4 4 4 4 3,6 3,6 3,6 4 3,6 3,6 3,6 3,6
3,9 4 4 4 4 3,9 3,9 3,9 4 3,9 3,9 3,9 3,9
4,2 4 4 4 4 4,2 4,2 4,2 4 4,2 4,2 4,2 4,2
4,6 5 5 5 5 4,6 4,6 4,6 5 4,6 4,6 4,6 4,6
16
IntervalKelas
TitikTengah (Xi)
Frek(f)
3 -3,25 3,125 5
3,26 - 3,5 3,375 24
3,51 - 3,75 3,625 16
3,76 – 4 3,875 38
4.01 - 4,25 4,125 8
4,26 - 4,5 4,375 0
Total 104
Tabel 2. Distribusi Frekuensi
10
2.2.3. Presentasi Grafik
2.2.3.1. Histogram
merupakan grafik yang terdiri atas batang-batang yang saling menempel satu sama lain
ketinggian batang melambangkan frekuensi atau frekuensi relative dari nilai variable yang diwakili oleh batang tersebut.
Grafik Histogram dari data kecepatan angin
0
5
10
15
20
25
30
35
40
3,125 3,375 3,625 3,875 4,125 4,375 4,625 4,875
10
2.2.3.2.Polygon Frekuensi
Suatu grafik garis dari frekuensi-frekuensi interval kelas yg diplot pada nilai-nilai tengahnya.
Grafik Polygon Frekuensi dari data kecepatan angin
0
5
10
15
20
25
30
35
40
3,125 3,375 3,625 3,875 4,125 4,375 4,625 4,875
10
a) DFK Kurang Dari: disusun dg menjumlahkan semua nilai frekuensi dari semua nilai yg lebih kecil dari batas atas nyata kelas interval
b) DFK Lebih Dari: disusun dg menjumlahkan semua nilai frekuensi dari semua nilai yg lebih besar dari batas bawah nyata kelas interval
DFK dipresentasikan dalam grafik yg disebut ogive.
2.2.4.Distribusi Frekuensi Kumulatif (DFK)
10
Contoh Tabel DFK Kurang Dari berdasarkan data hasil pengukuran kecepatan angin.
Tabel distribusi frekuensi kumulatif kurang dari
interval Xi frek frek.kum
3 ≤ x ≤ 3,25 3,125 5 53,26 ≤ x ≤ 3,5 3,375 24 29
3,51 ≤ x ≤ 3,75 3,625 16 453,76 ≤ x ≤4 3,875 38 83
4.01 ≤ x ≤ 4,25 4,125 8 914,26 ≤ x ≤ 4,5 4,375 0 91
4,51 ≤ x ≤ 4,75 4,625 8 994,76 ≤ x ≤5 4,875 5 104
104
10
Contoh Ogive DFK Kurang Dari berdasarkan data hasil pengukuran kecepatan angin.
Grafik Ogive Distribusi Frekuensi Kumulatif Kurang Dari
10
Dengan semakin besarnya jumlah sampel sehingga, maka
polygon/ogive yg terbentuk akan mendekati gambaran
seseungguhnya dari suatu populasi.
Grafik ini kemudian disebut sebagai kurva frekuensi.
simetris menceng kanan menceng kiri
2.2.5.Kurva Frekuensi
10
Adalah ukuran-ukuran yang menunjukkan pusat segugus data, yang telah diurutkan dari yang terkecil sampai yang terbesar atau sebaliknya.
Nilai pusat ini kemudian dapat digunakan sebagai ukuran ringkas yg menggambarkan karakteristik umum data tersebut.
Ukuran pemusatan yang paling banyak digunakan adalah mean, median, dan modus.
Ukuran Pemusatan
10
Average adalah nilai khas yg mewakili sifat tengah dari suatu kumpulan nilai data.
Beberapa ukuran average yaitu:
a. Mean aritmetik
b. Mean aritmetik terbobot
c. Mean geometrik
d. Mean harmonik
e. Mean kuadrat
2.3.1. Rata-rata (Average)
10
Mean aritmetik adalah jenis ukuran yg paling umum digunakan.
Mean aritmetik dari suatu sampel dirumuskan sebagai berikut:
Raw data
Ungrouped frecquency table
10
Contoh: Rata-rata data kecepatan angin (knots)
Data tidak terkelompok (raw data)
X = (3+3+3+........+5)/104 = 3,80625
Data terkelompok (grouped table)
X = (3,125x5+3,375x24+3,625x16+....+4,875x5)/104
= 3,810096
10
Median menyatakan posisi tengah dari data setelah diurutkan dari kecil ke besar.
• Data tidak terkelompok
Contoh dari data angin, Me= (3,9 + 3,9)/2 = 3,9
2.3.2. Median
10
• Data TerkelompokMd = L + [ ( n/2 – F) / f]*c contoh dari data angin:Jumlah data (n) = 104 ,jadi median adalah rata-rata nilai data ke -52 dan ke-53L = tepi bawah kelas median = 3,26i = lebar selang kelas = 0,25F = frek. kumulatif dari seluruh kelas di bawah kelas median = 45f = frekuensi kelas median = 38c = lebar interval kelas = 0,25
Me = 3,76 + [ (52-45)/38]*0,25 = 3,806
10
Modus ukuran/nilai yang paling sering muncul dalam
sebuah kelompok data.
• Data tidak terkelompok
Contoh dari data angin, Md= 4 , dengan frekuensi=30
• Data terkelompok
Mo = L + [ d1 / (d1+d2)]*c
2.3.3. Modus
10
Contoh dari data angin :
Mo = modus
L = tepi bawah kelas modus = 3,26
d1 = selisih antara frekuensi kelas modus dengan kelas sebelumnya = 22
d2 = selisih antara frekuensi kelas modus dengan kelas sesudahnya = 30
c= lebar interval kelas = 0,25
Jadi Mo = 3,76 + [( 22 / (22+30) ] *0,25
= 3,76 + 0,105769
= 3,865
10
Kuantil adalah nilai-nilai yg membagi suatu jajaran data
menjadi bagian-bagian yg sama.
• kuartil membagi data menjadi 4 bagian yg sama,
• desil membagi data menjadi 10 bagian yg sama,
• Persentil membagi data menjadi 100 bagian yg sama
2.3.4. Kuantil: Kuartil, Desil, Persentil
10
Persamaan:
Ki = Li + [(i/r)*n – F ]*c/f
Keterangan:
Ki = kuantil ke-i
Li = batas bawah kelas kuantil ke-i
n = banyaknya data
F = jumlah frekuensi seluruh kelas yg lebih rendah dari kelas kuantil ke-i
f = frekuensi kelas kuantil ke-i
c = lebar interval kelas kuantil
10
Ukuran penyebaran (dispersion) menunjukkan seberapa
jauh data menyebar dari nilai rata-ratanya (variabilitas data).
ukuran penyebaran yang umum digunakan antara lain,
•Jangkauan/kisaran (range)
•Simpangan kuartil
•Deviasi standard/ simpangan baku
•varians
Ukuran Penyebaran
10
Jangkauan menyatakan perbedaan dari nilai terbesar dan
terkecil dari suatu jajaran data.
R = Xmax – XminDimana:R = Jangkauan/rangeXmax = nilai data terbesarXmin = nilai data terkecil
Contoh dari data angin:
R = 5 – 3 = 2
2.4.1. Jangkauan (Range)
10
Simpangan Kuartil didefinisikan sebagai
Qd = (Q3 – Q1) / 2
Dimana:
Qd = simpangan kuartil
Q3 = nilai kuartil ke-3
Q1 = nilai kuartil ke-1
2.4.2. Simpangan Kuartil
10
Deviasi Standard didefinisikan sebagai ukuran persebaran
data terhadap mean/ rata-ratanya.
Varians merupakan kuadrat dari deviasi standard,
sehingga untuk sampel dinyatakan sebagai sx²
dan untuk populasi sebagai σx².
2.4.3. Deviasi Standard dan Varians