Top Banner
MODUL STATISTIKA KOMPUTASI (FA225620) Oleh : I Wayan Sumarjaya, S.Si., M.Stats. JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA SEMESTER GENAP 2015/2016
69

simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

Mar 28, 2021

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

MODUL STATISTIKA KOMPUTASI(FA225620)

Oleh :I Wayan Sumarjaya, S.Si., M.Stats.

JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS UDAYANASEMESTER GENAP 2015/2016

Page 2: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

KATA PENGANTAR

Modul Statistika Komputasi (FA225620) diawali dari pembahasan tentang konsep dasarstatistika seperti pengertian statistika, jenis data, dan perbedaan antara statistika deskriptifdan inferensial. Bab 2 membahas tentang ukuran-ukuran statistik untuk data. Ukuran inimeliputi ukuran pemusatan dan penyebaran data. Deskripsi data kuantitatif dan kualitatifdibahas pada Bab 3. Bab ini meliputi plot batang daun, tabel frekuensi, histogram, boxplot, dan poligon frekuensi.

Bab 4 membahas konsep dan definisi peluang, konsep permutasi dan kombinasi, pelu-ang salah satu dari dua kejadian, peluang bersama dua kejadian, aksioma peluang dan ap-likasi kaidah Bayes. Bab 5 membahas sebaran peluang yang meliputi sebaran peubah acakdiskret dan peubah acak kontinu. Materi selanjutnya adalah sebaran pengambilan sampelyang membahas sebaran rata-rata sampel, selang kepercayaan rata-rata populasi, selangkepercayaan varians populasi, dan selang kepercayaan proporsi. Materi kuliah diakhirimateri tentang uji hipotesis yang membahas uji hipotesis untuk rata-rata dan varians.

Akhir kata semogamodul ini bermanfaat bagi mahasiswa yangmengambil mata kuliahstatistika komputasi. Segala kritik dan saran guna perbaikan modul ini harap dikirim viaemail ke [email protected].

Bukit Jimbaran, Februari 2016

Penulis

i

Page 3: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

DAFTAR ISI

KATA PENGANTAR i

DAFTAR ISI ii

DAFTAR GAMBAR iv

DAFTAR TABEL v

BAB 1. Konsep Dasar Statistika 11.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Pengertian Statistika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.1 Alasan belajar statistika . . . . . . . . . . . . . . . . . . . . . . . 21.3 Statistika Deskriptif dan Inferensial . . . . . . . . . . . . . . . . . . . . . 31.4 Pengertian dan Jenis Data . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4.1 Variabel Kuantitatif . . . . . . . . . . . . . . . . . . . . . . . . . 31.4.2 Variabel Kualitatif . . . . . . . . . . . . . . . . . . . . . . . . . 41.4.3 Variabel Bebas dan Tidak Bebas . . . . . . . . . . . . . . . . . . 4

1.5 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

BAB 2. Ukuran-ukuran Statistik untuk Data 62.1 Populasi dan Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2 Parameter dan Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.3 Ukuran Pemusatan dan Penyebaran Data . . . . . . . . . . . . . . . . . . 72.4 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

BAB 3. Deskripsi Data 163.1 Menampilkan Data Kuantitatif . . . . . . . . . . . . . . . . . . . . . . . 16

3.1.1 Plot Batang-daun . . . . . . . . . . . . . . . . . . . . . . . . . . 163.1.2 Tabel Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.1.3 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.1.4 Box Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.1.5 Poligon Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.2 Menampilkan Data Kualitatif . . . . . . . . . . . . . . . . . . . . . . . . 203.2.1 Tabel Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.2.2 Bagan Lingkaran . . . . . . . . . . . . . . . . . . . . . . . . . . 213.2.3 Bagan Batang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.3 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

ii

Page 4: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

DAFTAR ISI iii

BAB 4. Peluang 244.1 Definisi Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.1.1 Definisi klasik . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.1.2 Definisi frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . 264.1.3 Definisi matematika (aksiomatik) . . . . . . . . . . . . . . . . . 26

4.2 Permutasi dan Kombinasi . . . . . . . . . . . . . . . . . . . . . . . . . . 274.3 Peluang Salah Satu dari Dua Kejadian . . . . . . . . . . . . . . . . . . . 274.4 Peluang Bersama Dua Kejadian . . . . . . . . . . . . . . . . . . . . . . . 28

4.4.1 Peluang bersyarat . . . . . . . . . . . . . . . . . . . . . . . . . . 284.5 Aksioma dan Aturan-aturan Peluang . . . . . . . . . . . . . . . . . . . . 294.6 Kaidah Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.6.1 Aplikasi Kaidah Bayes . . . . . . . . . . . . . . . . . . . . . . . 314.7 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

BAB 5. Sebaran Peluang 365.1 Peubah Acak Diskret . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5.1.1 Sebaran Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 395.1.2 Sebaran Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2 Peubah Acak Kontinu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415.2.1 Sebaran Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5.3 Latihan Soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

BAB 6. Sebaran Pengambilan Sampel 456.1 Sebaran rata-rata sampel . . . . . . . . . . . . . . . . . . . . . . . . . . 466.2 Selang kepercayaan untuk rata-rata populasi . . . . . . . . . . . . . . . . 496.3 Selang kepercayaan untuk varians populasi . . . . . . . . . . . . . . . . . 526.4 Sebaran Pengambilan Sampel Selisih Dua Rata-rata . . . . . . . . . . . . 53

6.4.1 Varians Diketahui . . . . . . . . . . . . . . . . . . . . . . . . . . 536.4.2 Varians tidak diketahui . . . . . . . . . . . . . . . . . . . . . . . 54

6.5 Selang Kepercayaan untuk Proporsi . . . . . . . . . . . . . . . . . . . . 556.6 Selang Kepercayaan untuk Selisih Dua Proporsi Binomial . . . . . . . . . 556.7 Selang Kepercayaan untuk Rasio Dua Varians . . . . . . . . . . . . . . . 56

BAB 7. Uji Hipotesis 587.1 Langkah-langkah uji hipotesis . . . . . . . . . . . . . . . . . . . . . . . 607.2 Uji hipotesis untuk rata-rata . . . . . . . . . . . . . . . . . . . . . . . . . 617.3 Uji hipotesis untuk varians . . . . . . . . . . . . . . . . . . . . . . . . . 62

DAFTAR PUSTAKA 63

Page 5: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

DAFTAR GAMBAR

Gambar 2.1 Sebaran simetrik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Gambar 2.2 Sebaran pencong ke kanan. . . . . . . . . . . . . . . . . . . . . . . 10Gambar 2.3 Sebaran pencong ke kiri. . . . . . . . . . . . . . . . . . . . . . . . . 10

Gambar 3.1 Histogram berat badan 30 orang Asia menggunakan perangkat lunakR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Gambar 3.2 Bentuk histogram untuk beberapa tipe sebaran data. [Sumber: (Varde-man and Jobe, 2001, hlm. 73)] . . . . . . . . . . . . . . . . . . . . . 19

Gambar 3.3 Diagram kotak berat badan 30 orang Asia. . . . . . . . . . . . . . . 20Gambar 3.4 Poligon frekuensi untuk data berat badan 30 orang Asia. . . . . . . . 21Gambar 3.5 Bagan lingkaran jumlah obat antidepressan . . . . . . . . . . . . . . 22Gambar 3.6 Bagan obat antidepressan. . . . . . . . . . . . . . . . . . . . . . . . 22Gambar 3.7 Bagan obat antidepressan frekuensi relatif. . . . . . . . . . . . . . . 22

iv

Page 6: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

DAFTAR TABEL

Tabel 2.1 Berat badan 30 orang Eropa dalam kg . . . . . . . . . . . . . . . . . . 8Tabel 2.2 Perbandingan rata-rata dan median berat badan lima orang . . . . . . . 9Tabel 2.3 Berat badan 30 orang Asia . . . . . . . . . . . . . . . . . . . . . . . . 12

Tabel 3.1 Berat badan 30 orang Asia . . . . . . . . . . . . . . . . . . . . . . . . 17

Tabel 4.1 Situasi I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Tabel 4.2 Situasi II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Tabel 4.3 Situasi III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Tabel 4.4 Situasi I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Tabel 4.5 Situasi II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

v

Page 7: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 1Konsep Dasar Statistika

1.1 Latar BelakangSebelum kita membahas apa itu statistika, kita terlebih dahulu membahas cara berpikirdeduktif dan induktif serta metode ilmiah1.

Misalkan terdapat kejadian seperti berikut. Seorang dokter sedang melakukan pengu-jian (memeriksa pasien) atau melakukan pengujian radiografi. Dokter ini mengumpulkandata pasien ini untuk selanjutnya digunakan sebagai pedoman dalam melakukan tindakanpengobatan atau diagnostik selanjutnya. Dalam memberikan keputusan untuk melakukantindakan tersebut dapat berdasarkan kepada ilmu pengetahuan selama dia menjalani pen-didikan sebagai dokter, dapat pula berdasarkan literatur atau sumber-sumber lain. Prinsip-prinsip umum yang diterapkan pada situasi khusus untuk mendapatkan keputusan terbaikuntuk pasien di atas disebut cara penalaran atau argumentasi deduktif (deductive reason-ing). Dengan kata lain, cara berargumen dari umum ke khusus (general to specific).

Seringkali pula kita berpikir sebaliknya, yaitumenggunakan informasi dari subjek spe-sifik ke umum (specific to general). Penalaran seperti ini disebut penalaran induktif (in-ductive reasoning). Sebagai contoh seorang biologiwan melakukan penelitian terhadapsuatu spesies tumbuhan tanaman obat tertentu dan dari apa yang diamati peneliti berusahamembuat simpulan rasional tentang apa yang terjadi secara umum.

Dalam metode ilmiah (scientific method) kita mengenal empat tahapan lihat (Elstonand Johnson, 1994).

1. Melakukan observasi (making observation): mengumpulkan data.

2. Membuat hipotesis (generating/formulating a hypothesis): sesuatu yang berhubun-gan dengan perumusan tujuan penelitian.

3. Pengujian hipotesis (test the hypothesis): melakukan pengujian hipotesis. Langkahini berhubungan dengan data apa saja yang diperlukan.

4. Melakukan percobaan (experimenting):

a) Melakukan inferensi untuk menolak atau menerima hipotesis;1Draf materi kuliah untuk tanggal 3 Februari 2016. Kirim email [email protected] kalau ingin

mengirimkan komentar, saran, dan lain-lain.

1

Page 8: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 1. KONSEP DASAR STATISTIKA 2

b) Jika hipotesis ditolak kita kembali ke langkah 2. Jika hipotesis diterima, tidak-lah berarti itu benar. Hanya saja berdasarkan pengetahuan yang ada sekarangitu dianggap benar.

c) Hipotesis secara konstan diperbaiki (refined) dan diuji seiring dengan bertam-bahnya pengetahuan.

Dalam metode ilmiah kita menggunakan inferensi induktif dan tidak pernah membuk-tikan sesuatu dengan kepastian absolut (absolute certainty). Metode ilmiah memberikancara objektif dalam memformulasikan ide-ide baru dan memeriksakan ide-ide ini dengandata sesungguhnya dan mengerucutkan kembali penemuan-penemuan ini. Sebagai contohmisalkan Anda melakukan penelitian terhadap 20 orang pasien penyakit tertentu. Dalamupaya untuk merampatkan (to generalize) hasil berdasarkan sampel dari 20 pasien ini,Anda mungkin bertanya sebagai berikut.

1. Jika 20 orang pasien baru diperiksa apakah hasilnya sama dengan studi pada 20pasien pertama?

2. Jika lab berbeda menganalisis sampel darah apakah hasilnya akan serupa?

3. Jika sampel darah disimpan pada suhu berbeda apakah hasilnya akan sama?

Untuk menjawab pertanyaan-pertanyaan di atas kita memerlukan statistika. Subbab se-lanjutnya akan membahas pengertian statistika.

1.2 Pengertian StatistikaStatistika adalah ilmu yang berkaitan dengan pengumpulan, pengorganisasian, analisis,interpretasi, dan presentasi informasi yang dapat dinyatakan secara numerik. Ada duakata yang sering disalahartikan:

1. Statistik (tanpa ”a”) adalah pendugaan dari kuantitas numerik yang tidak diketahui,seperti rata-rata, median, atau modus. Contoh rata-rata tinggi mahasiswa JurusanFarmasi adalah 165 cm.

2. Statistika adalah ilmu yang berkaitan dengan pengumpulan, pengorganisasian, anal-isis, interpretasi, dan presentasi informasi yang dapat dinyatakan secara numerik.

1.2.1 Alasan belajar statistikaAda beberapa alasan untuk belajar statistika:

1. Membuat keputusan yang benar berdasarkan kepada data yang dimiliki, tahu databerasal dari mana dan bagaimana data itu diperoleh, juga harus tahu apakah datayang diperoleh secara statistika syah.

2. Anda harus mampu memahami dan mengevaluasi pustaka-pustaka yang berhubun-gan dengan analisis data dengan cara yang cerdas. Banyak di antara artikel-artikeltersebut dibuat dengan argumentasi statistika yang tidak tepat.

Page 9: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 1. KONSEP DASAR STATISTIKA 3

3. Anda tahu kapan dan untuk tujuan apa seorang statistikawan diperlukan konsul-tasinya.

Terkait dengan alasan-alasan di atas, seorang statistikawan dapat melakukan beberapahal berikut:

1. Merekomendasikan rancangan studi yang sesuai dengan tujuan (objectives) peneli-tian dan meningkatkan jumlah informasi yang bisa diperoleh.

2. Membantu dalam mengembagnkan formulir pengumpulan data yang efisien danmudah diproses.

3. Merekomendasikan cara-cara untukmemantau kualitas data begitu data dikumpulkan.

Setelah data dikumpulkan dan disiapkan untuk analisis seorang statistikawan dapat:

1. merekomendasikan metode yang paling cocok untuk analisis data;

2. menginterpretasi temuan-temuan dengan istilah-istilah yang mudah dimengerti;

3. mengulas dan berkontribusi kepada isi dalam laporan atau publikasi.

1.3 Statistika Deskriptif dan InferensialPada saat kitamengumpulkan data kita dapatmengambil ringkasan-ringkasan penting databaik dalam ringkasan numerik maupun grafikal. Sebagai contoh rata-rata dan median darisuatu jenis tanaman dan plot histogram dari tanaman tersebut. Statistik yang dirangkumini sifatnya deskriptif sehingga disebut statistika deskriptif. Statistika deskriptif ini mem-berikan gambaran awal tentang data.

Untuk tujuan penelitian yang lebih kompleks, kita akanmelakukan pengujian hipotesisdan mengambil simpulan dari apa yang kita lakukan. Pengambilan simpulan dan pengu-jian hipotesis ini merupakan bagian dari inferensi statistika (statistika inferensial).

1.4 Pengertian dan Jenis DataLangkah pertama sebelummelakukan kalkulasi ataumemplot data adalahmemutuskan je-nis data yang sedang dihadapi (Swinscow and Campbell, 2002). Swinscow and Campbell(2002) mengatakan terdapat banyak tipologi, namun perbedaan mendasar adalah variabelkuantitatif (yang mana kita akan bertanya ”berapa banyak?”) dan variabel kategorik ataukualitatif (yang mana kita akan bertanya ”apa jenisnya?”. Subbab ini membahas beberapatipologi tersebut.

1.4.1 Variabel KuantitatifSecara garis besar variabel kuantitatif dapat diukur (measured) atau dihitung (counted).Variabel kuantitatif dapat diukur menurut suatu jumlah atau kuantitas dan disebut jugavariabel numerik, skala, ataumetrik. Variabel yang diukur seperti tinggi badan secara teoridapat memiliki sebarang nilai dalam suatu rentang tertentu dan diberikan istilah ”kontinu”.

Page 10: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 1. KONSEP DASAR STATISTIKA 4

Apabila nilai-nilai variabel kuantitatif ini hanya bernilai bulat atau nilai dalam jumlahkecil, kita katakan ”diskret” atau ”diskontinu”. Urutan dan magnitud memegang perananpenting dalam variabel diskrit, dan nilainya terbatas pada bilangan bulat saja. Dengankata lain data diskret ini biasanya dilakukan dengan menghitung. Sebagai contoh datamahasiswa per jurusan di Universitas Udayana.

Seringkali nilai variabel tidak terbatas pada nilai tertentu. Sebagai contoh kita men-gukur berat badan seseorang misalnya 60kg. Variabel seperti ini dikatakan kontinu. Me-ngingat kita melakukan pengukuran terhadap semua nilai pecahan (fractional) di dalamsuatu selang maka nilai ini berada dalam skala interval (interval scale).

Variabel kuantitatif diskret dan kontinu kadang tumpang tindih, namun hal ini tidaklahsignifikan karena data dapat dideskripsikan dengan statistik yang sama seperti median.Menurut Nick (2007) rasio hanya dapat diambil apabila variabel kuantitatif memiliki titiknol yang tidak sembarang (nonarbitrary zero point). Sebagai contoh skala temperaturCelcius adalah skala relatif dan bukan ukuran skala rasio. Misalnya 50◦C tidaklah duakali lipat 25◦C. Namun, skala Kelvin adalah skala absolut sehingga kita dapat mengatakan50K adalah dua kali panas 25K.

1.4.2 Variabel KualitatifVariabel kualitatif (qualitative variable) merupakan klasifikasi atau kategori. Sehinggamemunculkan istilah variabel kategorik (categorical variable). Sebagai contoh kitamengk-lasifikasikan tinggi orang sebagai ”rendah”, ”sedang”, atau ”tinggi”. Contoh lain adalahklasifikasi ras seperti ”Asia”, ”hitam”, ”Kaukasia”. Variabel kategorik ini dibagi menjadidua jenis: ordinal dan nominal. Suatu variabel dikatakan variabel ordinal apabila terda-pat urutan secara alamiah (natural ordering). Sebagai contoh pengklasifikasian penyakitdalam skala empat: ”tidak sakit”,”agak sakit”,”sakit”, ”parah”. Apabila tidak terdapaturutan secara alamiah, variabel kualitatif disebut variabel nominal. Sebagai contoh kitamengklasifikasikan warna rambut: ”hitam”,”merah”,dan ”pirang”. Variabel nominal yanghanya memiliki dua kategori disebut variabel dikotomus (dichotomous variable) atau vari-abel biner (binary variabel), misalnya jenis kelamin (laki-laki, perempuan).

Pengklasifikasian variabel nominal dan ordinal kadang bersifat subjektif. Misalkankita mengklasifikasikan seorang pasien sebagai ”sangat cemas”,”normal”, dan ”depresi”.Kita mungkin mengklasifikasikan pasien ini sebagai variabel ordinal. Namun, orang lainbisa mengkatagorikan variabel ini sebagai nominal. Contoh lain misalkan genotipe dik-lasifikasikan pada skala nominal dengan tiga kategori genotipeAA,AB, BB. Namun lebihlazim orang menghitung jumlah allelle A dan dinyatakan sebagai skala ordinal 0, 1, atau2 allelle A.

1.4.3 Variabel Bebas dan Tidak BebasVariabel respons (response variable), disebut juga variabel tak bebas (dependent variable)atau variabel hasil (outcome variable), adalah suatu ukuran yang dipengaruhi oleh kon-disi yang berbeda dan merupakan tujuan utama penelitian (primary interest). Variabelbebas (independent variable), disebut juga variabel factor (factor variable) atau variabelpemrediksi (predictor variable), merupakan variabel yang secara aktif dikendalikan atau

Page 11: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 1. KONSEP DASAR STATISTIKA 5

dikontrol oleh peneliti untuk memahami varisi yang teramati pada variabel respons. Vari-abel bebas dan tak bebas dapat berupa kuantitatif atau kualitatif.

1.5 Latihan1. Jika Anda akan melakukan suatu penelitian apakah suatu tanaman dapat menjadi

obat atau tidak apa langkah-langkah yang akan dilakukan?

2. Klasifikasikan jenis-jenis data berikut. Apakah termasuk kuantitatif (kontinu ataudiskret), kategorik (ordinal atau nominal), atau tipe lainnya.

a) tekanan darah, tinggi badan, berat badan, umur;b) banyak anak dalam suatu keluarga;c) tidak setuju, netral, setuju;d) golongan darah: O, A, B, AB;e) hidup atau mati;f) jenis kelamin (laki-laki/perempuan);g) stadium penyakit kanker.

3. Fahrenheit termasuk ke dalam skala interval. Misalkan dalam suatu percobaan un-tuk mengetahui kadar suatu zat tertentu A mengukur zat tersebut pada 40◦F dan50◦F, tetapi B mengukur zat tersebut pada 35◦F dan 45◦F. Apakah selisih penguku-ran suhu yang dilakukan A dan B sama?

4. Berikan contoh skala interval, rasio, ordinal, dan nominal.

Page 12: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2Ukuran-ukuran Statistik untuk Data

Bab ini1 membahas beberapa ukuran statistik untuk data yaitu ukuran pemusatan, ukuranpenyebaran, dan ukuran bentuk. Pembahasan diawali dengan pemberian definisi tentangpopulasi dan sampel.

2.1 Populasi dan SampelSalah satu tujuan statistika adalah membuat kesimpulan tentang populasi berdasarkansampel yang diambil. Populasi merupakan kumpulan atau kelompok dari semua unit studiyangmemberikan informasi. Sebagai contoh kumpulan laki-laki dengan tingkat kolesteroltinggi (populasi). Dalam hal ini unit studi adalah laki-laki dengan tingkat kolesterol tinggi.

Secara umum populasi dibedakan menjadi dua jenis populasi: populasi target dan pop-ulasi studi. Populasi target (target population) merupakan keseluruhan kelompok unitstudi yang mana kita tertarik dalam mengaplikasikan simpulan kita. Sedangkan populasistudi (study population) merupakan kelompok unit studi yang mana kita dapat mengap-likasikan simpulan kita secara syah (legitimately apply our conclusion). Sebagai catatan,populasi target tidak selalu dapat diakses dan kita hanya dapat mempelajari bagian darinyayang tersedia. Sebagai contoh, kita akanmelakukanwawancaramelalui telepon rumah un-tuk mengetahui semua populasi orang dewasa (dalam hal ini populasi target), namun kitatidak memiliki akses kepada orang-orang yang tidak memiliki telepon.

Contoh lain untuk memberikan gambaran kedua jenis populasi tersebut di atas adalahsebagai berikut. Misalkan kita akan melakukan penelitian terhadap suatu komunitas ter-tentu tentang pengaruh obat A kepada semua laki-laki dengan tingkat kolesterol tinggi didalam komunitas tersebut. Namun, setelah mengambil sampel laki-laki dalam komunitastersebut hanya laki-laki yang mengunjungi dokter, klinik, atau rumah sakit yang tersediauntuk diambil sampel darahnya. Dengan demikian kita memiliki populasi studi dari unit-unit studi yang bisa diakses dan suatu target populasi termasuk populasi studi dan unit-unitstudi yang tidak dapat diakses. Unit-unit studi yang tidak dapat diakses mungkin atau tidakmungkin memiliki karakteristik yang sama dengan populasi studi. Dengan demikian sim-pulan yang diambil dari populasi studi tidaklah harus diterapkan kepada populasi target.

1Draf materi kuliah untuk tanggal 3 Februari 2016. Kirim email [email protected] kalau inginmengirimkan komentar, saran, dan lain-lain.

6

Page 13: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 7

2.2 Parameter dan StatistikPada subbab sebelumnya telah diuraikan dua jenis populasi. Pertanyaan sekarang adalahbagaimana cara mengumpulkan informasi tentang populasi studi? Salah satu cara untukmengumpulkan informasi adalah dengan melakukan sensus lengkap dari populasi denganmengumpulkan setiap data untuk setiap unit studi di dalam populasi. Namun, mengingatwaktu, uang, dan tenaga yang dibutuhkan untuk melakukan sensus lengkap biasanya halini tidak dimungkinkan.

Pendekatan yang lebih praktis adalah dengan mengambil sampel dari populasi. Jikasampel yang diambil mewakili populasi maka inferensi/simpulan yang dibuat dari datasampel tentang populasi akan benar. Istilah statistik (statistic) digunakan untuk meny-atakan kuantitas yang dihitung dari data sampel. Contoh statistik adalah rata-rata, median,dan modus. Kuantitas yang merupakan karakteristik dari populasi disebut parameter.

Jika sampel yang diambil mewakili populasi, statistika deskriptif (akan dibahas padabab selanjutnya) akan memberikan gambaran akurat tentang parameter yang bersesuaiandari populasi. Selanjutnya pertanyaan kita adalah bagaimana mengambil sampel yangmewakili? Ini akan dibahas pada bab-bab selanjutnya.

2.3 Ukuran Pemusatan dan Penyebaran DataPada subbagian ini kita akan membicarakan bagaimana meringkas data numerik. Kitamengenal ukuran kecenderungan pusat (measures of central tendency), ukuran penyebaran(measures of spread), dan ukuran bentuk (measures of shape).

Ukuran Kecenderungan Pusat

Ukuran kecenderungan pusat memberikan gambaran tentang pusat dari penyebaran data.Ukuran ini berupa rata-rata, median, dan modus.

Rata-rata. Rata-rata, disebut juga rata-rata aritmetika, didefinisikan sebagai

x̄ =x1 + x2 +⋯ + xn

n= 1n

n∑

i=1xi, (2.1)

dengan∑

(dibaca sigma) berarti menjumlahkan, x menyatakan amatan individual, dan nbanyak amatan. Rata-rata digunakan untuk pada saat bilangan dapat dijumlahkan yaknikarakteristik diukur pada skala numerik, bukan pada skala ordinal. Hanya terdapat saturata-rata untuk setiap kumpulan data.

Sebagai contoh berikut ini adalah data berat badan 30 orang Eropa. Berdasarkan databerat badan ini dapat kita hitung rata-rata berat badan sebagai berikut:

x̄ = 20 + 30 +⋯ + 4830

= 174230

= 58,06667 ≈ 58,07. (2.2)

Hal yang perlu dicatat adalah bahwa rata-rata bersifat sensitif terhadap nilai ekstrem,terutama jika ukuran amatan cukup kecil. Misalkan berat badan 5 orang (dalam kg) adalahsebagai berikut: 50, 65, 60, 70, 40. Nilai rata-rata berat badan kelima orang ini adalah 57.

Page 14: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 8

Tabel 2.1: Berat badan 30 orang Eropa dalam kg

20 30 35 40 45 50 65 60 70 8090 85 75 25 33 36 50 80 65 1095 75 65 55 75 80 77 78 50 48

Namun, jika salah satu orang nilainya 100, data menjadi 50, 65, 60, 70, 100, rata-rataberubah menjadi 69. Pada kasus yang lebih ekstrem salah satu berat badan adalah 10,sehingga data menjadi 10, 65, 60, 70, 40, rata-rata berubah menjadi 49. Contoh-contohtersebut menunjukkan bahwa rata-rata bersifat sensitif terhadap nilai ekstrem.

Salah satu cara untuk mengatasi sensitifas rata-rata terhadap nilai ekstrem adalah de-ngan rata-rata terpangkas (trimmed mean). Rata-rata terpangkas ini dihitung dengan ter-lebih dahulu mengurutkan data dari nilai terkecil ke terbesar, kemudian menghapus ni-lai terpilih pada masing-masing ujung data terurut, dan kemudiang merata-ratakan nilaisisanya. Persentase pemangkasan dihitung sebagai berikut (lihat (Peck et al., 2008)):

persentase pemangkasan =banyaknya data yang dihapus pada setiap sisi

n× 100. (2.3)

Sebagai contoh untuk terdapat data 0, 50, 65, 60, 70, 100. Apabila dua amatan ekstrem,0 dan 100, dihilangkan kita akan memperoleh persentase rata-rata terpangkas

26× 100 = 33,33%.

Sehingga kita peroleh rata-rata terpangkas 33,33% sebagai berikut:

rata-rata terpangkas 33,33% = 50 + 65 + 60 + 704

= 61,25.

Median. Median merupakan amatan di tengah, yakni separuh amatan lebih kecil (dibawah) dan separuh lagi lebih besar (di atas). Median dihitung sebagai berikut.

1. Urutkan amatan dari kecil ke besar (atau sebaliknya).

2. Hitung nilai tengah amatan. Median merupakan nilai tengah untuk jumlah amatanganjil; sebaliknya, jika nilai amatan genap didefinisikan sebagai rata-rata dari duanilai tengah untuk amatan genap.

Sebagai contoh, untuk data berat badan 30 orang di atas diperoleh median 62,5 yang diper-oleh dari rata-rata dua nilai tengah yakni amatan ke-15 dan ke-16, yakni

median = 60 + 652

= 62,5. (2.4)

Ada beberapa hal yang perlu dicatat untuk median. Pertama, median bersifat kurangsensitif terhadap nilai ekstrem jika dibandingkan dengan nilai rata-rata. Dengan kata lain,median dapat digunakan untuk data yang amatannya menyebar pencong atau condong. Li-hat kembali contoh nilai berat badan di atas. Pada kasus pertama data berat badan adalah50, 65, 60, 70, 40. Median berat badan pada kasus pertama adalah 60. Kemudian, pada

Page 15: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 9

Tabel 2.2: Perbandingan rata-rata dan median berat badan lima orang

Data Rata-rata Median

50, 65, 60, 70, 40 57 6050, 65, 60, 70, 100 69 650, 65, 60, 70, 40 47 60

kasus kedua diperoleh data 50, 65, 60, 70, 100 dengan median 65. Terakhir, pada kasusketiga kita peroleh data 0, 65, 60, 70, 40 dengan median 60. Contoh-contoh ini menun-jukkan bahwa median tidak sensitif terhadap nilai ekstrem. Dengan kata lain, mediantidak terpengaruh oleh nilai yang sangat besar atau sangat kecil. Lihat Tabel 2.3 untukmelihat perbandingan antara rata-rata dan median untuk contoh berat badan. Sifat pentingkedua adalah, median hanya dapat digunakan untuk data kuantitatif dan hanya terdapatsatu median untuk setiap kumpulan data (lihat Ott and Longnecker (2001)).

Modus. Modusmerupakan nilai amatan yang paling seringmuncul. Apabila amatanmemiliki dua modus, kumpulan data tersebut disebut bimodal. Lihat kembali contoh beratbadan 30 orang. Berdasarkan data ini diperoleh nilai yang paling sering muncul adalah50.

Modus dapat digunakan untuk data kuantitatif dan kualitatif. Salah satu kelebihanmodus adalah bahwa modus tidak dipengaruhi oleh data ekstrem. Untuk tabel frekuensiatau data dengan jumlah amatan kecil, modus dihitung dari kelas modal (modal class),yaitu selang yang memiliki jumlah amatan terbesar.

Menggunakan Ukuran Kencenderungan Pusat. Suatu amatan yang berada jauhdari pusat (outlying values) bernilai kecil, sebaran amatan dikatakan pencong ke kiri ataupencong negatif; jika amatan yang berada jauh dari pustat bernilai besar, sebaran amatandikatakan pencong ke kanan atau pencong positif. Jika sebaran data memiliki bentuk yangsama pada kedua sisi nilai tengah, sebaran dikatakan simetrik.

Untuk menentukan bentuk sebaran data dapat digunakan panduan berikut.

1. Jika rata-rata dan median sama, sebaran amatan adalah simetrik.

MoMdRaTM

Gambar 2.1: Sebaran simetrik.

2. Jika rata-rata lebih besar daripada median, sebaran data akan pencong ke kanan.

3. Jika rata-rata lebih kecil daripada median, sebaran data akan pencong ke kiri.

Page 16: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 10

MoMd RaTM

Gambar 2.2: Sebaran pencong ke kanan.

MoMdTM

Ra

Gambar 2.3: Sebaran pencong ke kiri.

Ukuran Penyebaran

Pada subbagian sebelumnya kita telahmembahas bagaimana ukuran kencederungan pusat.Namun, kita juga tertarik bagaimana penyebaran atau variasi dari amatan kita. Bebe-rapa statistik yang dapat digunakan untuk mengetahui penyebaran atau variasi dari amatantersebut antara lain: rentang, simpangan baku, koefisien variasi, peringkat persentil, danrentang antarkuartil.

Rentang. Rentang merupakan selisih antara amatan terbesar dan terkecil. Rentangdigunakan apabila penekanannya adalah nilai ekstrem. Untuk data berat badan 30 orang,diperoleh rentang = 95 − 10 = 85. Sebagai catatan, meskipun rentang memberikan idetentang penyebaran data, namun nilainya dipengaruhi oleh pencilan (data dengan nilaiyang sangat besar atau sangat kecil).

Simpangan Baku. Simpangan baku merupakan ukuran penyebaran data di seki-tar rata-rata. Logika di belakang statistik ini adalah kita memerlukan ukuran ”rata-rata”penyebaran data di sekitar rata-rata. Dengan kata lain, simpangan baku hanya cocok di-gunakan apabila data bersifat simetrik (lihat Veaux et al. (2008)). Secara matematis sim-pangan baku didefinisikan sebagai akar positif dari varians. Varians sendiri didefinisikansebagai

var(x) = 1n − 1

n∑

i=1(xi − x̄)2. (2.5)

Page 17: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 11

Mengakarkan (2.5) diperoleh simpangan baku, dinotasikan sd, sebagai

sd(x) =

1n − 1

n∑

i=1(xi − x̄)2. (2.6)

Simpangan baku digunakan apabila rata-rata digunakan. Artinya, digunakan dengan datanumerik simetrik. Sebagai contoh, lihat kembali data berat badan 30 orang di atas. Variansnilai ulangan ini dapat dihitung sebagai berikut

var(x) = 129((20 − 58,07)2 + (30 − 58,07)2) +⋯ + (48 − 58,07)2)

= 501,7195. (2.7)

Selanjutnya mengakarkan persamaan (2.7) diperoleh simpangan baku

sd(x) =√

501,7195 = 22,3991 ≈ 22,4.

Aturan-aturan berikut dapat digunakan untuk membantu kita dalam menggunakansimpangan baku:

1. Bagaimanapun amatan menyebar setidaknya 75% berada pada x̄ ± 2 × sd(x).

2. Apabila data berbentuk seperti lonceng (bell-shaped)

a) 67% amatan terletak di antara x̄ ± sd(x),b) 95% amatan terletak di antara x̄ ± 2 × sd(x),c) 99,7% amatan terletak di antara x̄ ± 3 × sd(x).

Kalau kita lihat kembali data berat badan 30 orang di atas dihitung bahwa setidaknya 75%berat orang berada pada 58,07 ± 2 × 22,4 = 58,07 ± 44,8.

Sebagai catatan, apabila semua amatan memiliki nilai yang sama, maka simpanganbaku sampel akan bernilai nol. Hal ini berarti tidak ada variabilitas di dalam data.

KoefisienVariasi. Koefisien variasi CVmerupakan ukuran penyebaran relatif dalamdata. Koefisien ini didefinisikan sebagai simpangan baku dibagi rata-rata dikalikan 100%.Hal ini menghasilkan ukuran variasi relatif, yakni variasi yang relatif terhadap ukuranrata-rata. Formula koefisien variasi adalah

CV(x) = sd(x)x̄

100%. (2.8)

Koefisien variasi dapat digunakan untuk membandingkan sebaran data yang diukurpada skala yang berbeda. Secara matematis koefisien variasi tidak memiliki unit karenasimpangan baku dan rata-rata memiliki unit yang sama sehingga saling meniadakan. Se-bagai contoh berikut ini adalah berat badan 30 orang Asia.

Untuk data berat badan 30 orang Asia ini diperoleh rata-rata 51,03333 dan simpanganbaku 21,61494. Dengan demikian, koefisien variasinya adalah

CV(berat orang Asia) = 21,6149451,03333

× 100% = 42,35456%.

Page 18: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 12

Tabel 2.3: Berat badan 30 orang Asia

40 50 40 40 45 50 65 60 70 8020 85 75 25 33 25 50 80 65 3010 75 25 30 75 55 77 78 30 48

Apabila dibandingkan dengan koefisien variasi berat badan 30 orang yakni

CV(berat orang Eropa) = 22,399158,06667

× 100% = 38,57479%.

Berdasarkan nilai koefisien variasi di atas dapat dilihat bahwa CV berat Asia lebihbesar dibandingkan CV berat orang Eropa. Dengan demikian, berat orang Aisa memilikivariabilitas yang lebih banyak dibandingkan berat badan 30 orang Eropa.

Persentil dan Kuartil. Persentil merupakan persentasi sebaran data yang sama ataulebih kecil dari suatu nilai tertentu. Lebih jelasnya, persentil ke-p adalah suatu amatanyang diurut sedemikian hingga p% dari amatan di bawah dan paling banyak (100 − p)%di atasnya. Sebagai contoh persentil ke-75 berat badan adalah 80. Hal ini berarti bahwa75% berat badan adalah 80 atau kurang, dan hanya 25% yang beratnya di atas 80.

Menghitung persentil dan kuartil pada prinsipnya sama. Berikut akan dijelaskan bagaimanamenghitung kuartil (disebut juga kuantil). Langkah pertama adalahmengurutkan data dariyang paling kecil ke yang paling besar. Misalkan kitamemiliki n amatan yaitu x1, x2,… , xn.Misalkan kita menyusun kembali data dengan cara mengurutkan dari kecil ke besar. Mis-alkan

x(1) ≤ x(2) ≤⋯ ≤ x(n) (2.9)

menyatakan data yang telah diurutkan ini. Misalkan q1 adalah kuartil pertama atau kuar-til bawah dan q3 adalah kuartil ketiga atau atas. Misalkan lk adalah lokasi kuartil yangdidefinisikan oleh (Vining and Kowalski, 2006, hal. 60)

lk =

n + 34

, jika n ganjil,n + 24

, jika n genap.(2.10)

Catatan: ada beberapa versi untuk lokasi kuartil ini dan setiap penulis mendefinisikannyadengan cara berbeda. Contoh-contoh berikut akan menggunakan definisi dari Vining andKowalski (2006).

Jika lk bulat, maka kita dapat menghitung kuartil pertama dengan menghitung lk nilaiposisi awal pada data yang telah diurutkan; untuk kuartil ketiga kita hitung lk nilai posisiakhir pada data yang telah diurutkan dengan kata lain

q1 = x(lk), (2.11)q3 = x(n+1−lk). (2.12)

Page 19: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 13

Jika lk bukan bilangan bulat, maka kuartil hampiran adalah rata-rata dari dua nilai yaitu

q1 =x(lk−0,5) + x(lk+0,5)

2, (2.13)

q3 =x(n+1−lk−0,5) + x(n+1−lk+0,5)

2. (2.14)

Sebagai contoh berikut ini adalah panjang cangkang (dalam cm) dari suatu sampelpenyu hijau betina dewasaChelonia mydas[Sumber data: (Glover andMitchell, 2002, hlm.24)].

110 105 117 113 95 115 98 97 93 120.

Berikut ini adalah data penyu (dalam cm) setelah diurutkan:

93 95 97 98 105 110 113 115 117 120.

Dari data diatas kita peroleh n = 10, sehingga lk = (10 + 2)∕4 = 3 (bilangan bulat).Dengan demikian kuartil q1 dan q3 dapat dihitung sebagai berikut:

q1 = x(3) = 97, (2.15)q3 = x(10+1−3) = x(8) = 115. (2.16)

Rentang Antarkuartil. Ukuran variasi yang menggunakan persentil adalah rentangantar kuartil yang didefinisikan sebagai selisih dari persentil ke-75 (disebut juga kuartilketiga) dan ke-25 (disebut juga kuartil kepertama). Rentang antarkuartil ini digunakanuntuk mendeskripsikan 50% amatan tengah, terlepas dari apapun bentuk sebaran data.Secara matematis rentang antar kuartil IQR didefinisikan sebagai

IQR = Q3 −Q1

dengan Q3 adalah kuartil ketiga (atau persentil ke-75) dan Q1 adalah kuartil kepertama(atau persentil ke-25). Sebagai contoh kuantil ke-75 berat 30 orang di atas adalah 76,50dan kuantil ke-25 ulangan adalah 41,25. Hal ini berarti 50% berat orang berada antara41,25 dan 76,50. Dengan kata lain, nilai tengah 50% berat orang menyebar pada rentang35,25 nilai.

Untuk contoh penyu Chelonia mydas di atas kita peroleh

IQR = 115 − 97 = 18.

Secara garis besar persentil dan rentang antar kuartil digunakan berdasarkan kondisiberikut. Pertama, pada saat median digunakan (data numerik pencong atau data ordinal).Kemudian apabila rata-rata digunakan, tetapi tujuannya adalah membandingkan amatanindividual.

Hal yang perlu diperhatikan adalah apabila data terpusat pada median, rentang an-tarkuantil dapat memberikan informasi yang keliru. Misalkan berat badan 10 orang adalah20, 50, 50, 50, 50, 50, 50, 50, 50, dan 80. Kuartil ketiga dan kuartil kepertama berturut-turut adalah 50. Dengan demikian rentang antarkuartil IQR = 0. Nilai 0 ini seharusnyamenunjukkan bahwa amatan terdiri dari nilai yang identik, yang tentu saja tidak demikiandengan kesepuluh nilai berat orang tersebut.

Page 20: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 14

Ukuran Bentuk

Pada subbagian-subbagian sebelumnya kita telahmembahas ukuran pemusatan dan penye-baran. Pada subbagian ini kita akan membahas ukuran bentuk, yaitu kepencongan (skew-ness) dan kurtosis. Kurtosis didefinisikan sebagai

k2 =n∑n

i=1(xi − x̄)4

[

∑ni=1(xi − x̄)2

]2(2.17)

dan berguna dalam menghitung derajat puncak penyebaran data. Data yang memiliki koe-fisien kurtosis lebih dari 3 disebut leptokurtik. Sedangkan distribusi yang memiliki kurto-sis lebih kecil daripada 3 disebut platikurtik. Untuk data berat badan 30 orang di atas dataini termasuk platikurtik karena memiliki nilai kurtosis −0,808 < 3.

Selanjutnya skewnessmenyatakan derajat ketidaksimetrisan penyebaran data didefini-sikan sebagai

k1 =n1∕2

∑ni=1(xi − x̄)

3

[

∑ni=1(xi − x̄)2

]3∕2. (2.18)

Apabila nilai skewness negatif (lebih kecil daripada 0), koefisien ini dikatakan pencongnegatif (negatively skewed). Demikian pula sebaliknya, apabila nilainya positif disebutpencong positif (positively skewed). Untuk berat badan di atas kita lihat bahwa data terse-but pencong negatif karena kepencongannya −0,354675076 < 0.

2.4 LatihanSebagai latihan untuk lebihmemantapkan pemahamanAnda tentang ukuran-ukuran statis-tik data maka untuk setiap data yang diberikan pada soal-soal berikut hitunglah: rata-rata, median, modus, rentang, varians, simpangan baku, koefisien variasi, kuartil pertama,kuartil ketiga, rentang antarkuartil, kurtosis, dan kepencongan. Kemudian berikan penje-lasan tentang makna dari angka-angka yang Anda peroleh di atas.

1. Jika x1 = 4, x2 = 8, x3 = 9, x4 = 5, dan x5 = 10 hitunglah:

a)∑5

i=1 xib)

∑5i=1(xi − x̄)

2

c)∑5

i=1 x2i

d) (∑5

i=1 xi)2

e)∑4

i=1 6

f)∑4

i=2 3xi

2. Suatu studi dilakukan untuk menentukan apakah aliran urin dari domba (dalammilimeter/menit) saat disuntikan hormon antidiuretic. Aliran urin kesepuluh dombaadalah sebagai berikut. [Sumber data: Ott and Longnecker (2001, hlm. 112)].

0,7 0,5 0,5 0,6 0,5 0,4 0,3 0,9 1,2 0,9.

Page 21: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 15

3. Regulasi dari dewan kesehatan dari suatu negara tertentu menyatakan bahwa tingkatfluorida tidak boleh melebihi 1,5 parts per million (ppm). Kedua puluh lima pen-gukuran tingkat fluorida berikut adalah tingkat fluorida dari suatu sampel selama 25hari. Meskipun tingkat fluorida diukur lebih dari sekali, data berikut menunjukkanpembacaan pada waktu subuh selama 25 hari. [Sumber data: Ott and Longnecker(2001, hlm. 64)].

0,75 0,86 0,84 0,85 0,970,94 0,89 0,84 0,83 0,890,88 0,78 0,77 0,76 0,820,72 0,92 1,85 0,94 0,830,81 0,85 0,97 0,93 0,79

4. Waktu sintasan (dalam bulan) untuk dua perlakuan pada pasien dengan kegagalanventrikel kiri kronis berat (severe chronic left-ventricular heart failure) diberikanpada tabel berikut. [Sumber data: Ott and Longnecker (2001, hlm. 66)].

Terapi Standar

4 15 24 10 1 27 3114 2 16 32 7 13 3629 6 12 18 14 15 186 13 21 20 8 3 24

Terapi Baru

5 20 29 15 7 32 3617 15 19 35 10 16 3927 14 10 16 12 13 169 18 33 30 29 31 27

Page 22: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3Deskripsi Data

Pada bab sebelumnya kita telah mempelajari ukuran-ukuran statistik untuk data. Bab inikita akan mempelajari bagaimana mendeskripsikan data. Materi ini meliputi bagaimanamembuat grafik, plot batang daun, diagram lingkaran, box plot, dan lain-lain.

3.1 Menampilkan Data KuantitatifMenampilkan data numerik dapat dilakukan dengan beberapa cara seperti plot batang-daun (stem-and-leaf plot), tabel frekuensi, histogram, box plot, dan poligon frekuensi.

3.1.1 Plot Batang-daunPlot batang-daun (stem-and-leaf plot) menampilkan data secara langsung sebagai langkahawal membuat tabel distribusi frekuensi. Untuk membuat plot batang-daun, gambar garisvertikal dan tempatkan masing-masing digit pertama untuk setiap kelas (disebut batang)pada sisi kiri garis vertikal. Bilangan di sebelah kanan garis vertikal menyatakan digitkedua dari masing-masing amatan; bilangan-bilangan ini disebut daun.

Berikut ini adalah panduan dalam membuat plot batang-daun (Ott and Longnecker,2001, hlm. 56):

1. Pisahkan masing-masing skor atau nilai menjadi dua kelompok angka. Kumpulanatau kelompok angka pertama disebut batang (stem) dan angka kedua disebut daun(leaf ).

2. Daftar semua batang dari yang terkecil sampai terbesar.

3. Untuk setiap masing-masing skor atau nilai dalam data, tulis nilai daun pada barisberlabel nomor batang yang bersesuaian.

4. Jika tampilan terlihat terlalu sempit, perlebar tampilan dengan menggunakan duabaris pada setiap batang, misalnya angka daun 0,1,2,3, dan 4 ditempatkan pada barispertama pada batang dan angka daun 5, 6, 7, 8, dan 9 ditempatkan pada baris kedua.

5. Jika terlalu banyak angka muncul, misalnya enam atau tujuh angka skor, buang digitpaling kanan untuk memaksimalkan tampilan.

16

Page 23: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 17

Tabel 3.1: Berat badan 30 orang Asia

20 30 35 40 45 50 65 60 70 8090 85 75 25 33 36 50 80 65 1095 75 65 55 75 80 77 78 50 48

Sebagai contoh berikut ini adalah data berat badan (dalam kg) 30 orang Asia. Plotbatang-daun (stem-and-leaf plot) data berat badan 30 orang Asia di atas adalah sebagaiberikut.

The decimal point is 1 digit(s) to the right of the |

1 | 02 | 053 | 03564 | 0585 | 00056 | 05557 | 0555788 | 00059 | 05

Angka di sebelah kiri | menyatakan puluhan dan data di sebelah kanan | menyatakansatuan. Berdasarkan plot batang-daun di atas dapat dilihat bahwa data yang paling seringmuncul adalah 7 (puluhan).

3.1.2 Tabel FrekuensiPada tabel frekuensi, amatan dibagimenjadi beberapa kelas seperti halnya pada plot batang-daun. Langkah-langkah menyusun tabel frekuensi adalah sebagai berikut (Ott and Long-necker, 2001).

1. Bagi rentang (selisih amatan terbesar dan terkecil) dari pengukuran dengan banyaknyakelas interval yang diinginkan. Biasanya kita menginginkan 5–20 kelas interval.

2. Setelah membagi rentang dengan banyaknya subinterval yang diinginkan, bulatkanangka yang diperoleh ke unit yang mudah dikerjakan. Unit ini menyatakan lebarumum kelas interval.

3. Pilih kelas interval pertama sedemikian hingga berisi pengukuran terkecil. Sangatdisarankan untuk memilih nilai awal untuk kelas pertama sedemikian hingga tidakada pengukuran yang jatuh pada di antara subinterval, sehingga menghilangkan ker-aguan dalam menempatkan pengukuran ke dalam interval kelas.

Sebagai contoh kita akan membuat tabel frekuensi untuk berat badan 30 orang Asiadengan mengikuti langkah-langkah di atas.

1. Nilai amatan terbesar adalah 95 dan terkecil adalah 10.

Page 24: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 18

2. Rentang data ini adalah 95 − 10 = 85.

3. Misalkan kitamenginginkan 5 interval kelas. Sehingga diperoleh lebar kelas 85∕5 =17.

Dengan demikian diperoleh tabel frekuensi sebagai berikut:

Interval kelas Frekuensi

10 – 27 328 – 45 646 – 63 664 – 81 1282 – 99 3Total 30

Catatan: Menurut Vardeman and Jobe (2001) pemilihan interval dalam pembuatan tabelfrekuensi adalah masalah pilihan. Anda tidak mesti memiliki jumlah interval yang samadengan teman. Namun, perlu diperhatikan bahwa interval dengan panjang yang samahendaknya dipilih.

Selain tabel frekuensi diatas, kita juga bisa menghitung frekuensi relatif dan kumulatif.Frekuensi relatif diperoleh dengan membagi frekuensi kelas dengan total amatan.

Interval kelas Frekuensi Frekuensi relatif Frekuensi kumulatif

10 – 27 3 0,10 0,1028 – 45 6 0,20 0,3046 – 63 6 0,20 0,5064 – 81 12 0,40 0,9082 – 99 3 0,10 1,00Total 30 1,00

3.1.3 HistogramHistogram menyajikan informasi dari amatan yang akan diteliti pada sumbu X dan jum-lah atau persentase amatan pada sumbu Y . Panduan membuat histogram adalah sebagaiberikut (Vardeman and Jobe (2001)):

1. gunakan interval dengan panjang yang sama,

2. perlihatkan semua sumbu vertikal mulai dari nol,

3. hindari memecah/memutus sumbu,

4. tempatkan batang dengan tinggi yang sesuai pada titik tengah interval.

Page 25: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 19

Histogram berat badan

sbb

Fre

quen

cy

20 40 60 80 100

02

46

810

12

Gambar 3.1: Histogram berat badan 30 orang Asia menggunakan perangkat lunak R.

Sebagai contoh Gambar 3.1 memperlihatkan histogram berat badan 30 orang Asia. Setiapruang kosong pada histogrammenunjukkan celah sebenarnya pada data. Dengan kata lain,hal ini mengindikasikan daerah yang tidak memiliki nilai.

Histogram memberikan informasi tentang bentuk sebaran data, pusat sebaran data,dan penyebaran data. Berkaitan dengan sebaran data, histogram memberikan informasiapakah data memiliki nilai yang paling sering muncul yang disebut modus. Modus ini da-pat berupa hanya satu nilai (unimodal), dua (bimodal), atau lebih (multimodal). Selain ituhistogram juga memberikan informasi apakah sebaran data simetrik atau pencong (skew).Selanjutnya, informasi penting lain yang bisa diperoleh dari modus adalah pencilan yaitudata yang terletak jauh dari sebaran data. Dengan kata lain data yang bernilai ekstrem.

Dalam hal pusat sebaran data, histogram memberikan informasi tentang rata-rata danmedian. Apabila data simetrik dan bermodus tunggal, kita akan melihat pusat dari penye-baran data. Pusat dari penyebaran ini adalah nilai tengah (mean) yang disebut juga rata-rata. Namun, pada data yang pencong, atau terdapat pencilan median lebih tepat digu-nakan. Hal terakhir yang bisa disampaikan melalui histogram adalah penyebaran data.Penyebaran data ini berupa informasi tentang rentang dan rentang antarkuartil. Gam-bar 3.2 memperlihatkan beberapa bentuk histogram untuk beragam tipe sebaran data.

Pencong ke kiriPencong ke kananSimetrik

Seragam Bimodal Terpotong

Gambar 3.2: Bentuk histogram untuk beberapa tipe sebaran data. [Sumber: (Vardemanand Jobe, 2001, hlm. 73)]

Page 26: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 20

3.1.4 Box PlotPlot kotak (box plot), disebut juga box-and-whisker plot, merupakan suatu cara untukmenampilkan informasi dengan tujuan menggambarkan lokasi tertentu dalam penyebarandata.

Plot kotak untuk data berat badan 30 orang Asia di atas dapat dilihat pada gambarberikut. Pada Gambar 3.3, median data ditunjukkan oleh garis di tengah-tengah kotak.

2040

6080

Gambar 3.3: Diagram kotak berat badan 30 orang Asia.

Kemudian garis di atas dan di bawah median masing-masing adalah kuartil ketiga dankuartil kepertama.

3.1.5 Poligon FrekuensiPoligon frekuensi adalah grafik garis yang serupa dengan histogram dan berguna dalammembandingkan dua sebaran dalam grafik yang sama. Gambar 3.4 memperlihatkanpoligon frekuensi data berat badan 30 orang Asia.

3.2 Menampilkan Data KualitatifData kualitatif atau kategorik dapat ditampilkan dengan beberapa cara yaitu tabel frekuensi,bagan batang (bar chart), dan bagan lingkaran (pie chart). Sebagai contoh berikut adalahdata jumlah tiga jenis obat antidepressan A, B, dan C.

Antidepressan Jumlah

A 60B 50C 55

3.2.1 Tabel FrekuensiData contoh data jumlah tiga jenis obat antidepressan di atas sudah berupa tabel frekuensiyang mencatat jumlah total tiga jenis obat dan kategorinya. Namun, sering kali kita jugatertarik dengan proporsi masing-masing jumlah antidepressan. Masing-masing jumlah

Page 27: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 21

Histogram of berat.badan

berat.badan

Fre

quen

cy

20 40 60 80

02

46

8

Gambar 3.4: Poligon frekuensi untuk data berat badan 30 orang Asia.

jenis obat antidepressan akan dibagi dengan jumlah total obat antidepressan dan dikalikandengan 100 untuk dinyatakan persentase. Dengan demikian, kita akan memperoleh tabelfrekuensi relatif.

Antidepressan Jumlah (%)

A 36,37B 30,30C 33,33

3.2.2 Bagan LingkaranBagan lingkaran (pie charts) memperlihatkan keseluruhan proporsi atau jumlah dalambentuk lingkaran (pie). Sebagai contoh untuk data obat antidepressan di atas kita perolehbagan lingkaran sebagai berikut.

3.2.3 Bagan BatangBagan batang (bar charts) menampilkan sebaran dari data kategorik dengan menunjukkanjumlah masing-masing kategori bersebelahan dengan kategori lain. Bagan ini biasanyaberisi sedikit ruang kosong yang menandakan bahwa batang ini adalah batang yang berdiribebas, artinya dapat disusun sesuai dengan urutan yang diinginkan. Untuk data obat an-tidepressan di atas kita akan mendapatkan diagram batang sebagai berikut.

Page 28: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 22

A

B

C

Diagram Lingkaran Obat Antidepressan

Gambar 3.5: Bagan lingkaran jumlah obat antidepressan .

A B C

Bagan Batang Obat Antidepressan

010

2030

4050

60

Gambar 3.6: Bagan obat antidepressan.

Tentu saja kita juga bisa membuat bagan batang jumlah siswa SMP untuk frekuensirelatif.

A B C

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

Gambar 3.7: Bagan obat antidepressan frekuensi relatif.

Page 29: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 3. DESKRIPSI DATA 23

3.3 Latihan1. Untuk semua data pada latihan Bab 2, buatlah plot batang dan daun, tabel distribusi

frekuensi (relatif dan kumulatif), histogram, dan box plot.

2. Berikut ini adalah waktu perlakuan (dalam menit) pasien dalam suatu klinik kese-hatan. Buatlah plot batang dan daun, tabel distribusi frekuensi (relatif dan kumu-

21 20 31 24 15 21 24 18 33 826 17 27 29 24 14 29 41 15 1113 28 22 16 12 15 11 16 18 1729 16 24 21 19 7 16 12 45 2421 12 10 13 20 35 32 22 12 10

latif), histogram, dan box plot.

Page 30: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4Peluang

Anda tentu pernah mendengar orang berkata ”Peluang untuk hujan besok adalah 50%”atau ”Peluang kandidat A memenangkan pemilu adalah 80%”. Namun, tidaklah mudahbagi kita untuk memberikan definisi pasti apa itu ”peluang”. Pada bab ini kita akan mem-bicarakan peluang yang memegang peranan penting dalam mempelajari statistika.

Beberapa konsep yang akan kita bahas pada Bab ini antara lain: percobaan, ruangsampel, kejadian, peluang, permutasi dan kombinasi, prinsip perkalian, askioma dan atu-ran peluang, peluang bersyarat, kaidah perkalian, dan teorema Bayes. Bab ini diadaptasidari Glover and Mitchell (2002).

4.1 Definisi PeluangPeluang dari suatu kejadian (event) adalah ukuran numerik dari kemungkinan atau dera-jat prediksi (predictability) dari bahwa suatu kejadian akan terjadi (Glover and Mitchell,2002).Eksperimen adalah suatu hasil dari aktivitas dengan hasil yang teramati. Sebagaicontoh adalah eksperimen melemparkan sebuah mata uang dan mengamati apakah yangmuncul muka atau belakang. Contoh lain adalah eksperimen mengambil satu kartu darisetumpukan kartu remi.

Dalam membicarakan eksperimen akan lebih mudah apabila kita menggunakan kon-sep himpunan (set). Himpunan semua hasil yang mungkin dari suatu eksperimen disebutruang sampel (sample space). Sebagai contoh misalkan S1 dan S2 adalah ruang sampeldari percobaan melemparkan mata uang dan mengambil satu kartu dari setumpukan karturemi, yaitu

S1 = {muka, belakang} (4.1)dan

S2 = {A♠, 2♠,… ,K♠,A♡, 2♡,… ,K♡,A♣, 2♣,… ,K♣,A♢, 2♢,… ,K♢}. (4.2)

Suatu kejadian A adalah himpunan bagian dari ruang sampel. Kita katakan bahwasuatu kejadian terjadi apabila hasil dari suatu percobaan adalah anggota dari A. Sebagaicontoh kejadian kartu remi berwarna putih adalah himpunan

A = {A♡, 2♡,… ,K♡,A♢, 2♢,… ,K♢}. (4.3)

Kejadian dengan hanya terdiri dari satu elemen disebut kejadian sederhana (simpleevent). Sebagai contoh ruang sampel untuk eksperimen pertama yang terdiri dari satukejadian sederhana yaitu {muka} dan {belakang}.

24

Page 31: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 25

Pada subbab ini kita akan membahas tiga definisi peluang: definisi klasik atau a priori,definisi frekuensi relatif atau empiris, dan definisi aksiomatik (matematika).

4.1.1 Definisi klasikPendekatan klasik terhadap peluang diberikan oleh aksioma berikut (Glover and Mitchell,2002, hlm. 31). Misalkan S adalah ruang sampel dan A adalah kejadian. Berikut adalahtiga aksioma (kebenaran umum yang disajikan tanpa pembuktian dan secara intuitif jelas):

1. Untuk setiap kejadian A, peluang sebarang kejadian adalah bilangan real antara 0dan 1, inklusif, artinya 0 ≤ P (A) ≤ 1.

2. Peluang P (S) = 1 dan P (∅) = 0.

3. JikaA1,A2,. . . ,Am adalah kejadian saling hindar (mutually exclusive), yaitu kejadiandengan himpunan bagian yang saling lepas (disjoint subsets), maka

P (A1 ∪ A2 ∪⋯ ∪ Am) =m∑

i=1P (Ai) = P (A1) + P (A2) +⋯ + P (Am). (4.4)

Metode ini mudah digunakan apabila ruang sampel S dari suatu eksperimen dapatdipartisi menjadi sejumlah n berhingga kejadian sederhana saling hindar {s1, s2,… , sn}yang memiliki kesempatan muncul yang sama (equally likely atau equiprobable). Dengankata lain,

1 = P (S) = P (s1 ∪ s2 ∪… ∪ sn) =n∑

i=1P (si) (4.5)

dan berdasarkan asumsi P (s1) = P (s2) = ⋯ = P (sn), maka masing-masing P (si) =1∕n. Apa artinya? Dengan menggunakan asumsi kemungkinan atau kesempatan munculyang sama (equiprobable), maka peluang klasik dari suatu kejadian A adalah banyaknyakejadian sederhana A kemudian dikalikan 1∕n. Jadi, hitung banyaknya elemen dari A danbagi dengan total jumlah elemen dalam ruang sampel.

Definisi klasik dapat dinyatakan sebagai berikut: diberikan himpunan hasil yangmungkin,peluang P dari kejadian A, ditulis P (A), adalah banyaknya elemen A dibagi dengan jum-lah elemen dari ruang sampel S. Lebih jelasnya

Definisi 4.1.1 ((Glover and Mitchell, 2002)). Peluang klasik kejadian A di bawah asumsikemungkinan yang sama (equiprobable) kejadian-kejadian sederhana adalah

P (A) =n(A)n(S)

=banyaknya elemen di dalam Abanyaknya elemen di dalam S

. (4.6)

Sebagai contoh misalkan kita mengambil sebuah kartu dari kartu remi (jumlahnya 52).Berapakah peluang munculnya kartu as? Kita tahu bahwa kartu as berjumlah 4. Jika Aadalah kejadian terambilnya kartu as, peluang kejadian A adalah

P (A) = 452= 113. (4.7)

Contoh lain misalkan kita melemparkan dua buah dadu. Berapakah peluang mendap-atkan dua mata dadu 5? Kita tahu bahwa banyak hasil yang mungkin dari melempar dua

Page 32: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 26

mata dadu adalah 6×6 = 36. Banyaknya kemungkinan dua mata dadu 5,yaitu mata dadu 5pada lemparan pertama dan mata dadu 5 pada lemparan kedua adalah 1. ApabilaA adalahkejadian mendapatkan dua mata dadu 5 maka

P (A) = 136. (4.8)

Definisi klasik ini tepat dan tampak masuk akal. Namun, terdapat kesalahan logika(logical flaw) karena definisi tersebut mengadung kata memiliki kemungkinan yang sama(equally likely) untuk terpilih atau memiliki peluang yang sama (equally probable). De-ngan kata lain, peluang didefinisikan dengan peluang. Terlepas dari kesulitan ini, intuisikita mengatakan bahwa ketika sebuah dadu dilemparkan atau sebuah kartu remi dikocokmaka terdapat ”justifikasi fisik” bahwa semuanya memiliki kemungkinan yang sama un-tuk terpilih. Namun, apabila tidak terdapat justifikasi fisik, maka definisi klasik tidak akanmembantu. Lihat pembahasan masalah kelemahan ini pada Elston and Johnson (1994).

4.1.2 Definisi frekuensiMisalkan kita dapat melakukan perulangan (replication) dari suatu percobaan yang sama.Sebagaimana percobaan mendekati tak berhingga, proporsi kejadian A menuju limit ter-tentu. Peluang A didefinisikan sebagai limit proporsi ini.

Sebagai contoh mari kita lihat kembali pengambilan kartu remi di atas. Misalkankita melakukan banyak percobaan (replikasi). Pada setiap percobaan, proporsi munculnyakartu as dicatat. Sebagaimana percobaan ini menuju tak berhingga, proporsi ini menujulimit 1∕13.

Secara formal peluang ini didefinisikan sebagai berikut.

Definisi 4.1.2 ((Glover and Mitchell, 2002)). Peluang empiris atau frekuensi relatif keja-dian A didefinisikan oleh

P (A) =nAn=

banyaknya A munculbanyak percobaan dilakukan

. (4.9)

Definisi ini juga memiliki kelemahan karena kita tidak dapat melakukan percobaandalam jumlah yang tak berhingga. Pernyataan ”Peluang hujan 50%” hari ini dapat diin-terpretasikan bahwa hanya separuh dari banyak hari pada saat pernyataan itu dibuat akanhujan.

4.1.3 Definisi matematika (aksiomatik)Definisi matematika peluang ini secara garis besar mengatakan bahwa peluang dapat di-nyatakan sebagai berikut: (1) masing-masing bilangan adalah positif (lebih besar atausama dengan nol); (2) jumlah bilangan-bilangan tersebut adalah 1. Definisi ini tidak mem-berikan kesan penggunaan praktis peluang. Namun demikian definisi ini mendeskripsikankarakteristik dasar peluang yaitu terdapat himpunan hasil yang mungkin, masing-masingberasosiasi dengan terjadinya kejadian dengan peluang positif, dan paling tidak salah satuhasil terjadi.

Page 33: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 27

4.2 Permutasi dan KombinasiPermutasi dan kombinasi adalah dua teknik penghitungan dalam peluang yang sering di-gunakan. Apabila kita bertanya berapa banyak cara n objek berbeda disusun, kita meng-gunakan permutasi. Secara formal permutasi didefinisikan sebagai berikut:

Definisi 4.2.1 (Glover and Mitchell, 2002). Banyaknya permutasi yang menyusun hanyak objek dari n objek didefinisikan oleh

nPk =n!

(n − k)!(4.10)

dengan n! = n(n − 1)(n − 2)⋯ 2 ⋅ 1.

Sebagai contoh berapakah banyaknya cara untuk menyusun kepanitian yang berang-gotakan tiga orang(ketua, sekretaris, bendahara) dari lima orang mahasiswa. Di sini kitaperoleh n = 5 dan k = 3 sehingga

5P3 =5!

(5 − 3)!= 120

2= 60. (4.11)

Apabila banyaknya cara untuk memilih k objek dari n tanpa memperhatikan urutan,kita akan memperoleh kombinasi yang didefinisikan sebagai.

Definisi 4.2.2 (Glover and Mitchell, 2002). Banyaknya kombinasi yang menyusun hanyak objek dari n objek tanpa memperhatikan susunan

nCk =n!

k!(n − k)!. (4.12)

Sebagai contoh banyaknya cara untuk memilih tiga orang dari lima orang mahasiswaadalah

5C3 =5!

3!(5 − 3)!= 10. (4.13)

4.3 Peluang Salah Satu dari Dua KejadianPeluang dua kejadian A dan B didefinisikan sebagai berikut:

P (A atau B) = P (A) + P (B) − P (A dan B). (4.14)

Secara matematika, persamaan (4.14) biasanya dinotasikan sebagai berikut

P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (4.15)

Catatan P (A ∩ B) juga biasa dituliskan sebagai P (AB) atau P (A,B).Sebagai contoh, dalam pengambilan sebuah kartu remi kita akan menghitung peluang

terambilnya kartu as atau jantung. Kita tahu bahwa jumlah kartu as adalah 4 dan kartu

Page 34: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 28

jantung ada sebanyak 13. Jika kita misalkan A adalah kejadian terpilihnya kartu as dan Badalah kejadian terpilihnya kartu jantung maka kita peroleh

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

= 452+ 1352− 152

= 1652

= 413. (4.16)

Contoh lain, misalkan kita akan menghitung kejadian terambilnya kartu as atau karturaja. Kejadian pengambilan kartu as dan kartu raja disebut kejadian saling hindar (mu-tually exclusive) karena pada waktu pengambilan kartu tidaklah mungkin kartu as jugaadalah kartu raja. Jika A adalah kejadian terambilnya kartu as dan B adalah kejadianterambilnya kartu raja, maka

P (A ∪ B) = P (A) + P (B)

= 452+ 452

= 852

= 213. (4.17)

Pada kejadian saling hindar peluang P (A ∩ B) = 0 karena kedua kejadian tidak bisaterjadi. Pada contoh di atas kartu yang terpilih tidak mungkin kartu as adalah juga karturaja.

4.4 Peluang Bersama Dua KejadianPada subbab sebelumnya kita telah membahas peluang kejadian P (A∪B) dan penghitun-gan peluang ini melibatkan peluang kejadian A dan B, atau P (AB). Peluang kejadian inidisebut peluang kejadian bersama (joint probability) A dan B. Peluang bersama ini dapatdihitung dari persamaan (4.14)

P (A dan B) = P (A) + P (B) − P (A atau B). (4.18)

4.4.1 Peluang bersyaratPeluang bersyarat (conditional probability) adalah peluang suatu peristiwa terjadi dike-tahui peristiwa lain sudah terjadi. Peluang kejadian A diketahui kejadian B telah terjadididefinisikan sebagai

P (A|B) =P (AB)P (B)

. (4.19)

Dengan cara serupa,P (B|A) =

P (BA)P (A)

=P (AB)P (A)

. (4.20)

Page 35: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 29

Sebagai contoh kita akan menghitung peluang terpilihnya kartu hati diketahui kartusebelumnya adalah kartu as. Misalkan A adalah kerjadian terpilihnya kartu hati dan Badalah kejadian terpilihnya kartu as. Dengan demikian

P (A|B) =P (AB)P (B)

=1∕524∕52

= 14. (4.21)

Demikian pula dapat kita hitung

P (B|A) =P (AB)P (A)

=1∕5213∕52

= 113. (4.22)

Pada persamaan (4.21) dapat kita amati bahwa

P (A|B) = P (A) = 14

(4.23)

danP (B|A) = P (B) = 1

13. (4.24)

Dua kejadian ini disebut kejadian saling bebas (independent). Dua kejadian A dan Bdikatakan kejadian saling bebas jika P (A) = P (A|B) atau jika P (B) = P (B|A). Dengankata lain, jika dua kejadian A dan B maka

P (AB) = P (A)P (B). (4.25)

4.5 Aksioma dan Aturan-aturan PeluangPada bagian ini kita akan meninjau kembali beberapa aturan peluang yang telah dipela-jari pada subbab sebelumnya. Beberapa aksioma yang telah dipelajari adalah sebagaiberikut (Glover and Mitchell, 2002):

1. Misalkan S menyatakan ruang sampel untuk suatu eksperimen, maka P (S) = 1;

2. Peluang P (Ai) ≥ 0 untuk semua kejadian Ai;

3. Misalkan A1, A2, A3,. . . adalah kumpulan kejadian yang saling hindar (mutually ex-clusive), maka

P (A1 ∪ A2 ∪ A3⋯) = P (A1) + P (A2) + P (A3) +⋯ (4.26)

4. Peluang P (Ac) = 1 − P (A).

Page 36: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 30

5. Peluang kejadian yang tidak mungkin P (∅) = 0.

Selain aksioma di atas kita juga telah mengenal aturan penjumlahan. Misalkan A danB adalah sebarang kejadian, maka

P (A ∪ B) = P (A) + P (B) − P (AB). (4.27)

Kemudian kita juga telahmengenal aturan bersyarat. ApabilaA danB adalah dua kejadiandengan P (B) ≠ 0, maka peluang

P (A|B) =P (AB)P (B)

. (4.28)

Selanjutnya, apabilaP (A|B) = P (A)makaA danB dikatakan saling bebas (independent).Cara lain untuk mengatakan kejadian A dan B saling bebas adalah

P (AB) = P (A)P (B). (4.29)

Menggunakan aturan-aturan di atas kita dapat menyusun aturan perkalian berikut. Mis-alkan A dan B adalah dua kejadian (tidak perlu saling bebas), maka

P (AB) = P (B|A)P (A). (4.30)

Dalam menjawab permasalahan yang berhubungan dengan peluang, penggunaan diagramVenn dapat membantu menyederhakan formulasi masalah.

4.6 Kaidah BayesPada bagian berikut kita akan membicarakan suatu kaidah atau aturan penting peluangyang disebut aturan Bayes atau kaidah Bayes. Misalkan kejadianB1, B2, . . . , Bk dikatakanpartisi dari ruang sampel S jika kedua kondisi berikut dipenuhi:

1. BiBj = ∅ untuk sebarang pasangan i dan j;

2. B1 ∪ B2 ∪⋯ ∪ Bk = S.

Sekarang, sebarang kejadian A dapat dituliskan sebagai gabungan dari kejadian-kejadiansaling hindar AB1 dan AB2. Artinya,

A = AB1 ∪ AB2 (4.31)

sehinggaP (A) = P (AB1) + P (AB2). (4.32)

Jika peluang bersyarat P (A|B2) dan P (A|B2) diketahui, maka P (A) dapat dicari denganmenuliskan

P (A) = P (B1)P (A|B1) + P (B2)P (A|B2). (4.33)Sekarang bagaimana kalau kita ingin mencari peluang P (B1|A)? Kita telah mempelajaripeluang bersyarat yaitu

P (B1|A) =P (B1A)P (A)

(4.34)

Page 37: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 31

dan menggunakan rumus (4.33) kita peroleh

P (B1|A) =P (B1)P (A|B1)

P (B1)P (A|B1) + P (B2)P (A|B2). (4.35)

Persamaan (4.35) merupakan kejadian khusus dari kaidah Bayes. Bentuk umum darikaidah Bayes ini adalah sebagai berikut. MisalkanB1,B2, . . . ,Bnmembentuk suatu partisidari S dan A adalah sebarang kejadian dalam S, maka

P (Bj|A) =P (Bj)P (A|Bj)

∑ki=1 P (Bj)P (A|Bj)

. (4.36)

Contoh 4.6.1. Suatu perusahaan membeli alat-alat lab dari dua pemasok, yaitu pemasok 1dan pemasok 1. Pemasok 1 memiliki catatan membawa alat-alat lab yang berisi kerusakan10% dan pemasok 2 memiliki tingkat kerusakan hanya 5%. Misalkan 40% pasokan saatini berasal dari pemasok 1. Jika alat lab yang diambil secara acak dari pasokan ini ternyatarusak, berapakah peluang bahwa kerusakan berasal dari pemasok A?

Untuk menjawab pertanyaan ini, misalkan Bi menyatakan kerusakan alat lab dari pe-masok ke-i, dengan i = 1, 2. Ingat bahwa B1 dan B2 membentuk partisi ruang sampeluntuk eksperimen memilih satu alat lab. Misalkan A adalah kejadian bahwa alat lab ter-pilih rusak. Kita peroleh

P (B1|A) =P (B1)P (A|B1)

P (B1)P (A|B1) + P (B2)P (A|B2)

= 0,4 × 0,10,4 × 0, 1 + 0,6 × 0,05

= 0,040,04 + 0,03

= 47. (4.37)

4.6.1 Aplikasi Kaidah BayesAplikasi peluang bersyarat pada bagian ini diadaptasi dari Scheaffer (1995). Salah satu ap-likasi peluang bersyarat adalah dalam bidangmedis. Uji tapis (screening test) mengindikasikankeberadaan atau ketidakberadaan suatu penyakit tertentu. Uji seperti ini biasanya digu-nakan dokter untuk mendeteksi penyakit. Namun, hampir semua uji tapis memiliki tingkatkesalahan yang bersesuaian dengan penggunaanya. Dua jenis kesalahan yang mungkinadalah sebagai berikut. Kesalahan pertama, uji dapat mengindikasikan bahwa seseorangmemiliki penyakit padahal sebenarnya orang tersebut tidak memilikinya. Kesalahan inidisebut positif palsu (false positive). Kesalahan kedua uji ini gagal menunjukkan bahwaorang tersebut memiliki penyakit padahal sesungguhnya orang tersebut memang memilikipenyakit. Kesalahan kedua ini disebut negatif palsu (false negative). Ukuran kedua jenispeluang bersyarat ini disebut kepekaan atau sensitivitas (sensitivity) dan kekhususan atauspesifisitas (specificity).

Diagram berikutmembantu kita dalammendefinisikan danmenginterpretasikan ukuran-ukuran ini, tanda + mengindikasikan adanya penyakit pada saat penelitian dan tanda −

Page 38: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 32

mengindikasikan ketidakberadaan penyakit. Diagnosis sesungguhnya mungkin tidak akanpernah diketahui, namun dapat ditentukan dengan pengujian yang lebih intensif.

Diagnosis Sesungguhnya+ − Jumlah

Hasil + a b a + bUji − c d c + dJumlah a + c b + d n

Pada tabel di atas nilai n = a + b + c + d. Dari tabel di atas, n orang diuji dan hasilpengujian mengindikasikan bahwa a + b di antara mereka memiliki penyakit. Dari nilaiini, a memang sesungguhnya memiliki penyakit dan b tidak (positif palsu). Dari c + dyang memiliki hasil tes negatif, c sebenarnya memang memiliki penyakit (negatif palsu).Dengan demikian kepekaan atau sensitivitas dihitung sebagai

sensitivitas = aa + c

(4.38)

yang menyatakan peluang bersyarat memiliki hasil uji positif, diketahui bahwa orang yangbersangkutan memiliki penyakit. Selanjutnya, kekhususan atau spesifisitas didefinisikansebagai

spesifisitas = db + d

(4.39)

yang menyatakan bahwa peluang bersyarat memiliki hasil tes negatif, diketahui bahwaorang tersebut tidak memiliki penyakit. Suatu uji yang bagus seharusnya memiliki sen-sitivitas dan dan spesifisitas yang mendekati 1. Jika sensitivitas mendekati 1, maka c(jumlah negatif palsu) harus kecil. Jika spesifisitas mendekati 1, maka b (jumlah posi-tif palsu) harus kecil. Namun, meskipun sensitivitas dan spesifisitas mendekati 1, suatuuji tapis dapat menghasilkan nilai yang mengelirukan jika tidak diterapkan dengan hati-hati. Sehingga diperlukan ukuran lain yaitu nilai prediktif (predictive value) dari uji yangdidefinisikan sebagai

nilai prediktif = aa + b

(4.40)

yangmenyatakan bahwa peluang bersyarat dari seseorang yang sebenarnyamemiliki penyakit,diketahui bahwa yang bersangkutan memiliki hasil tes positif. Uji yang bagus seharusnyamemiliki nilai prediktif yang tinggi, namun hal ini tidak selalu dimungkinkan karena ketigaukuran tidak selalu bisa mendekati 1 secara bersama-sama. Artinya, nilai prediktif dipen-garuhi oleh laju prevalensi (prevalence rate) dari suatu penyakit yaitu proporsi populasidalam studi atau penelitian yang sebenarnya memiliki penyakit.

Sebagai contoh perhatikan ketiga diagram berikut (Scheaffer, 1995, hlm. 37). PadaTabel 4.1 sensitivitas dan spesifisitas masing-masing sama dengan 0,90 dan nilai prediktif90∕100 = 0,90 dengan laju prevalensi 50%. Ini situasi yang bagus dan pengujiannya jugabagus. Bagaimana dengan Tabel 4.2? Pada Tabel 4.2 laju prevalensi berubah menjadi100∕1100 atau 9%. Meskipun sensitivitas dan spesifisitasnya masih 0,90. Nilai prediktifturun menjadi 90∕190 = 0,47. Selanjutnya, untuk Tabel 4.3 kita peroleh laju prevalensi100∕10.000 atau sekitar 1% dan nilai prediktif turun menjadi 0,08. Artinya hanya 8% dariyang diuji positif sebenarnya memiliki penyakti, meskipun sensitivitas dan spesifisitasnyatinggi.

Page 39: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 33

Tabel 4.1: Situasi IDiagnosis Sesungguhnya

+ − JumlahHasil + 90 10 100Uji − 10 90 100Jumlah 100 100 200

Tabel 4.2: Situasi IIDiagnosis Sesungguhnya

+ − JumlahHasil + 90 100 190Uji − 10 900 910Jumlah 100 1.000 1.100

Tabel 4.3: Situasi IIIDiagnosis Sesungguhnya

+ − JumlahHasil + 90 1.000 1.090Uji − 10 9.000 9.010Jumlah 100 10.000 10.100

4.7 Latihan1. Tulislah ruang sampel dari eksperimen berikut berikut:

a) melemparkan sebuah mata uang logam sekali,b) melemparkan sebuah mata uang logam sebanyak empat kali,c) banyaknya muka yang muncul pada kejadian (b),d) melemparkan sebuah dadu dua kali,e) melemparkan dua buah dadu sekali,

2. Semua darah manusia dapat dikategorikan sebagai jenis ABO, artinya masuk salahsatu dari O, A, B, atau AB. Namun, sebaran dari jenis golongan darah ini sedikitberbeda. Berikut ini adalah sebaran dari golongan darah dari orang yang dipilihsecara acak di Amerika Serikat:

Golongan darah A B AB O

Peluang (AS) 0,40 0,11 0,04 ?

a) Berapakah peluang golongan darah O di Amerika Serikat?b) Maria memiliki golongan darah B. Ia dapat menerima transfusi darah dari

orang yangmemiliki golongan darahO danB. Berapakah peluang bahwa orangAmerika yang dipilih secara acak dapat mendonorkan darahnya kepadaMaria?

Page 40: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 34

3. Golongan darah manusia adalah O, A, B, atau AB dan juga Rh-positif atau Rh-negatif. Golongan ABO dan faktor Rh saling bebas karena keduanya diatur olehgen yang berbeda. Di Amerika 84% orang Rh-positif. Gunakan informasi padasoal 2 untuk mencari sebaran peluang dari golongan darah (ABO dan Rh) untuksebarang orang yang dipilih secara acak.

4. Sebaran dari golongan darah di Cina sedikit berbeda dengan sebaran golongan darahdi Amerika Serikat: Pilih secara acak satu orang Amerika dan satu orang Cina (se-

Golongan darah A B AB O

Peluang (Cina) 0,27 0,26 0,12 0,35

cara bebas).

a) Berapakah peluang keduanya memiliki golongan darah O?b) Berapakah peluang keduanya memiliki golongan darah yang sama?

5. Pohon ginseng Ginkgo biloba dianggap telah punah sampai akhirnya ditemukanpada awal abad ke-20 ketika suatu populasi ditemukan di Cina timur. Tanaman inisekarang ditanam di seluruh dunia. Tiga puluh lima persen dari spesimen tanamanini memiliki daun yang bervariasi (berwarna-warni), sementara sisanya memilikidaun berwarna hijau. Tujuh puluh persen dari tanaman ini memiliki bunga berwarnaputih dan sisanya berwarna merah muda. Hanya 20% dari pohon ginseng memilikidaun yang bervariasi dan bungnya berwarna putih. (Glover and Mitchell, 2002,hlm. 41)

a) Berapakah peluang bahwa spesimen yang dikumpulkan secara acak memilikidaun bervariasi atau bunganya warna putih?

b) Berapakah peluang bahwa spesimen yang dipilih secara acak memiliki bungaberwarna putih dan daun berwarna hijau?

c) Berapakah peluang bahwa spesimen yang dikumpulkan secara acak memilikidaun berwarna hijau dan berbunga merah muda?

6. Misalkan dalam suatu perjalanan ke Guatemala seorang Anda memutuskan untukmempelajari kumbang Stenotarsus rotundus. Populasi yang Anda selidiki terdiridari 60% betina dan 40% jantan. Selain itu, terdapat dua warna morf, cokelat 70%dan perunggu 30%. Separuh dari kumbang adalah cokelat betina. (Glover andMitchell,2002, hlm. 44)

a) Berapakah peluang bahwa kumbang yang dipilih secara acak adalah cokelatatau betina?

b) Jika seekor kumbang adalah betina, berapakah peluang kumbang tersebut berwarna:i. cokelat?ii. perunggu?

c) Jika seekor kumbang adalah jantan, berapakah peluang bahwa kumbang terse-but berwarna:

Page 41: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 4. PELUANG 35

i. cokelat?ii. perunggu?

7. Sebaran golongan darah di Amerika Serikat adalah sebagai berikut: golongan darahA 41%, golongan darah B 9%, golongan darah AB 4%, dan golongan darah O 46%.Diperkirakan pada saat perang dunia kedua, 4% orang dengan golongan darah Odituliskan bergolongan darah A; 88% orang dengan golongan darah A dituliskandengan benar; 4% orang dengan golongan darah B dituliskan bergolongan darah A;dan 10% orang dengan golongan darah AB dituliskan bergolongan darah A. Seorangtentara yang sedang terluka akan dioperasi bedah. Tentara ini dituliskan sebagaiorang bergolongan darah A.

a) Berapakah peluang bahwa ini adalah memang benar golongan darahnya?b) Berapakah peluang bahwa seorang yang dituliskan bergolongan darah A sebe-

narnya adalah bergolongan darah B?

8. Uji ELISA untuk keberadaan antibodi HIV dikembangkan pada pertengahan tahun80-an untukmenapis sampel-sampel darah. Untuk pengujian kasus yangmelibatkansampel yang diketahui telah terkontaminasi, ELISA melaporkan dengan benar 98%.Dalam pengujian sampel yang diketahui bersih, ELISAmenyatakan 7% dari merekaadalah HIV-positif. Misalkan sebuah perusahaan memiliki 10.000 karyawan dan se-muanya akan ditapis untuk HIV menggunakan ELISA. Apa yang bisa kita katakantentang sensitivitas dan spesifisitas serta nilai prediktif untuk uji tapis tersebut?Silakan lihat Tabel 4.4 dan 4.5 berikut.

Tabel 4.4: Situasi IDiagnosis Sesungguhnya

+ − JumlahHasil + 1.470 595 2.065Uji − 30 7.905 7.935Jumlah 1.500 8.500 10.000

Tabel 4.5: Situasi IIDiagnosis Sesungguhnya

+ − JumlahHasil + 490 665 1.150Uji − 10 8.835 8.845Jumlah 500 9.500 10.000

Page 42: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5Sebaran Peluang

Pada bab sebelumnya kita telah membahas konsep dasar peluang seperti peluang dua keja-dian yang saling hindar, peluang dua kejadian saling bebas, peluang bersyarat dan TeoremaBayes. Pada bab ini kita akan mempelajari teknik-teknik yang diperlukan untuk mema-hami tentang peubah acak.

Peubah acak (random variable) adalah peubah atau variabel yang nilai sebenarnyaditentukan oleh ”operasi kemungkinan” (chance operation). Sebagai contoh hasil daripelemparan mata dadu atau hasil dari pelemparan mata uang merupakan peubah acak.

Kita akan membahas dua kelas peubah atau variabel acak, yaitu peubah acak diskretdan peubah acak kontinu. Peubah acak diskret (discrete random variable) mengasumsikannilai tertentu, apakah hingga(finite) atau takhingga namun bisa dihitung (countable infi-nite). Contoh peubah acak diskret adalah hasil dari pelemparan dadu dengan hasil yangmungkin 1, 2, 3, 4, 5, atau 6. Contoh lain jumlah pasien penderita HIV positif, yaituberupa bilangan bulat dari 1 sampai n tertentu. Peubah acak kontinu dapat mengambil ni-lai dalam suatu interval atau interval dari bilangan real, dan peluang bahwa diasumsikannilai spesifik tertentu adalah 0.

Bab ini diadaptasi dari Glover and Mitchell (2002).

5.1 Peubah Acak DiskretPola dari tingkah laku suatu peubah acak diskret dideskripsikan oleh fungsi matematikayang disebut fungsi densitas (density function) atau sebaran peluang (probability distribu-tion). Fungsi densitas atau sebaran merupakan rekor atau catatan sebaran sering masing-masing nilai dari peubah acak diskret terjadi. Dengan kata lain, fungsi densitas menga-sosiasikan suatu peluang kepada setiap hasil yang mungkin dari peubah acak.

Secara formal peubah acak didefinisikan sebagai berikut. Misalkan X adalah suatupeubah acak diskret. Fungsi densitas peluang atau sebaran peluang f untuk X adalah

f (x) = P (X = x), (5.1)

dengan x adalah sembarang bilangan real. Sebagai catatan:

1. fungsi f terdefinisikan pada semua bilangan real,

2. nilai f (x) ≥ 0 karena f merupakan peluang,

36

Page 43: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 37

3. nilai f (x) = 0 pada sebagaian besar bilangan real karena X diskret dan tidak bisamengasumsikan sebagian besar bilangan real (cannot assume most real values), dan

4. menjumlahkan f pada semua hasil yang mungkin dari X menghasilkan 1, yaitu∑

semua xf (x) = 1. (5.2)

Fungsi densitas peluang biasanya disingkat pdf. Berikut akan diberikan beberapa contohfungsi densitas diskret.

Contoh 5.1.1. Misalkan kita melemparkan mata dadu 6 dan peubah acak diskretX meny-atakan mata dadu yang diperoleh pada setiap lemparan. Kita akan menghitung fungsi den-sitas untuk peubah ini. Kita asumsikan bahwa dadu tersebut seimbang sehingga masing-masingmata dadu, yaitu mata dadu 1 sampai 6, memiliki peluang yang sama untukmuncul(Lihat kembali definisi klasik tentang peluang). Dengan demikian masing-masing matadadu memiliki peluang 1∕6. Kita katakan peubah acak X memiliki sebaran seragam(uniformly distributed) karena semua hasil yang mungkin memiliki peluang yang sama.Berikut ini adalah tabel hasil-hasil yang mungkin dari pelemparan sebuah mata dadu 6.

Peubah acak x 1 2 3 4 5 6

Densitas f (x) 1/6 1/6 1/6 1/6 1/6 1/6

Perhatikan bahwa nilai X yang tidak terdaftar pada tabel di atas dianggap tidak mungkindan nilainya adalah 0. Sebagai contoh nilai-nilai f (0.1) = 0, f (6,8) = 0, dan f (−2) = 0.

Contoh 5.1.2. Sekarang kita akan melemparkan dadu bermata 6 sebanyak dua kali dankita tertarik dengan peubah acak diskretX yang merepresentasikan jumlah bilangan yangyang diperoleh pada kedua lemparan. Kita akan menghitung fungsi densitas dari peubahini. Kita peroleh tabel berikut.

Peubah acak x 2 3 4 5 6 7 8 9 10 11 12

Densitas f (x) 136

236

336

436

536

636

536

436

336

236

136

Berdasarkan tabel kita dapat menghitung peluang

P (X = 7 atau 11) = 636+ 236= 29, (5.3)

karena 7 dan 11 adalah kejadian saling hindar.

Misalkan Anda melemparkan sebuah dadu sebanyak 10.000 kali dan mencatat hasil-nya, berapakah nilai rata-rata jangka panjangnya (long-run average value)? Misalkan pulaAnda meleparkan sepasang dadu sebanyak 50.000 kali dan mencatat hasilnya, berapakahnilai tengahnya? Melakukan percobaan seperti ini tentu menghabiskan waktu. Namun,kita dapat menghitung nilai harapan (expected value) dengan definisi berikut.

Nilai harapan (expected value) jangka panjang atau nilai tengah peubah acak diskretdengan densitas f (x) dididefinisikan sebagai

� = E(X) =∑

semua xxf (x). (5.4)

Page 44: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 38

Dengan kata lain, masing-masing nilai x diboboti oleh densitas atau peluangnya. Sebagicontoh untuk pelemparan sebuah mata dadu 6 di atas kita peroleh

� =6∑

x=1xf (x) =

6∑

i=1x16= 1 + 2 + 3 + 4 + 5 + 6

6= 3,5. (5.5)

Untuk pelemparan dua dadu kita peroleh

� =12∑

x=2xf (x) = 2 ⋅ 1

36+ 3 ⋅ 2

36+⋯ + 12 ⋅ 1

36= 7. (5.6)

Definisi nilai harapan pada persamaan (5.4) dapat diperluas untuk fungsi ℎ(x). Misalkanf (x) adalah fungsi peubah acak diskret X, nilai harapan ℎ(x) dapat dihitung sebagai

E[ℎ(X)] =∑

semua xℎ(x)f (x). (5.7)

Sebagai contoh kita dapat menghitung nilai harapan X2 untuk contoh pelemparan sebuahmata dadu. Kita peroleh

E(X2) =6∑

x=1x2f (x) = 12 ⋅ 1

6+⋯ + 621

6= 916= 15,167. (5.8)

Varians juga dapat dihitung dengan formula

�2 = E(X2) − [E(X)]2. (5.9)

Sebagai contoh varians untuk pelemparan sebuah dadu adalah

�2 = 15,167 − (3,5)2 = 2,917. (5.10)

Fungsi densitas peubah acak diskret memberikan informasi kepada kita peluang suatunilai tertentu dari suatu peubah, yaitu P (X = x). Namun, pada banyak masalah peneli-tian kita sering memerlukan informasi berapa peluang suatu kejadian ”setidaknya” jikadiberikan suatu nilai X. Jadi yang kita inginkan adalah P (X ≤ x). Sebagai contoh jikakita ingin menghitung peluang munculnya mata dadu 5 atau kurang pada pelemparan sep-asang mata dadu adalah P (X ≤ 5). Peluang ini dapat kita hitung sebagai berikut

P (X ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5)

= 136+ 236+ 336+ 436

= 1036= 0,28. (5.11)

Proses penghitungan pada (5.11) dilakukan dengan cara manual. Untuk menjawab per-tanyaan seperti di atas kita menggunakan konsep fungsi sebaran kumulatif yang didefini-sikan sebagai berikut.

Misalkan X adalah peubah acak diskret dengan densitas f . Fungsi sebaran kumulatif(cumulative distribution function)X dinotasikan F , biasnya disingkat CDF, didefinisikanoleh

F (x) = P (X ≤ x), (5.12)untuk semua bilangan real x. Sebagai contoh untuk pelemparan dua dadu kita perolehtabel sebaran kumulatif sebagai berikut.

Page 45: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 39

Peubah acak x 2 3 4 5 6 7 8 9 10 11 12

Densitas f (x) 136

236

336

436

536

636

536

436

336

236

136

CDF F (x) 136

336

636

1036

1536

2136

2636

3036

3336

3536

3636

Dengan tabel sebaran kumulatif ini kita dapat menghitung P (X ≤ 8) = 26∕36 dan P (4 <X < 10) = 2∕3.

5.1.1 Sebaran BinomialSebaran binomial merupakan salah satu sebaran peubah diskret yang penting dalam bi-ologi. Sebaran ini muncul dalam suatu konteks sebagai model percobaan yang bebas de-ngan empat asumsi:

1. jumlah percobaan ditetapkan sebanyak n;

2. hasil masing-masing percobaan dapat diklasifikasikan ke dalam dua kejadian salinghindar: ”sukses” dan ”gagal”;

3. peluang kejadian sukses dinyatakan sebagai p konstan sepanjang percobaan danpeluang gagal dinyatakan sebagai 1 − p;

4. masing-masing percobaan adalah bebas (independent), yaitu hasil dari suatu per-cobaan tertentu tidak dipengaruhi oleh hasil dari percobaan lain.

Kita tertarik dengan peubah acak banyaknya sukses selama n percobaan. Misalkan Xadalah banyaknya sukses dalam n percobaan. Jadi X memiliki nilai mulai dari 0 sampain. Fungsi densitas f (x) adalah peluang dari x sukses dalam n percobaan. Banyaknya carax sukses dalam n percobaan adalah

(

nx

)

= n!x!(n − x)!

. (5.13)

Peluang sukses dan gagal dalam percobaan selanjutnya merupakan hasil perkalian karenapercobaannya bebas. Peluang dari kombinasi x sukses dan n − x gagal adalah

px(1 − p)n−x. (5.14)

Kita tahu bahwa banyak kombinasi sukses dan gagal adalah seperti pada persamaan (5.13).Secara formal fungsi densitas peluang peubah acak binomial dengan n percobaan dan pelu-ang sukses p pada setiap percobaan adalah

f (x) = n!(n − x)!

px(1 − p)n−x. (5.15)

Peubah acak binomial dicirikan oleh dua parameter: n dan p. Sebagai contoh misalkanjenis kelamin bayi memiliki sebaran binomial. Kita akan menghitung fungsi densitas danfungsi sebaran kumulatif banyaknya perempuan dalam 5 keluarga. Pada kasus seperti ini

Page 46: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 40

kita peroleh P (perempuan) = P (sukses) = p = 0,5 dan P (laki-laki) = P (gagal) = 1−p =0,5. Untuk n = 5 kita peroleh

f (x) =(

5x

)

(0,5)x(1 − 0,5)5−x =(

5x

)

(0,5)5. (5.16)

Sehingga untuk x = 0 kita peroleh

f (0) =(

50

)

(0,5)5 = 0,03125. (5.17)

Dengan cara serupa kita peroleh f (1) = 0,15625, f (2) = 0,31250, f (3) = 0,31250,f (4) = 0,15625 dan f (5) = 0,03125. Dengan demikian fungsi densitas peluang danfungsi sebaran kumulatif untuk kasus ini adalah sebagai berikut.

Peubah acak X 0 1 2 3 4 5

Densitas f (x) 0,03125 0,15625 0,31250 0,31250 0,15625 0,03125CDF f (x) 0,03125 0,1875 0,5000 0,8125 0,96875 1,00000

Misalkan X memiliki sebaran binomial dengan parameter n dan p, biasanya dino-tasikan X ∼ Bin(n, p). Selanjutnya kita dapat menghitung nilai tengah atau rata-rata danvarians dari Bin(n, p), yaitu

� = np,�2 = np(1 − p).

5.1.2 Sebaran PoissonSebaran diskret lain yang berhubungan dengan sebaran binomial adalah sebaran Poisson.Peubah acak ini berasumsi sebagai berikut.

1. Kejadian terjadi sekali pada waktu tertentu; dua atau lebih kejadian tidak terjadisecara tepat pada waktu atau tempat yang sama.

2. Kejadian suatu peristiwa pada suatu periode tertentu atau tempat tertentu tidak dipen-garuhi (independent) oleh kejadian pada periode sebelumnya atau periode yangtidak saling tumpang-tindih.

3. Banyaknya kejadian yang diharapkan selama satu periode adalah sama dengan pe-riode yang lain. Banyak kejadian yang diharapkan dinotasikan dengan �.

Fungsi densitas peluang peubah acak Poisson X didefinisikan oleh

f (x) =e−��x

x!, x = 0, 1, 2,… . (5.18)

Catatan: e = 2,71828… . Nilai tengah (rata-rata) dan varians untuk peubah acak Poissonadalah sebagai berikut:

� = E(X) = �, (5.19)�2 = var(X) = �. (5.20)

Page 47: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 41

Berdasarkan persamaan (5.19) dan (5.20) kita lihat mean dan variansnya sama. Peubahacak Poission X dengan parameter � biasanya ditulis Poi(�).

Contoh 5.1.3. Seorang ahli ikan (ichthyologist) mempelajari spesies ikan Cottus riceidengan cara memancing. Hasil tangkapan kemudian ditempatkan pada kantung besar.Berdasarkan pengalaman bertahun-tahun sang ahli ikan menangkap 4 ikan pada saat me-mancing. Hitunglah peluang menangkap

(a) tidak ada ikan pada;

(b) kurang dari 6 ikan;

(c) antara 2 dan 6 ikan.

Penyelesaian:Kejadian penangkapan inimemiliki sebaran Poisson dengan parameter� = 4 ikan/pemancingan.

1. Peluang tidak mendapatkan ikan

P (X = 0) = f (0)

= e−4400!

= 0,01831564.

2. Peluang menangkap kurang dari 6 ikan

P (X < 6) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5)

= e−4400!

+ e−4411!

+ e−4422!

+ e−4433!

+ e−4444!

+ e−4455!

= 0,7851304.

3. Peluang mendapatkan antara 2 dan 6 ikan

P (2 < X < 6) = P (X = 3) + P (X = 4) + P (X = 5)

= e−4433!

+ e−4444!

+ e−4455!

= 0,5470271.

5.2 Peubah Acak KontinuPeubah acak kontinumengasumsikan nilai sepanjang interval. Sebagai contoh pengukurantinggi badan atau berat badan merupakan contoh peubah acak kontinu.

Definisi 5.2.1. Fungsi densitas peluang untuk peubah acak kontinu X adalah fungsi fyang didefinisikan untuk semua bilangan real x sedemikian hingga

1. f (x) ≥ 0;

2. area di bawah grafik fungsi f dan di atas sumbu x memiliki luas 1;

Page 48: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 42

3. untuk sembarang bilangan real a dan b, peluang P (a ≤ X ≤ b) diberikan oleh luasyang dibatasi oleh grafik f , garis x = a dan garis x = b dan sumbu x.

Catatan: ada perbedaan mendasar pada penghitungan P (X = c) pada peubah kontinudan peubah diskret. Pada peubah kontinu P (X = c) = 0 karena peluang ini menyatakanluas segmen garis dibawah f (c) dan luas ini adalah 0. Hal ini dapat dijelaskan dari perhi-tungan integral sebagai berikut

P (X = c) = ∫

c

cf (x) dx = 0. (5.21)

Integral pada persamaan (5.21) adalah 0 karena kedua titik ujung selang adalah sama.Dengan demikian pada peubah kontinu pada peubah kontinu P (X < c) = P (X ≤ c).Pada kasus diskret (binomial dan Poisson) P (X ≤ c) ≠ P (X < c) karena P (X = c)adalah peluang lebih besar daripada 0.

5.2.1 Sebaran NormalSebaran normal merupakan salah satu sebaran penting yang banyak digunakan dalamstatistika. Fungsi densitas peluang normal dengan rata-rata � dan varians �2, biasanyaditulisN(�, �2) dinyatakan oleh

f (x) = 1√

2��e−(x−�)2∕2�2 . (5.22)

Penghitungan fungsi sebaran kumulatif untuk sebaran pada persamaan (5.22) tidaklah mu-dah. Namun, kita dapat menggunakan distribusi normal baku untuk menghitung fungsidistribusi kumulatif untukN(�, �2).

Sebaran Normal Baku

Misalkan X adalah peubah acak normal dengan rata-rata � dan varians �2. Transformasi

Z =X − ��

(5.23)

memiliki sebaran normal baku dengan rata-rata 0 dan varians 1. Dengan kata lain

f (z) = 1√

2�e−x2∕2. (5.24)

Sehingga kita dapat menghitung fungsi sebaran kumulatif sembarang peubah acak normaldengan memanfaatkan (5.23) (dengan menggunakan tabel sebaran normal baku).

Contoh 5.2.1. Misalkan tekanan darah diastol (diastolic blood pressure) X pada wanitabertekanan darah tinggi adalah 100 mmHg dan memiliki simpangan baku 16 mmHg danberdistribusi normal. Hitunglah:

(a) P (X < 90),

(b) P (X > 124),

Page 49: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 43

(c) P (96 < X < 104).

Penyelesaian:Kita akan menggunakan transformasi peubah seperti pada (5.23)dengan � = 100 dan� = 16.

(a) Untuk menghitung P (X < 90), kita peroleh X = 90, sehingga

Z = 90 − 10016

= −0,625.

Sehingga P (X < 90) = P (Z < −0,625) = F (−0,625) ≈ 0,2660.

(b) Untuk P (X > 124) kita peroleh X = 124, sehingga

Z = 124 − 10016

= 1,5.

Sehingga P (X124) = P (Z > 1,5) = 1 − F (1,5) = 0,00668..

(c) Untuk menghitung P (96 < X < 104) kita bisa lakukan transformasi secara simultan,yaitu

P (96 < X < 104) = P(

96 − 10016

< Z < 104 − 10016

)

= P (−0,25 < Z < 0,25)= F (0,25) − F (−0,25)= 0,5987 − 0,4013 = 0,1974.

5.3 Latihan Soal1. Diketahui bahwa peluang sembuh kembali dari infeksi virus Ebola adalah 0,2. Jika

diketahui 20 orang yang tidak saling berhubungan terinfeksi, hitunglah

a) nilai harapan orang yang akan sembuh;b) peluang bahwa 6 atau kurang akan sembuh;c) peluang bahwa setidaknya 6 orang akan sembuh;d) peluang bahwa 6 orang akan sembuh;

2. Anda mungkin pernah baca bahwa spesies katak Rana pipiens memiliki rasio seks(sex ratio) dalam populasi adalah 60% betina dan 40% jantan. Jika hal ini benar,berapakah peluang

a) dalam sampel acak berukuran 20, kurang dari 10 adalah betina?b) dalam sampel acak berukuran 13, tepat 8 adalah betina?

Sumber: Glover and Mitchell (2002)

Page 50: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 5. SEBARAN PELUANG 44

3. Sekelompok siswa ekologi hutan mensurvei beberapa petak 10m × 10m di dalamsuatu hutan hujan subtropis (subtropical rainforest). Mereka menemukan rata-rata30 pohon per petak. Diasumsikan bahwa pohon menyebar secara acak. Hitunglahpeluang

a) tidak lebih dari tiga pohon dalam petak 1m2?b) menemukan dengan tepat 1 pohon dalam petak 1m2?c) setidaknya 2 pohon?

Sumber: Glover and Mitchell (2002)

4. Didalam suatu populasi ikan haring (harring), spesies ikan Pomolobus aestivalismemiliki panjang yang berdistribusi normal. Rata-rata panjangnya adalah 54 mmdan simpangan baku 4 mm.

a) Berapakah peluang bahwa ikan yang ditangkap memiliki panjang kurang dari62 mm?

b) Berapakah persentase ikan yang lebih dari 59 mm?c) Berapakah peluang ikan yang ditangkap memiliki panjang antara 48–56 mm?

Sumber: Glover and Mitchell (2002)

Page 51: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6Sebaran Pengambilan Sampel

Pada bab-bab sebelumnya kita telah membahas statistika deskriptif, peluang, dan sebaranpeluang. Statistika deskriptif membantu kita dalam mendeskripsikan dan merangkumdata. Sedangkan peluang dan sebaran peluangmemberikan dasar bagi kita untukmengeval-uasi data menggunakan metode-metode statistika. Tanpa teori peluang tidaklah mungkinbagi kita untuk membuat pernyataan tentang populasi tanpa mempelajari setiap anggotadi dalam populasi.

Bab ini membahas sebaran pengambilan sampel sebagai salah satu bagian dari statis-tika inferensial (inferential statistics) yaitumetode statistika yang digunakan untukmengam-bil simpulan dari sampel dan membuat inferens terhadap seluruh populasi.

Pada bab tentang peluang dan sebaran peluang kita telah menggunakan sebaran bino-mial, Poisson, dan normal danmengaplikasikan konsep peluang tersebut pada kasus-kasusdalam bidang biologi. Konsep-konsep tersebut berhubungan dengan statistika inferensimelalui sebaran pengambilan sampel (sampling distribution).

Salah satu metode pengambilan sampel adalah sampel acak sederhana (simple ran-dom sampling) yaitu suatu sampel berukuran n yang diambil dari populasi berukuran Nsedemikian hingga setiap sampel berukuran n yang mungkin memiliki peluang yang samauntuk terpilih. Keragaman di antara sampel acak sederhana yang diambil dari populasiyang sama disebut keragaman pengambilan sampel (sampling variability), dan sebaranpeluang yang mencirikan beberapa aspek keragaman pengambilan sampel disebut sebaranpengambilan sampel (sampling variability). Sebaran pengambilan sampel ini memung-kinkan kita untuk membuat pernyataan objektif tentang parameter populasi tanpa harusmengukur setiap objek di dalam populasi.

Contoh 6.0.1. (Glover and Mitchell, 2002). Misalkan populasi Paritus sp., hewan miripcacing, yang hidup di bawah batu, potongan kayu, dan dedaunan di daerah tropis dansubtropis memiliki panjang rata-rata 3,20 cm dan simpangan baku 0,31 cm. Ini adalahparameter populasi, yakni � = 3,20 cm dan � = 0,31. Jika sampel acak berukuran 25dikumpulkan dan rata-rata panjangnya dihitung, maka kemungkinan panjangnya tidaklah3,20 cm. Panjangnya mungkin saja 3,13 cm atau 3,35 cm atau nilai lainnya. Satu sampelini akan membangkitkan nilai rata-rata X̄ tunggal yang merupakan suatu ”tebakan” atau”dugaan” untuk �. Bagus tidaknya ”tebakan” ini tergantung pada proses pengambilansampel (keacakannya), bagaimana variabel atribut (�), dan berapa banyak upaya dilakukandalam pengambilan sampel (ukuran sampel).

Sekarang, misalkan kita mengembalikan sampel kita ke dalam populasi (pengambilansampel dengan pengembalian) dan mengambil sampel kedua berukuran 25 dan menghi-

45

Page 52: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 46

tung rata-rata sampel ini. Nilai X̄ yang baru kemungkinan tidak sama dengan X̄ sebelum-nya karena variabilitas sampel. Jika kita mengembalikan sampel kita ke dalam populasidan mengambil sampel yang ketiga, kita akan membangkitkan pendugaan ketiga untuk �secara bebas dalam bentuk X̄. Mengulangi proses pengambilan sampel ini secara terusmenerus akan membangkitkan ratusan bahkan ribuan nilai X̄ selama sampel yang diam-bil adalah acak dan memiliki ukuran yang sama n. Rata-rata sampel-sampel tersebut akanmembentuk konstruksi teoretis (theoretical construct) pengambilan sampel untuk rata-rata(sampling distribution for the mean).

Pada kehidupan nyata kita mengambil sampel dari populasi hanya sekali, namun kitamenyadari bahwa sampel kita berasal dari sebaran pengambilan sampel teoretis dari semuakemungkinan sampel yang mungkin dengan ukuran tertentu. Konsep sebaran pengambi-lan sampel memberikan hubungan antara keragaman pengambilan sampel dan peluang.Memilih suatu sampel acak adalah operasi kemungkinan (chance operation) dan mem-bangkitkan sebaran pengambilan sampel terdiri atas banyak pengulangan dari operasi ke-mungkinan, sehingga peluang melibatkan suatu sampel acak dapat diinterpretasikan se-bagai frekuensi relatif di dalam sebaran pengambilan sampel.

6.1 Sebaran rata-rata sampelSalah satu sebaran pengambilan sampel yang penting adalah rata-rata sampel. Langkah-langkah untuk membuat sebaran pengambilan sampel untuk rata-rata sampel adalah se-bagai berikut (Glover and Mitchell, 2002):

1. Dari populasi hingga berukuranN , ambil secara acak semua sampel sampel beruku-ran n.

2. Untuk setiap sampel hitung X̄.

3. Daftar semua nilai amatan X̄ yang berbeda dan frekuensi dari masing-masing nilaiyang berbeda ini.

Contoh 6.1.1. (Glover and Mitchell, 2002) Misalkan suatu populasi berukuran N = 6terdiri atas enam sisi dari mata dadu seimbang. Ruang sampelnya adalah {1, 2, 3, 4, 5, 6}.Populasi ini memiliki parameter

� =∑6

i=1Xi

N= 216= 3,5 (6.1)

dan

�2 =∑6

i=1(Xi − �2)N

= 17,56. (6.2)

Catatan sebaran populasi ini adalah sebaran seragam (kenapa?). Sebagai latihan dalammengonstruksi sebaran pengambilan sampel, misalkan kita akan mengambil semua sam-pel berukuran n = 2 yang mungkin dari populasi ini (berhubungan dengan pelemparandadu sebanyak dua kali). Untuk setiap sampel yang diambil kita akan menghitung X̄.Kita memiliki sampel yang mungkin berukuran 2 (dan rata-rata sampel) sebagai berikut.

Page 53: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 47

Lemparan II1,1 (1,0) 1,2 (1,5) 1,3 (2,0) 1,4 (2,5) 1,5 (3,0) 1,6 (3,5)2,1 (1,5) 2,2 (2,0) 2,3 (2,5) 2,4 (3,0) 2,5 (3,5) 2,6 (4,0)

Lemparan I 3,1 (2,0) 3,2 (2,5) 3,3 (3,0) 3,4 (3,5) 3,5 (4,0) 3,6 (4,5)4,1 (2,5) 4,2 (3,0) 4,3 (3,5) 4,4 (4,0) 4,5 (4,5) 4,6 (5,0)5,1 (3,0) 5,2 (3,5) 5,3 (4,0) 5,4 (4,5) 5,5 (4,0) 5,6 (5,5)6,1 (3,5) 6,2 (4,0) 6,3 (4,5) 6,4 (5,0) 6,5 (5,5) 6,6 (6,0)

Berdasarkan tabel di atas kita lihat bahwa rata-ratanya mulai 1 sampai 6. Kita juga bisamengamati beberapa sampel memiliki rata-rata yang sama, misalnya X̄ = 2 dimiliki oleh(1, 3) dan (3, 1). Selanjutnya apabila kita tabulasikan nilai-nilai X̄ dan frekuensi relatifnyamaka kita akan memperoleh tabel berikut.

X̄ frekuensi fi frekuensi relatif1,0 1 0,0281,5 2 0,0562,0 3 0,0832,5 4 0,1113,0 5 0,1393,5 6 0,1674,0 5 0,1394,5 4 0,1115,0 3 0,0835,5 2 0,0566,0 1 0,028Total 36 1

Apa saja karakteristik dari sebaran pengambilan sampel ini? Kita dapat menghitung

�X̄ =∑

fiX̄i∑

fi

= 1 × 1,0 +⋯ + 1 × 6,036

= 12636

= 3,5.

Jadi rata-rata X̄ sama dengan rata asli X, yaitu �X = �X̄ . Kita juga bisa menghitungvarians sampel:

�2X̄ =∑

fi(X̄ − �X̄)2∑

fi

=1 × (1,0 − 3,5)2 +⋯ + 1 × (6,0 − 3,5)

36

= 52,536

= 17,512

.

Page 54: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 48

Kita amati bahwa varians sebaran pengambilan sampel dari rata-rata tidak sama denganvarians populasi. Namun kita bisa lihat bahwa varians ini sama dengan varians populasi17,5∕6 dibagi 2. Secara umum untuk sampel berukuran n diperoleh

�2X̄ =�2Xn. (6.3)

Akar kuadrat dari �2X̄disebut galat baku rata-rata (standard error of the mean), atau galat

baku (standard error)�X̄ =

�X√

n. (6.4)

Untuk contoh di atas kita peroleh �X̄ =√

17,5∕12 = 1,21. Catatan: pada tabulasi diatas kita lihat bahwa sebaran X̄ bergerombol di tengah-tengah. Hal ini bertolak belakangdengan sebaran populasi yang seragam. Berdasarkan hal ini kita dapat merampatkan (gen-eralized) untuk pengambilan sampel dari populasi yang memiliki sebaran normal danpengambilan sampel dari populasi yang tidak memiliki sebaran normal.Kasus I.Apabila kita mengambil sampel dari populasi bersebaran normal dengan rata-rata�X dan varians �2X , sebaran rata-rata sampel (sebaran pengambilan sampel) akan memilikiatribut-atribut berikut:

1. Sebaran X̄ adalah normal.

2. Rata-rata �X̄ dari X̄ akan sama dengan �X (rata-rata populasi).

3. Varians sebaran X̄, yaitu �2X̄akan sama dengan �2X∕n.

Kasus II. Apabila kita mengambil sampel dari populasi yang memiliki sebaran tidak nor-mal dengan rata-rata �X dan varians �2X , sebaran rata-rata sampel akan memiliki atribut-atribut berikut:

1. Sebaran X̄ akan mendekati normal. Semakin besar sampel semakin dekat ke se-baran normal (biasanya sampel 30 atau lebih). Sifat ini dikenal sebagai TeoremaLimit Pusat (Central Limit Theorem).

2. Rata-rata sebaran X̄ yaitu �X̄ akan sama dengan �X ,

3. Varians dari sebaran X̄ yaitu �2X̄akan sama dengan �2X∕n.

Contoh 6.1.2. Rata-rata konsentrasi kolesterol darah pada populasi dalam jumlah besarpria dewasa umur 50–60 adalah 200 mg/dl dengan simpangan baku 20 mg/dl. Diang-gap pengukuran kolesterol bersebaran normal. Berapakah peluang bahwa 100 pria darikelompok umur ini akan memiliki kolesterol di bawah 204 mg/dl?Penyelesaian: Berdasarkan informasi soal kita peroleh �X̄ = �X = 200mg∕dl dan

�X̄ =�X√

n= 20

100= 2,0 mg/dl.

MengingatX berdistribusi normal X̄ juga berdistribusi normal (Kenapa?). Dengan trans-formasi

Z =X̄ − �X̄�X̄

=X̄ − �X̄�X√

n

= 204 − 2002

= 2.

Page 55: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 49

SehinggaP (X̄ < 204) = P (Z < 2) = F (2) = 0,9772.

Pada contoh di atas kita lihat bahwa rata-rata populasi � dan varians populasi �2diberikan. Pada subbab berikut kita akanmenggunakan sampel, tanpa informasi parameter-parameter populasi, untuk menduga parameter populasi. Metode ini disebut selang keper-cayaan.

6.2 Selang kepercayaan untuk rata-rata populasiKita tahu bahwa rata-rata sampel X̄ adalah penduga tak bias untuk rata-rata populasi �.Nilai X̄ tidaklah sama karena variabilitas sampel. Kita juga tahu bahwa

X̄ − ��√

n

(6.5)

memiliki sebaran normal baku atau sebaran Z. Untuk sebaran pengambilan sampel daripeubah acak ini misalkan kita ingin penghitung P (a ≤ Z ≤ b) = 0,95. Berapa nilai adan b yang ”menangkap” pertengahan 95% dari sebaranZ? Jika F (a) = 0,025, dari tabelnormal baku kita peroleh a = −1,96. Jika F (b) = 0,975 kita peroleh b = 1,960. SehinggaP (−1,960 ≤ Z ≤ 1,960) = 0,95 atau nilai ±1,960 ”menangkap” pertengahan 95% darisebaran Z. Dengan demikian, kita akan menangkap 95% dari X̄ jika dan hanya jika

P(

−1,960 ≤ X̄ − ��√

n

≤ 1, 960)

= 0,95

atau

P(

X̄ − 1,960 �√

n≤ � ≤ X̄ + 1,960 �

n

)

= 0,95.

Ingat bahwa X̄ adalah peubah acak dengan sebaran sampel. Karena terdapat takhingganilai X̄, terdapat takhingga jumlah selang berbentuk

X̄ ± 1,96 �√

n. (6.6)

Untuk interval berbentuk kita katakan 95% percaya bahwa � terletak antara batas tersebutatau

C(

X̄ − 1,960 �√

n≤ � ≤ X̄ + 1,960 �

n

)

= 0,95.

Notasi C digunakan untuk selang kepercayaan. Begitu kita menghitung selang keper-cayaan, selang tersebut bisa berisi �, jadi P = 1, atau tidak berisi �, jadi P = 0. [Catatan:pada beberapa buku lain penulisan selang kepercayaan tetap mengunakan notasi P .]

Page 56: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 50

Contoh 6.2.1. Misalkan spesies tanaman tertentu memiliki varians tinggi 16 cm2. Di-ambil sampel sebanyak 25 kemudian diperoleh rata-rata tinggi 15 cm. Hitunglah selangkepercayaan 95% untuk rata-rata populasi.Penyelesaian: kita peroleh n = 25, X̄ = 15 cm, �2 = 16cm2 dan � = 4cm. Sehingga

C(

X̄ − 1,960 �√

n≤ � ≤ X̄ + 1,960 �

n

)

= C(

15 − 1,960 4√

25≤ � ≤ 15 + 1,960 4

25

)

= 0,95.

Sehingga kita peroleh batas bawahL = 13,432 cm dan batas atasU = 16,568 cm. Dengandemikian

C(13,432 cm ≤ � ≤ 16,568 cm) = 0,95.

Contoh 6.2.2 (Lanjutan Contoh 6.2.1). Bagaimana kalau sekarang kita lebih percaya lagi,katakanlah 99% bahwa kita telah mengikutkan � dalam selang kita?Penyelesaian: kalau kita lihat lagi P (a ≤ Z ≤ b) = 0,99. Cari a dan b sedemikianhingga F (a) = 0,005 dan F (b) = 0,995. Dari tabel normal kita peroleh a = −2,575 danb = 2,575. Dengan demikian selang kepercayaan kita adalah

C(

X̄ − 2,575 �√

n≤ � ≤ X̄ + 2,575 �

n

)

= 0,99.

Dengan demikian kita peroleh

L = 15 − 2,575 4√

25= 15 − 2,06 = 12,94 cm

danU = 15 + 2,575 4

25= 15 + 2,06 = 17,06 cm

Dengan demikianC(12,94 cm ≤ � ≤ 17,06 cm) = 0,95.

Berdasarkan contoh ini (membandingkan antara selang kepercayaan 99% dan 95% un-tuk sampel yang sama kita bisa lihat bahwa untuk lebih percaya dalam ”menangkap” �batasnya haruslah lebih jauh.

Pada praktiknya kita tidak mengetahui �2 sehingga kita akan akan menggunakan s,yaitu simpangan baku sampel. Berdasarkan Teorema Limit Pusat, sebaran pengambilansampel X̄ mendekati normal. Kita dapat menggunakan galat baku sampel (sample stan-dard error) dengan bentuk

s√

n(6.7)

sebagai penduga galat baku populasi�√

n. (6.8)

Sehingga apabila kita mengganti galat baku populasi dengan galat baku sampel, yaitu

X̄ − ��√

n

(6.9)

Page 57: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 51

diganti denganX̄ − �s√

n

. (6.10)

Sebaran pengambilan sampel 6.10 adalah sebaran t dengan derajat bebas n − 1. Secaraumum sebaran t dengan derajat bebas v dinyatakan oleh

f (x; v) =Γ(

v + 12

)

Γ(

v2

)

1√

v�1

(

1 +(

x2

v

))(v+1)∕2(6.11)

dengan −∞ < x <∞ dan v = 1,… .Nilai harapan sebaran t adalah EX = 0 dan variansnya adalah

var X = vv − 2

, v > 2.

Selang kepercayaan untuk rata-rata populasi � pada tingkat kepercayaan 1 − � adalah

C(

X̄ − t0s√

n≤ � ≤ X̄ + t0

s√

n

)

= 1 − �

Contoh 6.2.3 (Lanjutan Contoh 6.2.1). Sekarang misalkan tanpa informasi awal tentangtinggi tanaman, seorang ekologiwanmengambil sampel 25 tanaman danmengukur tingginya.Ekologiwan tersebut menemukan rata-rata sampel adalah 15 cm dan varians 16 cm2. Be-rapakah selang kepercayaan untuk rata-rata populasi �?Penyelesaian: dalam hal ini kita peroleh derajat bebas db = 25 − 1 = 24. Selang keper-cayaan yang akan kita cari adalah

C(

X̄ − t0s√

n≤ � ≤ X̄ + t0

s√

n

)

= 1 − 0,05.

Dari tabel kita peroleh ±t0 = 2,064. Sehingga kita dapatkan

L = 15 − 2,064 4√

25= 13,349 cm

danU = 15 + 2,064 4

25= 16,651 cm

Jadi ekologiwan tumbuhan percaya 95% bahwa rata-rata populasi untuk tanaman tersebutberada antara 13,349 dan 16,651 cm. Bagaimana kalau sang ekologiwan ingin selangkepercayaan 99%? Dengan cara serupa kita peroleh

L = 15 − 2,797 4√

25= 12,762 cm

danU = 15 + 2,797 4

25= 17,238 cm

Page 58: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 52

Apabila kita bandingkan selang kepercayaan (SK) 95% dan 99% untuk contoh-contohdi atas kita peroleh

SK 95% SK 99%Menggunakan z dan � [13,432; 16,568] [12,940; 17,060]Menggunakan t dan s [13,349; 16,651] [12,762; 17,238]

Kita lihat bahwa sebaran t memberikan selang kepercayaan yang lebih jauh jika diband-ingkan dengan sebaran normal. Namun, kita juga bisa amati bahwa penggunaan sebarant lebih realistik karena tidak ada asumsi parameter dan selang kepercayaan sepenuhnyaberdasarkan sampel yang dikumpulkan dan statistik-statistik seperti: X̄, s, dan n.

Catatan lihat (Glover and Mitchell, 2002): selang kepercayaan untuk rata-rata � darisuatu populasi adalah selang yang bisa kita hitung dengan peluang (yang diberikan) bahwaselang berisi � sebelum sampel diambil. Setelah sampel diambil dan selang dihitung,maka ada dua kemungkinan apakah berisi � (dengan peluang P = 1) atau tidak berisi �(dengan peluang P = 0).

6.3 Selang kepercayaan untuk varians populasiPada bagian sebelumnya kita telah menghitung selang kepercayaan untuk rata-rata pop-ulasi. Kita juga ingin memahami bagaimana varians populasi. Untuk setiap sampel kitabisa menghitung varians sampel s2. Namun, masing-masing sampel tentu akan mem-bangkitkan s2 yang berbeda-beda. Sebaran pengambilan sampel yang akan kita gunakanberbentuk

(n − 1)s2

�2(6.12)

Jika semua sampel berukuran n yang diambil dari populasi normal dengan varians �2 danuntuk setiap sampel ini nilai pada 6.12 dihitung dan nilai ini akan membentuk sebaranpengambilan sampel khi-kuadrat �2. Fungsi densitas khi-kuadrat dengan derajat bebas vdinyatakan oleh

f (x; v) = 1Γ(p∕2)2p∕2

xp∕2−1 exp(−x∕2), (6.13)

0 ≤ x < ∞, p = 1, 2,… . Nilai harapan dan varians sebaran khi-kuadrat adalah sebagaiberikut:

E(X) = v, (6.14)var(X) = 2v. (6.15)

Selang kepercayaan untuk varians populasi �2 pada tingkat 1 − � diberikan oleh

C(

(n − 1)s2

�21−�∕2≤ �2 ≤ (n − 1)s2

�2�∕2

)

= 1 − �. (6.16)

Contoh 6.3.1. Seorang ilmuwan hortikultura ingin mengembangkan varietas baru apel.Salah satu karakteristik yang ingin diteliti adalah keseragaman ukuran apel. Untukmenges-timasi variabilitas sang ilmuwanmengambil sampel berat 25 buahmatang danmenghitung

Page 59: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 53

varians sampel berat apel dan diperoleh s2 = 4,25g2. Hitunglah selang kepercayaan 95%dan 99% untuk varians populasi berdasarkan sampel tersebut.Penyelesaian: Selang kepercayaan 95% untuk varians populasi adalah

C(

(n − 1)s2

�21−0,025≤ �2 ≤ (n − 1)s2

�20,025

)

= 1 − 0,05. (6.17)

Dari tabel khi-kuadrat kita peroleh �20,975;24 = 39,4 dan �20,025;24 = 12,4. Sehingga kitaperoleh

L =(25 − 1)4,25

39, 4= 2,59 g2

danU =

(25 − 1)4,2512, 4

= 8,23 g2

Jadi selang kepercayaan 95% untuk varians populasi terletak di antara 2,59 dan 8,23 g2.

6.4 Sebaran Pengambilan Sampel Selisih Dua Rata-rata6.4.1 Varians DiketahuiMisalkan terdapat dua populasi. Populasi pertama dengan nilai tengah �1 dan varians �21dan populasi kedua dengan nilai tengah �2 dan varians �22 . Misalkan X̄1 menyatakan rata-rata dari sampel acak berukuran n1 dari populasi pertama dan X̄2menyatakan rata-rata darisampel acak berukuran n2 dari populasi kedua. Kedua populasi saling bebas. Distribusipengambilan sampel selisih dua rata-rata, X̄1 − X̄2, mendekati distribusi normal dengannilai tengah

�X̄1−X̄2 = �1 − �2 (6.18)

dan varians

�2X̄1−X̄2 =�21n1+�22n2. (6.19)

Dengan demikian,

Z =(X̄1 − X̄2) − (�1 − �2)√

(�21∕n1) + (�22∕n2)

. (6.20)

Contoh 6.4.1. Dua percobaan saling bebas dilakukan untuk membandingkan dua jeniscat berbeda. Delapan belas spesimen dicat menggunakan jenis A, dan waktu pengeringan(dalam jam) dicatat. Hal yang sama juga dilakukan untuk cat jenis B. Simpangan bakukeduanya diketahui 1 jam. Asumsikan bahwa rata-rata pengeringan sama untuk kedua je-nis cat. Hitunglah P (X̄1 − X̄2 > 1).

Penyelesaian: berdasarkan soal kita tahu bahwa nA = nB = 18 dan kita tahu bahwasebaran X̄1 − X̄2 menyebar normal dengan nilai tengah

�X̄A−X̄B= �A − �B = 0 (6.21)

Page 60: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 54

dan

�2X̄A−X̄B=�2AnA+�2BnB

= 118+ 118= 19. (6.22)

Kita tahu bahwa X̄1 − X̄2 = 1 sehingga bisa kita hitung

z =1 − (�A − �B)

1∕9= 1 − 0

1∕9= 3. (6.23)

SehinggaP (Z > 3) = 1 − P (Z < 3) = 1 − 0,9987 = 0,0013. (6.24)

6.4.2 Varians tidak diketahuiPada subbagian sebelumnya kita menggunakan asumsi bahwa varians diketahui. Nah,dalam banyak kasus varians tidaklah diketahui. Dalam hal ini ada dua kasus yang perludipertimbangkan. Pertama, varians populasi yang tidak diketahui sama atau dianggapsama, yaitu �21 = �22 . Pada kasus kedua, varians populasi tidak sama yakni �21 ≠ �22 .Untuk kasus pertama misalkan peubah acakX1 menyebar normal dengan rata-rata �1 danvarians �21 , yakni X1 ∼ N(�1, �21) dan peubah acak X2 berdistribusi normal dengan rata-rata �2 dan varians �22 , yakni X2 ∼ N(�2, �22). Maka selang kepercayaan 100(1 − �)%untuk selisih rata-rata populasi �1 − �2 diberikan oleh

C(

(X1−X2)−t�∕2,n1+n2−2sp

1n1+ 1n2

≤ �1−�2 ≤ (X1−X2)+t�∕2,n1+n2−2sp

1n1+ 1n2

)

= 1−�

(6.25)dalam hal ini estimasi gabungan varians (pool estimate of common variance) diperolehdengan mengkombinasikan dua varians sampel yakni,

s2p =(n1 − 1)s21 + (n2 − 1)s

22

n1 + n2 − 2. (6.26)

Untuk kasus kedua maka selang kepercayaan 100(1 − �)% diberikan oleh

C(

(X1−X2)−t�∕2,v

s21n1+s22n2

≤ �1−�2 ≤ (X1−X2)+t�∕2,v

s21n1+s22n2

)

= 1−� (6.27)

dengan derajat kebebasan t dinotasikan oleh v dengan

v =

(s21n1+s22n2

)2

(

s21∕n1)2

(

n1 − 1) +

(

s22∕n2)2

(

n2 − 1)

− 2. (6.28)

Contoh 6.4.2. Dua operator melakukan pengoperasian mesin yang sama. Akan didugaselisih rata-rata waktu pengoperasian mesin antara kedua operator. Tidak ada asumsi ten-tang apakah variabilitas waktu pengoperasian mesin kedua operator sama. Namun dapat

Page 61: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 55

dianggap distribusi waktu pengoperasianmesin adalah normal untuk kedua operator. Sam-pel acak berukuran 10 dari operator pertama memberikan rata-rata pengoperasian mesin4,2 menit dengan simpangan baku 0,5 menit. Suatu sampel acak berukuran 6 dari opera-tor kedua menghasilkan rata-rata pengoperasian mesin 5,1 menit dengan simpangan baku0,8. Carilah selang kepercayaan 95 persen untuk selisih rata-rata waktu mesin antara ke-dua operator.

Solusi. Untuk sampel operator pertama diperoleh n1 = 10, X1 = 4,2 dan s1 = 0, 5 danuntuk sampel operator kedua n2 = 6,X1 = 5,1, dan s2 = 0,8. Karena asumsi varians yangsama tidak ada, maka harus digunakan (6.27). Derajat kebebasan t sesuai dengan (6.28)adalah

v =

(

0, 2510

+ 0, 646

)2

(

0, 25∕10)2

(

9) +

(

0, 64∕6)2

(

5)

− 2

= 5,392798.

Dari tabel distribusi t kita ambil nilai pendekatan untuk v = 5 sehingga t�∕2,5 = 2,570582.Sehingga selang kepercayaan 95 persen untuk selisih waktu pengoperasian kedua operatoradalah −1,832759 ≤ �1 − �2 ≤ 0,0327588.

6.5 Selang Kepercayaan untuk ProporsiMisalkan parameter p adalah proporsi sukses dalam distribusi binomial. Estimator titikuntuk p adalah p̂, proporsi item yang tidakmemenuhi standar, yang diperoleh dari p̂ = x∕n,dengan x menyatakan jumlah item yang tidak memenuhi standar (rusak) dan n adalahbanyaknya percobaan atau item yang diambil sampelnya. Selang kepercayaan 100(1 − �)dua sisi untuk p, bila n besar diberikan oleh

p̂ −Z�∕2

p̂(1 − p̂)n

≤ p ≤ p̂ +Z�∕2

p̂(1 − p̂)n

. (6.29)

Untuk n yang kecil, tabel binomial harus digunakan untuk menentukan batas keper-cayaan p. Bila n besar dan p kecil (np < 5), maka gunakan pendekatan Poisson ke bino-mial. Jika n besar dan p tidak terlalu kecil atau besar (np ≥ 5, n(1−p) ≥ 5, maka distribusinormal memberikan pendekatan yang bagus ke distribusi binomial.

6.6 Selang Kepercayaan untuk Selisih Dua ProporsiBinomial

Misalkan sampel berukuran n1 diambil dari populasi binomial dengan parameter p1, se-mentara sampel berukuran n2 diambil dari populasi binomial dengan parameter p2. Untuk

Page 62: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 56

sampel besar berukuran n1 dan n2, maka selang kepercayaan 100(1 − �) untuk (p1 − p2)adalah

(p̂1−p̂2)−Z�∕2

p̂1(1 − p̂1)n1

+p̂2(1 − p̂2)

n2≤ p1−p2 ≤ (p̂1−p̂2)+Z�∕2

p̂1(1 − p̂1)n1

+p̂2(1 − p̂2)

n2(6.30)

Contoh 6.6.1. Dua operator melakukan pelapisan plastik pada plexiglass. Kita ingin men-duga selisih proporsi produk yang tidak memenuhi standar yang diproduksi oleh dua oper-ator. Sampel acak berukuran 100 dari operator pertama menunjukkan bahwa 6 buah tidakmemenuhi standar. Kemudian sampel acak sebanyak 200 diambil dari operator kedua,menunjukkan bahwa 8 buah tidak memenuhi standar. Hitunglah selang kepercayaan 90persen untuk selisih proporsi dan bagian yang tidak memenuhi standar yang diproduksioleh kedua operator.

Solusi. Untuk sampel pertama kita punya n1 = 100, x1 = 6. Untuk sampel keduakita punya n2 = 200, x2 = 8. Dimana x1 dan x2 adalah banyaknya bagian yang tidakmemenuhi standar yang diproduksi oleh operator 1 dan 2. Kemudian (1 − �) = 0, 90.Dari tabel distribusi normal standar Z0,05 = 1, 645 (ekor kanan dari 0,05). Kemudian kitaperoleh p̂1 = 6∕100 = 0, 06 and p̂2 = 8∕200 = 0, 04. Sehingga selang kepercayaan 90persen untuk bagian yang tidak memenuhi standar adalah

−0, 025 ≤ p1 − p2 ≤ 0, 065.

6.7 Selang Kepercayaan untuk Rasio Dua VariansMisalkan terdapat suatu peubah acakX1 yang berdistribusi normal dengan rata-rata �1 danvarians �21 dan peubah acak X2 yang berdistribusi normal dengan rata-rata �2 dan varians�22 . Suatu sampel acak berukuran n1 diambil dari populasi pertama dan menghasilkanvariansi sampel s21. Kemudian sampel acak berukuran n2 diambil dari populasi kedua danmenghasilkan variansi sampel s22. Rasio

s21∕�21

s22∕�22

∼ Fn1−1,n2−1. (6.31)

Selang kepercayaan 100(1 − �)% dua sisi untuk �21∕�22 diberikan oleh

C(s21s22F1−�∕2,n2−1,n1−1 ≤

�21�22

≤s21s22F�∕2,n2−1,n1−1

)

= 1 − �. (6.32)

Catatan terdapat hubungan F1−�,u,v = 1∕F�,u,v jika tabel yang digunakan berbeda.

Contoh 6.7.1. Waktu perakitan chassis suatu model televisi terntentu diamati untuk duaoperator. Sampel acak berukuran 10 rakitan dari operator pertama memberikan rata-ratawaktu perakitan 22 menit dengan simpangan baku 3,5 menit. Kemudian sampel acak8 rakitan dari operator kedua memberikan rata-rata waktu perakitan 20,4 menit dengansimpangan baku 2,2 menit. Hitunglah selang kepercayaan 95 persen untuk rasio variansiwaktu perakitan untuk kedua operator.

Page 63: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 6. SEBARAN PENGAMBILAN SAMPEL 57

Solusi. Kita peroleh n1 = 10, X1 = 22, s1 = 3, 5, n2 = 8, X2 = 20, 4 dan s2 = 2, 2.Dari tabel distribusi F diperoleh F0,025,9,7 = 4, 82 dan F0,025,7,9 = 4, 20. Sehingga selangkepercayaan 95 persen untuk rasio dua varians menjadi 0, 525 ≤ �21∕�

22 ≤ 10, 630.

Page 64: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 7Uji Hipotesis

Sebelum kita membicarakan tentang uji hipotesis perhatikan contoh kasus berikut. Mis-alkan Anda pergi ke supermarket dan ingin membeli satu kardus minuman berkarbonasi.Sang pramuniaga mengklaim bahwa berat minuman tersebut adalah 10 kg/kardus. Andamempunyai empat pandangan terhadap klaim sang pramuniaga:

1. Sang pramuniaga jujur dan � = 10 kg.

2. Sang pramuniaga adalah orang yang konservatif dan terdapat lebih dari 10 kg/kardus:� > 10 kg.

3. Sang pramuniaga curang dan berat kurang dari 10 kg/kardus: � < 10 kg.

4. Sang pramuniaga orang baru, jadi sama halnya seperti Anda, tidak tahu berapa sebe-narnya berat per kardus; klaim dari sang pramuniaga bisa tinggi atau rendah, � ≠ 10.

Jika menurut Anda sang pramuniaga adalah orang yang jujur, Anda langsung membeliminuman berkarbonasi tersebut dan pergi tanpa bertanya lebih lanjut. Namun, bagaimanadengan kasus 2–4? Anda mungkin menganggap sang pramuniaga konservatif, curang,atau bahkan tidak tahu sama sekali?

Kasus I: Menguji bahwa sang pramuniaga konservatifAnda berpraduga, setelah melihat penampilan sang pramuniaga, bahwa sang pramuni-

aga konservatif tentang klaim berat kardus tersebut. Berdasarkan fakta ini Anda mempun-yai hipotesis null (null hypothesis), atau H0. Lebih tepatnya untuk kasus ini Anda punyaH0 ∶ � = 10 kg. Karena Anda ingin meneliti atau menguji kepercayaan Anda, dalamhal ini Anda percaya bahwa � > 10 kg maka Anda mempunyai hipotesis alternatif (al-ternative hypothesis) atau hipotesis riset (research hypothesis). Dengan demikian Andamempunyai hipotesis berbentuk:

H0 ∶ � ≤ 10 kgHa ∶ � > 10 kg. (7.1)

Hipotesis yang telah Anda bentuk di atas merupakan kemungkinan saling hindar (mutuallyexclusive) dan termasuk semua/terangkum (all-inclusive). Jadi salah dari hipotesisH0 atauHa adalah benar, tetapi tidak kedua-duanya. Mengingat kedua hipotesis tersebut adalahsaling hindar dan terangkum, maka kita berada pada situasi salah satu benar dan yang lainsecara otomatis salah. Sehingga terdapat dua kasus:

58

Page 65: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 7. UJI HIPOTESIS 59

1. Pada saatH0 benar, makaHa salah. Jika kitamenerimaH0maka kita telahmelakukanhal yang benar. Tetapi jika kita menolakH0, maka kita telah melakukan kesalahan.Kesalahan ini disebut kesalahan tipe I. Peluang melakukan kesalahan tipe I yaitupeluang menolakH0 yang benar ditulis sebagai �. Nilai � disebut taraf (level) dariuji.

2. Pada saat H0 salah, maka Ha benar. Jika kita menerima H0 maka kita melakukankesalahan. Jika kita menolak H0, kita telah melakukan hal yang benar. Kesalahanini disebut kesalahan tipe II. Peluang melakukan kesalahan tipe II yaitu peluangmenerima hipotesis null yang salah. Peluang ini dinyatakan sebagai �.

Kembali kepada kasus di atas, bagaimana cara Anda menguji hipotesis tersebut? Salahsatu cara adalah denganmengambil sampel, katakanlah sebanyak 25 kardus. Anda kosongkankardus, kemudian masukkan beberapa botol minuman berkarbonasi tersebut. Selanjut-nya Anda timbang dan catat beratnya. Misalkan setelah Anda menimbang berat masing-masing 25 kardus tersebut diperoleh X̄ = 10,36 dan diasumsikan � = 1 kg. Ingatbahwa berat masing-masing botol minuman berkarbonasi mungkin tidak bersebaran nor-mal, tetapi X̄ mendekati normal (kenapa?). Kita juga tahu bahwa menurut Teorema LimitPusat

Z =X̄ − ��√

n

(7.2)

memiliki sebaran normal baku. Kita peroleh

Z = 10,36 − 101

25

= 0,360,20

= 1,8. (7.3)

Untuk menguji hipotesis kita, maka kita tertarik untuk apa yang kita sebut statistik uji,yaitu menggunakan Z seperti di atas. Hipotesis null kita, tidak akan diterima (ditolak)apabila

Z ≥ Z� (7.4)

dengan � adalah tingkat kepercayaan. Persamaan (7.4) disebut daerah kritis (critical re-gion). Misalkan kita menggunakan � = 0,05, kita peroleh nilai Z0,05 = 1,645. Daripersamaan 7.3 kita peroleh ternyata

Z = 1,8 ≥ Z0,05 = 1,645. (7.5)

Dengan demikian kita tidak menerima (menolak)H0.

Kasus II: Menguji bahwa sang pramuniaga curangUntuk kasus ini kita mempunya hipotesis dengan bentuk seperti berikut:

H0 ∶ � ≥ 10 kgHa ∶ � < 10 kg. (7.6)

Page 66: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 7. UJI HIPOTESIS 60

Masih dengan sampel yang sama setelah Andamenimbang berat masing-masing 25 kardustersebut diperoleh X̄ = 10,36 dan diasumsikan � = 1 kg. Bagaimana cara kitamenghitungdaerah kritis untuk hipotesis ini? Dengan cara serupa daerah kritis untuk uji di atas adalah

Z ≤ −Z�. (7.7)

Untuk � = 0,05, hipotesis H0 akan ditolak apabila Z ≤ −1,645. Kita lihat bahwaZ = 1,8 > −1,645. Jadi kita menerima hipotesisH0.

Kasus III: Sang pramuniaga tidak punya petunjukSeperti halnya Anda sebagai calon pembeli, sang pramuniaga tidak tahu sebenarnya

berapa berat minuman berkarbonasi tersebut per kardus. Pada kasus seperti ini hipotesisAnda berbentuk seperti berikut:

H0 ∶ � = 10 kgHa ∶ � ≠ 10 kg. (7.8)

Masih dengan sampel yang sama setelah Andamenimbang berat masing-masing 25 kardustersebut diperoleh X̄ = 10,36 dan diasumsikan � = 1 kg. Bagaimana cara kitamenghitungdaerah kritis untuk hipotesis ini? Dengan cara serupa daerah kritis untuk uji di atas adalah

|Z| ≥ Z�∕2. (7.9)

Untuk � = 0,05, hipotesis H0 akan ditolak apabila Z ≥ 1,960. Kita lihat bahwa Z =1,8 < 1,960. Jadi kita menerima hipotesisH0.

7.1 Langkah-langkah uji hipotesisPada subbab sebelumnya kita telah melakukan pengujian hipotesis (untuk rata-rata popu-lasi). Secara umum apa yang telah kita lakukan adalah sebagai berikut:

1. Menyatakan masalah penelitian. Misalnya haruskah kita membeli minuman berkar-bonasi?

2. Merumuskan hipotesis null (H0) dan hipotesis alternatif (Ha).

3. Memilih tingkat atau taraf signifikansi �.

4. Memilih statistik uji, misalnya Z.

5. Menghitung nilai statistik uji.

6. Menghitung nilai kritis (critical region).

7. Membandingkan nilai statistik uji dan nilai kritis.

Page 67: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 7. UJI HIPOTESIS 61

H0 H1 Daerah kritis

� ≤ �0 � > �0 Z ≥ Z�� ≥ �0 � < �0 Z ≤ −Z�� = �0 � ≠ �0 |Z| ≥ Z�∕2

7.2 Uji hipotesis untuk rata-rataApa yang telah kita lakukan pada contoh kasus minuman berkarbonasi adalah uji hipotesissatu sampel untuk rata-rata dengan varians (populasi) diketahui. Jika kita rangkum, kitaperoleh tabel berikut:

Namun, pada praktiknya varians populasi tidak diketahui. Dengan demikian kita akanmenggunakan varians sampel dan statistik uji yang digunakan adalah

T =X̄ − �s√

n

(7.10)

memiliki sebaran t dengan derajat bebas n− 1. Sehingga dengan cara serupa kita peroleh

H0 H1 Daerah kritis� ≤ �0 � > �0 T ≥ t�;n−1� ≥ �0 � < �0 T ≤ −t�;n−1� = �0 � ≠ �0 |T | ≥ t�∕2;n−1

Contoh 7.2.1 (Glover andMitchell (2002)). Seorang ahli ekologi hutanmempelajari reger-enasi komunitas hutan hujan dalam lubang yang disebabkan oleh jatuhnya pohon be-sar pada waktu hujan dan mencatat Dendrocnide excelsa akan tumbuh 1,5 m/tahun de-ngan sinar matahari langsung pada lubang tersebut. Dalam studinya sang ahli ekologimengambil sembilan spesimen dari species ini dan mengukurnya pada tahun 1998 danmengukurnya lagi satu tahun kemudian. Berikut adalah data perubahan tinggi untuk sem-bilan spesimen tersebut. Apakah datanya mendukung bahwa rata-rata spesies ini akantumbuh 1,5 m/tahun dalam sinar matahari langsung?

1,9 2,5 1,6 2,0 1,5 2,7 1,9 1,0 2,0.

Penyelesaian: Hipotesis kita berbentuk:

H0 ∶ � = 1,5 m/tahunH1 ∶ � ≠ 1,5 m/tahun.

Dari spesimen di atas kita peroleh: n = 9, X̄ = 1,9, dan s = 0,51, sehingga

T = 1,9 − 1,50,51√

9

= 2,35. (7.11)

Menggunakan � = 0,05 dan dari tabel kita peroleh t0,025;8 = 2,306. Selanjutnya kita lihatbahwa T = 2,35 ≥ 2,306; sehingga, hipotesis null kita ditolak.

Page 68: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

BAB 7. UJI HIPOTESIS 62

7.3 Uji hipotesis untuk variansSeringkali penelitian kita bukanlah tentang ukuran pemusatan (dalam hal ini rata-rata), na-mun tentang variabilitas atau penyebaran/pemencaran. Jadi hipotesis kita dapat berbentuk

H0 ∶ �2 ≥ 16 kg2

Ha ∶ �2 < 16 kg2

misalnya atau variasi lain seperti uji hipotesis tentang rata-rata. Statistik uji yang kitagunakan berbentuk

U =(n − 1)s2

�2(7.12)

yang bersebaran khi-kuadrat dengan derajat bebas n−1. Hipotesis dan daerah kritis untukuji varians adalah sebagai berikut:

H0 H1 Daerah kritis�2 ≤ �20 �2 > �20 U ≥ �2�;n−1�2 ≥ �20 �2 < �20 U ≤ �21−�;n−1�2 = �20 �2 ≠ �20 U ≥ �2�∕2;n−1

atau U ≤ �21−�∕2;n−1

Contoh 7.3.1. Populasi ikan duyung (dugong) memiliki berat rata-rata 350 kg dan varians900 kg2. Suatu sampel 25 ikan duyung Moreton Bay memiliki varians 1600 kg2. Apakahpopulasi ikan duyung di Moreton Bay lebih bervariasi dibandingkan populasi standar?Penyelesaian: Hipotesis kita berbentuk:

H0 ∶ �2 ≤ 900 kg2

Ha ∶ �2 > 900 kg2

Kita punya n = 25 dan s2 = 1600 kg2. Selanjutnya

U =(25 − 1)s2

�2= 42,67. (7.13)

Untuk tingkat signifikasi � = 5% kita peroleh �20,025;24 = 12,4.

Page 69: simdos.unud.ac.id...BAB1 KonsepDasarStatistika 1.1 LatarBelakang Sebelumkitamembahasapaitustatistika,kitaterlebihdahulumembahascaraberpikir deduktifdaninduktifsertametodeilmiah1 ...

DAFTAR PUSTAKA

Robert C. Elston and William D. Johnson. Essentials of Biostatistics. F. A. Davis Com-pany, Philadelphia, second edition, 1994.

Thomas Glover and Kevin Mitchell. An Introduction to Biostatistics. McGraw-Hill,Boston, 2002.

Todd G. Nick. Topics in Biostatistics, volume 404 of Methods in Molecular Biology,chapter Desciptive Statistics, pages 33–52. Humana Press, Totowa, New Jersey, 2007.

R Lyman Ott and Michael Longnecker. An Introduction to Statistical Methods and DataAnalysis. Duxbury, Pacific Groove, California, fifth edition, 2001.

Roxy Peck, Chris Olsen, and Jay Devore. Introduction to Statistics and Data Analysis.Thomson Brooks/Cole, Australia, third edition, 2008.

Richard L Scheaffer. Introduction to Probability and Its Applications. Duxbury, Belmont,California, second edition, 1995.

T D V Swinscow and M J Campbell. Statistics at Square One. BMJ Books, London, tenthedition, 2002.

Stephen BVardeman and JMarcus Jobe. Basic Engineering Data Collection and Analysis.Duxbury, Pacific Groove, California, 2001.

Richard D De Veaux, Paul F Velleman, and David E Bock. Stats: Data and Models.Pearson Addison Wesley, Boston, second edition, 2008.

Geoffrey Vining and Scott Kowalski. Statistical Methods for Engineers. ThomsonBrooks/Cole, Belmont, California, second edition, 2006.

63