Top Banner
MODUL PRAKTIKUM SATISTIKA INDUSTRI UNIVERSITAS LANGLANGBUANA MODUL 1 i
190

MODUL PRAKTIKUM SATISTIKA INDUSTRI UNLA.doc

Nov 19, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

PAGE

MODUL PRAKTIKUM SATISTIKA INDUSTRI

UNIVERSITAS LANGLANGBUANA

DAFTAR ISI

iiiKATA PENGANTAR

ivDAFTAR ISI

1-11PENGENALAN MINITAB 15, DATA, DAN TEKNIK PENGAMBILAN SAMPEL

1-21.1 Menu-menu pada Minitab 15

1-161.2. Mengenal Data

1-161.2.1 Populasi dan sampel

1-171.2.2 Skala pengukuran

1-191.3 Metode Sampling

1-211.4 Aplikasi dengan minitab

2-12STATISTIKA DESKRIPTIF

2-22.1 Ukuran Pemusatan

2-22.2 Ukuran Penyebaran

2-52.5 Penyajian dalam Bentuk Grafik

2-62.6 Aplikasi dengan minitab

3-13KENORMALAN DATA

3-23.1 Distribusi normal

3-33.2 Statistik uji kenormalan

3-43.3 Aplikasi dengan minitab

4-14TRANSFORMASI DATA

4-24.1 Transformasi untuk satu angkatan data

4-44.2 Transformasi untuk beberapa angkatan data (menyamakan sebaran)

4-54.3Aplikasi Minitab

5-15UJI HIPOTESIS STATISTIK DAN PROPORSI

5-25.1 Hipotesis statistik

5-35.1.1 Pengujian hipotesis untuk satu nilai tengah

5-55.1.2 Pengujian hipotesis untuk selisih dua nilai tengah

5-75.1.3Aplikasi dengan minitab

5-135.2 Uji proporsi

5-135.2.1 Uji terhadap satu nilai proporsi

5-155.2.2Aplikasi dengan Minitab

5-185.2.3 Pendekatan normal baku untuk uji terhadap satu nilai proporsi

5-195.2.4Aplikasi dengan Minitab

5-215.2.5 Pengujian perbandingan dua proporsi

5-225.2.6Aplikasi dengan Minitab

6-16ANALISIS VARIANSI

6-26.1 Asumsi-asumsi pada analisis variansi

6-26.2 Uji Kesamaan Ragam

6-36.3 Tabel analisis variansi

7-17REGRESI LINIER DAN NON-LINIER SEDERHANA

7-27.1 Regresi

7-27.1.1 Model untuk regresi linier sederhana

7-47.1.2 Model regresi non linier

7-47.1.2.1 Model eksponensial

7-57.1.2.2 Model geometrik (power )

19DAFTAR PUSTAKA

1 PENGENALAN MINITAB 15, DATA, DAN TEKNIK PENGAMBILAN SAMPELOverview

Modul ini memberikan pengenalan singkat tentang software Minitab 15 kepada mahasiswa. Pengenalan tentang menu diberikan diawal, sehingga diharapkan mahasiswa memiliki gambaran umum tentang penggunaan software ini. Setelah dapat menjalankan software ini, mahasiswa akan dikenalkan pada beberapa jenis data berdasarkan skala pengukurannya. Pada tahap akhir, mahasiswa akan diajarkan tentang pengambilan sampel dari populasi dengan menggunakan beberapa teknik sampling

Tujuan

1. Mahasiswa mendapatkan gambaran singkat tentang software Minitab2. Mahasiswa dapat membedakan data berdasarkan skala pengukurannnya

3. Mahasiswa dapat melakukan pengambilan data sampel berdasarkan data populasi dengan menggunakan beberapa metode sampling

1.1 Menu-menu pada Minitab 15

Pada software minitab, tampilannya ada 2, yaitu windows worksheet dan windows session. Worksheet merupakan tempat untuk mengetikkan data dan menampilkan hasil pengolahan data. Sedangkan session merupakan tempat untuk menampilkan semua perintah-perintah (command-command) yang telah kita lakukan dalam bentuk program dan hasil dari pengolahan data yang tidak dapat ditampilkan pada worksheet. Adapun tampilan minitab sebagai berikut :

Adapun menu-menu pada minitab 15 yaitu :

1. File

Pada menu file terdapat sub-sub menu antara lain :

New : menampilkan worksheet baru

Open project : menampilkan data yang telah disimpan pada file kita. Di bawah open project, terdapat save projects, save projects as, project description.

Open worksheet : menampilkan data yang telah disimpan dan disediakan software minitab. Di bawah sub menu ini, terdapat save worksheet, save worksheet as.

Query database :

Open graph : membuka grafik yang telah disimpan

Other file : membuka data dari file lain

Print session window : mencetak tampilan pada session.

Print setup : mencetak dengan pengaturan tampilan pada worksheet dan session.

Exit : Keluar dari minitab

Adapun tampilan dari menu file sebagai berikut :

2. Edit

Sub-sub menu pada menu edit adalah :

undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi n)

redo : kembali ke pekerjaan ke- n+1 (bila kita diposisi n) Clear cells : membersihkan data pada sel-sel worksheet

Delete cells : menghapus sel-sel

Copy cells : menyalin data pada sel

Cut cells : memotong sel (menyalin dan menghapus) Worksheet link : memindahkan data yang telah disalin baik dari sel, atau file minitab atau word, excel, dan lain-lain.

Select all cells : memilih atau menyorot semua data pada sel-sel untuk pengolahan

Edit last dialog : mengedit dialog terakhir

Command line editor : digunakan untuk mengeksekusi perintah secara cepat atau mengekseksekusi ulang atau mengedit perintah yang digunakan pada sesi sebelumnya.

3. Data

Menu data berisi perintah-perintah menampilkan data. Sub-sub menu yang terdapat pada menu data yaitu :

Subset worksheet : menampilkan sebagian worksheet

Split worksheet : membagi worksheet menjadi beberapa worksheet

Merge worksheet : menggabungkan beberapa worksheet

Sort : mengurutkan data (mengurutkan suatu kolom berdasarkan kolom lainnya )

Rank : merangking data (membuat rangking suatu kolom)

Delete rows : menghapus baris

Erase variabels : menghapus variabel-variabel

Copy columns : mengkopi kolom

Stack/unstack : menggabung data pada kolom yang berbeda menjadi satu kolom/ memisahkan data pada satu kolom menjadi beberapa kolom berdasarkan kriteria tertentu

Code : mengkonversi data (numerik ke numerik, numerik ke teks dsb)

Change data type : merubah tipe data

Extract from Date/Time : ekstrak data numerik ke text atau sebaliknya

Concatenate : menggabung dua atau lebih kolom yang berisi data text menjadi satu kolom, syarat penjang kolom sama.

Display data : menampilkan data

4. Calc (calculation)

Pada menu calc terdapat sub-sub menu :

Calculator : untuk melakukan perhitungan (penjumlahan, perkalian, pembagian, sinus, maksimum, eksponen, dan lain-lain)

Column statistics : menghitung ukuran-ukuran statistik dari suatu kolom

Row statistics : menghitung ukuran-ukuran statistik dari suatu baris

Standardize : menormalisasikan data

Make patterned data : membuat suatu kolom(data) dengan pola tertentu

Make mesh data : Membuat sebuah fungsi dua dimensi seperti permukaan berdasarkan pasangan nilai x dan y

Make indicator variables : membuat variabel dummy untuk data kualitatif

Set base : menetapkan titik awal untuk pembangkitan data acak. Bila kita tidak mengeset titik tersebut, maka titik tersebut akan ditentukan oleh minitab.

Random data : membangkitkan data acak dari berbagai distribusi

Probability distributions : menghitung peluang dan distribusi kumulatif peluang dan inversnya dari berbagai distribusi peluang.

Matrices : merupakan sub menu untuk menghitung matriks dan operasi-operasinya

Adapun tampilan menu calc adalah

5. Menu Stat

Sub-sub menu pada menu stat adalah :

Fit interceps : mendefault intersep pada persamaan regresi

Basic statistics : a) descriptiv statistics : menampilkan ukuran-ukuran statistics, seperti mean, median, trimean, standart deviasi, kuartil, maksimum dan minimum, b) uji hipotesis 1 sampel, 2 sampel , c) correlation, d) covariance, e) normallity test

Regression : mencari persamaan regresi serta analisisnya, baik regresi linier maupun non linier untuk kuantitatif maupun kualitatif

Anova : menganalisis perbedaan lebih dari dua populasi berdasarkan nilai ragam

DOE : membuat desain rancangan percobaan faktorial

Control charts : membuat bagan-bagan kendali

Quality tools : mengalisis data untuk pengendalian kualitas

Reliability/survival : membuat plot untuk analisis kehandalan sistem

Multivariate : menganalisis data banyak peubah

Time series : menganalisis data deret waktu untuk peramalan

Tables : membuat tabel kontingensi dan analisis korespondensi

Nonparametrik : menganalisis data kualitatif tanpa asumsi distribusi tertentu

EDA (Eksploratory Data Analysis) : memahami dan mengalisis data melalui diagram dahan daun, box plot, garis resisten, dll

Power and sample size : digunakan untuk menghitung power (peluang kita akan menolak H0 ketika ia salah), ukuran sampel, perbedaan minimum (ditampilkan sebagai nilai proporsi alternatif) pada uji satu proporsi.

Tampilan menu stat adalah sebagai berikut :

6. Menu Graph

Pada menu graph berisi sub-sub menu seperti pada tampilan di bawah yang digunakan untuk membuat grafik-grafik seperti histogram, diagram lingkaran, plot, countur, plot untuk data time series, box plot, diagram dahan daun. Untuk grafik-grafik tertentu dapat ditampilkan dalam dua dimensi maupun tiga dimensi.

7. Menu Editor

Berikut adalah sub-sub menu editor pada worksheet :

Next column : memindahkan kursor ke kolom berikutnya

Go to active cell : memindahkan kursor ke sell yang aktif

Format column : memformat kolom dalam numerik, tanggal, text.

Column : mengatur ukuran-ukuran kolom

Formulas : menampilkan formula-formula ke kolom dan menghitung formula secara otomatis.

Worksheet : mengedit sel yang sedang aktif dan merubah arah inputan

Define custom list : mengurutkan data

Clipboard setting : merubah setting untuk data hilang

Adapun tampilan menu editor adalah :

Berikut adalah sub-sub menu pada menu editor session :

Next command : memindahkan kursor ke command berikutnya

Previous command : memindahkan kursor ke command sebelumnya

Enable command language : menampilkan bahasa pemrograman yang dieksekusi , MTB >

Output editable : mengeset tampilan output hanya dapat di baca

Find : mencari kata tertentu dalam lingkup session

Replace : mencari kata tertentu dan menggantinya dengan kata lain dalam lingkup session

Apply Font : command font untuk memberlakukan pemilihan font untuk I/O, title, command.

8. Tools

Adapun sub-submenu pada menu tools adalah

Microsoft Calculator : Menampilkan menu calculator microsoft

Notepad : Menampilkan notepad

Windows Explorer : Menampilkan menu windows explorer

Toolbars : Untuk men-setting tool tool yang ingin ditampilkan atau tidak

Status Bar : Status bar terletak dibagian bawah layar dan menampilkan pesan yang menjelaskan item menu dan toolbars yang saat ini sedang aktif.

Customize : Digunakan untuk mengedit/menambah/menampilkan shortcut perintah (command), Toolbars, tool dan lain-lain pada Minitab

Options : Digunakan untuk merubah dan menyimpan settingan standar untuk berbagai macam operasi

Manage Profiles :Digunakan untuk membuat, menghapus, mengaktifkan atau menonaktifkan satu atau beberapa profil termasuk mengubah urutan nya.

File Security :digunakan untuk melindungi file proyek dari pihak lain

Tampilan menu tools adalah

9. Menu Windows

Sub-sub menu pada menu windows digunakan untuk mengatur tampilan dari windows minitab dan menyimpan data, session, grafik yang telah dibuat untuk sementara, yaitu :

10. Menu Help

Menu ini digunakan untuk membantu user, apabila terdapat kesulitan waktu menggunakan minitab, baik masalah teori, maupun commandnya.

1.2. Mengenal Data

1.2.1 Populasi dan sampel

Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus persen berhubungan dengan data. Data dalam bidang statistika merupakan keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis. Sedangkan data itu sendiri merupakan keterangan yang menggambarkan kondisi saat itu.

Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan 2) data sekunder. Data primer adalah keteranngan atau informasi secara umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data sekunder merupakan data yang diambil dari penelitian orang lain pada suatu publikasi.

Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari pengambilan sampel adalah :

1. Waktu

Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat dipilih sebagai alternatif pengambilan data.

2. Biaya

Untuk penelitian mengenai suatu komponen yang harganya mahal, bila pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar. Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel.

3. Populasi tidak pasti

Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang orang berpenyakit flu burung, maka kita akan kesulitan menentukan populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang kena flu burung atau tidak. Sehingga pengambilan sampel perlu dilakukan yaitu pasien flu burung pada suatu rumah sakit.

4. Ketelitian

Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya dan waktu penelitian terbatas, maka jumlah tenaga yang membantu penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya berpengaruh pada tingkat ketelitian.

1.2.2 Skala pengukuran

Skala pengukuran merupakan bagian yang paling mendekati pengukuran data baik secara diskret maupun kontinu. Skala ini sangat penting, karena berkaitan dengan pemilihan teknik analisis statistika yang sangat bergantung pada sifat data dan skala pengukuran yang digunakan. Ditinjau berdasarkan skala pengukurannya, data dapat dibedakan menjadi beberapa kelompok, yaitu ( dari yang terendah sampai yang tertinggi ) :

a. Skala Nominal

Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak memiliki tingkatan. Satu satunya operator matematika yang berlaku adalah persamaan dan pertidaksamaan.

Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan sebagainya.

b. Skala Ordinal

Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan lebih dari.

Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai huruf, peserta kontes kecantikan, jenis komputer dan sebagainya.

c. Skala Interval

Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu 30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya ( tidak ada).

Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0 bukan berarti tidak ada tahun.

d. Skala Rasio

Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya ( tidak ada ).

Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya.

Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan tidak dapat ditentukan ukuran ( ukuran statistik seperti mean, standard deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan statistika nonparametrik. Sedangkan data yang berskala interval atau Rasio dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat dilakukan pada data dengan kedua skala terakhir ini relatif sama.

1.3 Metode Sampling

Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling (metode pengambilan sampel ) yaitu :

1. Acak sederhana

Pada metode ini, pertama kita tentukan populasi yang akan diambil sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan jumlah sampel sama dengan 10, dengan menggunakan tabel random (lampiran A) dapat ditentukan 10 angka yang akan menentukan nomor unit populasi yang akan diambil.

Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal, dan dipilih arah ke kanan (boleh ke atas,kiri atau bawah) maka nomor sampel secara random yang diperoleh adalah

532, 115, 916, 239, 505, 956, 250, 961, 207, 868

Karena jumlah populasi = 200, maka angka angka yang melebihi 200 akan dihilangkan digit ratusannya. Sehingga nomor sampel randomnya menjadi

32, 115, 16, 39, 05, 56, 50, 61, 07, 68

Banyaknya digit bilangan random sebagai titik awal tergantung dari banyaknya digit maksimal populasi.

2. Random Berstrata ( berlapis )

Dalam metode ini, langkah pertama adalah populasi dikelompokkan dalam beberapa kelompok agar lebih homogen, kemudian dari masing ( masing kelompok diambil sampel berukuran tertentu ( secara proporsional ) secara acak seperti pada metode pertama.

3. Sistematik

Dalam metode ini pertama ( tama populasi diberi nomor dari 1 sampai N. Kemudian secara acak ditentukan sebuah nomor antara 1 sampai N (misal k) dan dibuat suatu barisan aritmatika dengan suku awal k dengan pertambahan tertentu sampai didapat n data. Bila suatu suku bernilai lebih dari N maka suku tersebut harus dikurangi N atau kelipatannya. Nilai penambahan adalah bilangan bulat sedemikian hingga nilainya dekat dengan dengan N : ukuran populasi dan n : ukuran sampel.

Contoh

Sebuah populasi berukuran 100 dan akan diambil sampel berukuran 15. Misalkan bilangan acak pertama dipilih 70 agar merata maka pertambahannya bisa dipilih sekitar 7. Hasil selengkapnya bisa dilihat pada tabel berikut :

NoBarisanSampel yg terpilih

17070

27777

38484

49191

59898

61055

711212

811919

912626

1013333

1114040

1214747

1315454

1416161

1516868

4. Bergerombol ( cluster )

Pada metode ini teknik yang digunakan mirip dengan metode acak sederhana hanya saja disini yang menjadi unit sampelnya adalah berupa cluster ( cluster yang mana masing ( masing cluster berisi elemen ( elemen yang yang lebih kecil. Yang menjadi pedoman untuk menentukan cluster adalah bahwa cluster ( cluster tersebut memiliki karakteristik yang hampir sama.

Contoh

Sebuah populasi berukuran 1000 tetapi dapat dikelompokan dalam kluster ( kluster yang berukuran 10, jadi total klusternya adalah 100. Misalkan dari 100 cluster tersebut akan diteliti sebanyak 6 cluster maka dengan metode acak sederhana dapat ditentukan 6 kluster yang terpilih. Unit ( unit sampel yang diteliti adalah keseluruhan unit populasi atau sebagian unit yang terletak didalam 6 kluster terpilih tersebut.

1.4 Aplikasi dengan minitab

Menentukan sampel dengan beberapa metode samplingA. Acak sederhana

Pada metode ini, pertama kita tentukan populasi yang akan diambil sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan jumlah sampel sama dengan 20, dengan menggunakan tabel random dapat ditentukan 20 angka yang akan menentukan nomor unit populasi yang akan diambil. Adapun langkah-langkahnya adalah :

1. Pilih calc, make patterned Data kemudian Simple Set o Numbers2. Isilah tabel yang keluar sesuai tabel berikut

Pada langkah ini merupakan proses pemberian nomor populasi

3. Pilih calc,Random Data kemudian Sample From Columns4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini merupakan pengambilan sampel berukuran 20 secara acak ). Dalam langkah ini kemungkinan setiap orang akan mendapatkan hasil yang berbeda.

5. Hasil yang keluar diatas merupakan nomor ( nomor unit populasi yang akan diambil sebagai sampel (pada kolom sampel) yaitu :

Sampel

72

10

102

156

64

169

2

15

147

164

126

117

121

48

176

110

114

199

79

135

B. Random Berstrata (berlapis)Misalkan dimiliki data populasi yang terdiri atas 60 mahasiswa jurusan Teknik Telekomunikasi, 50 mahasiswa Teknik Informatika dan 40 mahasiswa Teknik Industri. Bila ingin diambil sampel sebanyak 20 mahasiswa secara sistematis maka dilakukan dengan langkah langkah berikut .

1. Buat nomor 1 sampai 60 untuk mahasiswa Teknik Telekomunikasi, 1 sampai 50 untuk Teknik Informatika dan 1 sampai 40 untuk Teknik Industri.

2. Hitung jumlah sampel untuk masing masing jurusan.

Teknik Telekomunikasi

Teknik Informatika

Teknik Industri

3. Buat patterned data sebanyak 60,50 dan 40 seperti pada langkah sebelumnya kemudian simpan(Store samples in) dalam kolom yang terpisah(C3,C4 dan C5).

4. Lakukan pengambilan secara acak untuk masing masing jurusan(patterned data) seperti pada pengambilan sampel acak sederhana dengan ketentuan 8 berasal dari jurusan Teknik Telekomunikasi(C3), 6 dari jurusan Informatika(C4) dan 6 orang dari jurusan Teknik Industri(C5).

C. SistematisMisalkan dimiliki populasi sebanyak 200 dan akan diambil sampel sebanyak 30, maka langkah langkahnya adalah sebagai berikut

1. Tentukan salah satu nilai sebagai titik awal misalkan 50.

2. Nilai pertambahan

3. Buat patterned data pada file baru dengan nilai pertambahan (in step of) = 7, nilai awal(From first value) = 50 dan nilai akhir (To last value) = 260.

4. Ambil 30 nomor sampel yang pertama, hasilnya adalah

NoBarisanSampel yg terpilih

15050

25757

36464

47171

57878

68585

79292

89999

9106106

10113113

11120120

12127127

13134134

14141141

15148148

16155155

17162162

18169169

19176176

20183183

21190190

22197197

2320404

2421111

2521818

2622525

2723232

2823939

2924646

3025353

D. BergerombolMisalkan akan diteliti kualitas suatu minuman mineral botol yang dikemas dalam kotak. Jumlah kotak keseluruhan adalah 100 kotak dimana masing masing kotak berisi 10 botol dan sampel yang diinginkan adalah 50 botol. Alternatif yang dapat dilakukan antara lain dari 100 kotak diambil 5 kotak secara acak kemudian semua botol dalam kotak tersebut diteliti. Alternatif lain yang dapat dipilih dari 100 kotak tersebut dipilih 10 kotak acak kemudian dari 10 kotak tersebut dipilih 5 botol secara acak. Misalkan alternatif kedua yang dipilih :

1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.

2. Buat patterned data pada file baru sebanyak 100 seperti pada langkah sebelumnya kemudian simpan dalam kolom yang tertentu(C1)

3. Ambil 10 sampel secara acak berdasarkan kolom C1 simpan pada C2.

4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak yang terpilih.

5. Buat patterned data pada file baru sebanyak 10 seperti pada langkah sebelumnya kemudian simpan dalam kolom C3

6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan pada C4, ulangi sampai 10X dan simpan dalam kolom yang berbeda.

7. Semua nomor sampel yang terpilih pada masing masing kotak merupakan unit sampel yang akan diteliti.

Latihan 1. Tentukan sampel berukuran 30 dari populasi dengan ukuan 300

2. Tentukan sampel berukuran 30 yang diambil dari populasi yang dikelompokkan dalam 4 kelompok dengan ukuran 25,50,75 dan 100

3. Tentukan sampel berukuran 20 yang diambil dari populasi berukuran 200 dengan metode sistematik

4. Suatu populasi berukuran 500 dan dikelompokkan dalam 25 kluster. Bila nomor populasi 1 ( 20 masuk dalam kluster 1, nomor populasi 21 ( 40 masuk dalam kluster 2 dst. Bila dari 25 kluster tersebut diambil 5 secara acak, tentukan nomor ( nomor populasi mana yang akan masuk dalam sampel !

2 STATISTIKA DESKRIPTIF

Overview

Modul ini memberikan panduan secara singkat tentang teknik penyajian dan analisis data secara deskriptif. Pada tahap awal, mahasiswa dikenalkan serta diajarkan menampilkan pada beberapa ukuran statistik seperti ukuran pemusatan, ukuran penyebaran dan ukuran letak dengan menggunakan software minitab. Ukuran ukuran ini adalah ukuran ukuran sering yang digunakan dalam penyajian data secara deskriptif. Pada tahap selanjutnya mahasiswa akan diajarkan cara menyajikan data dalam bentuk tabel frekuensi dan juga dalam graph seperti : histogram, box plot dan diagram dahan daun beserta analisa hasilnya

Tujuan

1. Mahasiswa dapat menentukan beberapa ukuran pemusatan dan penyebaran data

2. Mahasiswa dapat membuat tabel distribusi frekuensi

3. Mahasiswa dapat menyajikan data dalam bentuk histogram, box plot dan diagram dahan daun

2.1 Ukuran Pemusatan

Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain mean, median, dan modus.

Mean adalah rata(rata dari data dan dinotasikan dengan , di mana menyatakan rata(rata sampel dan menyatakan rata(rata populasi. Secara umum mean memiliki rumusan sebagai berikut :

, n banyaknya sampel

, N banyaknya populasi

Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50% data. Cara menentukan median sebagai berikut : Misal X1, X2, , Xn adalah data yang sudah terurut dari kecil ke besar, maka untuk n ganjil dan untuk n genap .

Modus yaitu nilai yang paling sering muncul dalam suatu gugus data

Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada beberapa kasus yang membuat nilai tengah menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim.

2.2 Ukuran Penyebaran

Beberapa ukuran penyebaran antara lain :

Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum dengan nilai minimum.

Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap . Variansi merupakan ukuran penyebaran yang sering digunakan dalam statistika inferensia. Variansi dinotasikan S2 untuk sampel dan (2 untuk populasi. Variansi memiliki rumusan sebagai berikut :

, di mana n banyaknya sampel

, di mana N banyayknya populasi

( Simpangan baku merupakan akar dari variansi.

2.3 Ukuran Letak

Kuartil menyatakan nilai(nilai yang membagi gugus data menjadi empat bagian yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa data terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat bahwa data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh desil, persentil dll.

2.4 Distribusi Frekuensi

Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada tabel tersebut menampilkan ciri(ciri penting sejumlah data yang diperoleh dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari masing(masing kelas dihitung banyaknya pengamatan yang masuk.

Langkah-langkah membuat tabel frekuensi :

1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu , dimana . Banyaknya kelas sebaiknya antara 5 sampai 15.

2. Menentukan interval kelas (KI)

KI sebaiknya kelipatan 5.

3. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih.

4. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas (batas bawah kikurangi setengah dan batas atas di tambah setengah)

Bila data disajikan sebagai data kelompok, maka ukuran pemusatan, penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai berikut :

Ukuran pemusatan

Mean :

= titik tengan kelas, = frekuensi kelas

Median :

= batas bawah kelas median

= frekuensi total

= frekuensi kelas median

= interval kelas

= frekuensi kumulatif sebelum median

Modus :

= frekuensi kelas modus

= frekuensi sebelum kelas modus

= frekuensi sesudah kelas modus

Ukuran penyebaran

Ukuran letak

Kuarti ( )

= frekuensi pada kelas kuartil ke-i

= frekuensi sebelum kuarti

Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol, sedangkan dua kelas di bawah dan di atasnya diberi kode negatif dan positif.

2.5 Penyajian dalam Bentuk Grafik

Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya memiliki skala interval atau rasio, maka histogram dapat digunakan untuk menyajikan data.

Box plot merupakan bentuk penyajian data yang hanya menggunakan beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum, Q1, median, Q3, nilai maksimum. Pada box plot dapat juga ditentukan adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang apabila dibandingkan dengan nilai data yang lain tidak konsisten. Pencilan dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar). Untuk menentukan pencilan digunakan rumusan sebagai berikut :

Pagar dalam (p)

Pagar luar (P)

Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di luar pagar luar.

Diagram dahan daun adalah salah satu teknik penyajian data yang menggunakan data asli secara langsung. Pada dasarnya dalam diagram dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun, dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom daun.

Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data, apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa kemencengan digunakan metode Pearson yaitu . Jika , data menceng ke kiri dan , data menceng ke kanan.

2.6 Aplikasi dengan minitab

Data adalah data penjualan voucher telepon di lima kota provinsi Jawa barat :

BulanBandungSukabumiGarutTasikBogor

1428325651

24514336058

35125415857

46143526267

56954626381

67664726888

77871776994

87869757193

97258686985

106247586774

115129476161

124416355855

Langkah-langkah menggunakan software minitab 15 adalah :

1. Ketikkan atau copy data tersebut pada worksheet minitab

2. Pilih menu stat, kemudian basic statistics, lalu klik summary graphics

3. Pada kotak dialog, isi kolom tempat data pada variables, lalu klik OK

4. Hasil yang diperoleh adalah sebagai berikut :

Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan pertama. (Lakukan pengolahan data penjualan voucher di kota Bogor dan analisis)

Latihan

1. Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan baker adalah:

15.716.218.216.317.918.116.8

17.618.116.716.716.017.417.0

18.617.114.117.517.017.615.6

16.017.716.118.615.217.119.5

17.016.916.916.717.316.317.3

17.015.615.617.916.017.718.2

14.717.115.217.017.816.118.2

16.517.718.814.616.516.615.6

14.917.516.118.515.816.917.3

17.115.917.117.116.415.616.3

a. Buatlah diagram dahan daun

b. Buat tabel distribusi frekuensi dan histogramnya

c. Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat box plotnya

d. Kesimpulan apa yang bisa dinyatakan dari data tersebut , berdasarkan a, b, c.

e. Berapa persenkah jarak dari mobil tersebut yang kurang dari 15 mil/gallon, antara 15 dan 18 mil/gallon, dan lebih dari 18 mil/gallon.

2. Suatu penelitian dilakukan untuk mengetahui waktu respon sirkuit yang digunakan pada kalkulator elektronik. Data yang diperoleh sebagai berikut :

2530332228

2228182525

1522231924

2017312016

2319271519

a. Buat box plot dari data tersebut

b. Buat tabel distribusi frekuensi dan histogram

c. Analisis data tersebut dari hasil a dan b

3. Ketikan data score toefl dari 100 mahasiswa berikut pada kolom minitab

356510345400480

423500560456500

420460513450400

450469426476427

458436490475480

400400475500368

386320518518350

520480360346423

500479400420446

390480436463465

475400463460525

465500523400468

476360500515465

475520500375475

513348520445525

400365500426342

476470518450386

482473476455346

346500482456420

400428345468423

Buat diagram dahan daun, tabel distribusi frekuensi, histogram, lalu beri kesimpulan

3 KENORMALAN DATA

Overview

1. Modul ini memberikan pengenalan singkat tentang karakteristik data yang berdistribusi normal dan pengujian kenormalan data. Karakteristik data berdistribusi normal menyatakan gambaran dari data yang berdistribusi normal ditinjau secara matematis. Karakteristik data belum bisa digunakan dalam penentuan kenormalan data. Untuk menentukan kenormalan data, dapat digunakan beberapa uji kenormalan. Modul ini menyajikan 3 buah uji kenormalan yang dapat digunakan untuk menguji kenormalan suatu data dengan ukuran statistik yang berbeda beda yaitu Statistik Shapiro(Wilk W, Statistik Anderson(Darling dan Statistik Kolmogorov(Smirnov.

Tujuan

1. Mahasiswa mengenal tentang data berdistribusi normal

2. Mahasiswa dapat menguji kenormalan data

3.1 Distribusi normal

Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng pada gambar dibawah ini. Suatu peubah acak X yang distribusinya berbentuk lonceng, dinamakan peubah acak normal. Persamaan matematika dari distribusi peluang peubah acak normal kontinu bergantung pada dua parameter yaitu ( (rataan) dan ( (simpangan baku). Dengan demikian fungsi densitas X dapat dinyatakan oleh :

( < X < (.

Sifat-sifat distribusi normal :

1.

2.

3. dan

4.

5. Nilai maksimum dari f terjadi pada

6. Titik belok dari f terjadi pada

Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah dibawah kurva diantara dua koordinat dan sama dengan peluang peubah acak X antara dan . Hal tersebut dapat digambarkan sebagai berikut :

=

= Luas daerah yang diarsir

Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka dibuat table luas kurva normal sehingga akan memudahkan dalam penggunaannya.

3.2 Statistik uji kenormalan

Dalam statistika parametrik, distribusi normal mendasari beberapa uji statistik. Misal statistik t(student, Fisher, Khai Square, dll. Sehingga dalam pengolahan data statistik, biasanya diasumsikan data berasal dari populasi yang berdistribusi normal. Ada dua cara untuk melihat kenormalan data yaitu secara visual dan dengan uji statistik. Secara visual dengan menggunakan histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi normal.

Ada beberapa statistik uji kenormalan data antara lain :

2. Statistik Shapiro(Wilk W

Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik ini merupakan rasio antara dua penduga ragam. Statistik ujinya dinamakan statistik W. Statistik W ini mengukur straightness dari plot quantil(quantilnya. Bila nilai dari W ( 1, maka data dikatakan normal.

3. Statistik Anderson(Darling

Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954. Statistik Anderson(Darling berdasarkan pada fungsi distribusi empirik. Statistik ujinya dinamakan statistik yang merupakan kuadrat dari selisih antara luas histogram dengan luas daerah di bawah kurva normal. Bila nilai P(value ( (, maka data berdistribusi normal. Biasanya digunakan untuk data berukuran besar.

4. Statistik Kolmogorov(Smirnov

Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan pada maksimum perbedaan antara dua distribusi, yaitu distribusi normal dengan distribusi data yang diamati. Biasanya digunakan untuk data berukuran ( 30. Bila nilai P(value ( (, maka data berdistribusi normal.

3.3 Aplikasi dengan minitab

Contoh 1

Langkah-langkah

1. Data adalah data produksi minyak bumi dalam periode waktu 14 bulan dari 9 lokasi sumur pengeboran. Ketikan data ini pada kolom di minitab

tSmr 56Smr 59Smr 66Smr 68Smr 70Smr

77Smr 99Smr 144Smr 163

1507677633503477636402464309

2468763661573498672365504463

3500738420571466597582501390

4498608425534588597351526413

5449433451414589521585414393

6513460345575547576622471581

7558485377635499568685527590

8486552455443503485736508486

9478605361445495489614560531

10426575345448519443234557537

11493553531450482426243222553

12555548521468545464351502517

13542457360501489428414601430

14510356442443392455378575531

2. Pilih menu stat, kemudian pilih basic statistik, lalu normality test

3. Setelah muncul kotak dialog berikut, Ketik C1 pada isian variable, lalu klik pilihan tests for normality (asumsi )

Output masing-masing pilihan sebagai berikut :

( Shapiro(Wilk

Pada gambar terlihat bahwa nilai statistik W = 0.9938 ( 1, dengan pendekatan nilai P(value > 0.1, maka dapat dikatakan bahwa data berdistribusi normal.

( Statistik Anderson(Darling

Dengan menggunakan statistik ini diperoleh nilai P(value = 0.478, nilai ini lebih besar dari pada nilai ( = 0.05.

( Statistik Kolmogorov(smirnov

Pada gambar terlihat bahwa pendekatan nilai P(value > 0.15, nilai ini lebih besar dari pada nilai ( = 0.05.

Dari ketiga output di atas, terlihat bahwa untuk ukuran data besar, statistik Anderson(Darling lebih powerfull.

Contoh 2

1. Buka software minitab kemudian pilih menu calc , Random Data kemudian binomial. Pada langkah ini kita akan membangkitkan data yang berdistribusi binomial. Pada box

yang keluar isilah sesuai isian berikut ini kemudian ok

2. Data yang sudah dipeoleh ini kita anggap sebagai data populasi. Dari data populasi ini selanjutnya akan kita ambil beberapa sampel berukuran 5, 10 dan 20 untuk selanjutnya akan dibandingkan variansi dari rataan sampelnya. Dari menu utama pilih calc , Random Data kemudian sample from column . Isilah box yang keluar seperti isian berikut

3. Ulangi langkah 2 sebanyak 5x untuk masing ( masing ukuran sampel, jadi akan terdapat 5 sampel berukuran 5, 5 sampel ukuran 10 dan 5 sampel ukuran 20

4. Dari setiap sampel hitunglah rata ( ratanya kemudian untuk setiap ukuran sampel hitunglah rata ( rata dan variansinya. Anda bisa menggunakan software lain untuk menghitung rata(rata dan variansinya misalnya microsoft Excel .Mungkin hasil yang keluar ini bisa berbeda dengan hasil perhitungan anda

no sampelukuran 5ukuran 10Ukuran 20

139.641.440.45

242.640.940.7

34037.742.85

43742.841.85

54238.840.5

rata240.2440.3241.27

variansi4.9084.2071.10575

Dari hasil diatas terlihat rata ( rata semua sampel mendekati rata ( rata populasi yaitu (=np = 40, tetapi untuk ukuran n = 20 variansinya adalah yang terkecil, ini juga dapat dilihat dari rataan sampel dari no 1 sampai 5 yang hanya berbeda tipis. Ini menunjukkan dengan pengambilan sampel yang makin besar keakuratan pendugaannya akan semakin tinggi.

5. Pada pembuktian distribusi rataan sampel, langkah langkahnya sebenarnya tidak jauh berbeda dengan 4 langkah sebelumnya hanya saja dalam hal ini diperlukan jumlah pengacakan yang jauh lebih banyak daripada 4 langkah sebelumnya. Untuk itu akan digunakan progam matlab untuk membantu meyelesaikan masalah ini.

6. Bila dilakukan dengan software matlab, akan keluar tampilan berikut

Pada program tersebut, pada baris ketiga angka 500 menyatakan jumlah pengacakan Pada baris 4, perintah random (0,1,100,1) menyatakan perintah pengambilan sampel dari populasi yang memiliki mean 0, simpangan baku 1, sampel berukuran 100 dari 1 populasi.

Pada baris 6 dan 7 mengandung arti pendefisian variabel Y sebagai sampel acak pertama yang berukuran 100.

Pada baris 9, mean sampel 1,2,500 dihitung

Dan pada baris 12, dibuat histogram dari mean sampel hasil perhitungan pada baris 9

7. Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan angka 5. Jalankan program ini dengan memilih debug kemudian run and save ( Dalam langkah ini kita berusaha mengambil sampel acak berukuran 5). Simpanlah output gambar/ histogram yang keluar dengan file tersendiri. Ulangi langkah ini dengan mengganti angka 10, 20 dan 30.

8. Dari keempat histogram yang keluar tersebut, analisa apakah keempat histogram sudah berbentuk kurva normal baku dengan mean 0 dan simpangan baku 1? apakah ada pengaruh ukuran sampel? jelaskan!

3 Going with Raw Sample Data

We could simply plot the raw, sample data in a histogram like this one:

This histogram does show us the shape of the sample data and it is a good starting point. We can see that this distribution is skewed to the right and probably non-normal. However, this graph only tells us about the data from this specific example. You cant make any inferences about the larger population.

What can be done to increase the usefulness of these data? First, identify the distribution that your data follow.Once you do that, you can learn things about the populationand you can create some cool-looking graphs!

3 How to Identify the Distribution of Your Data

To identify the distribution, well go toStat > Quality Tools > Individual Distribution Identificationin Minitab. This handy tool allows you to easily compare how well your data fit 16 different distributions. It produces a lot of output both in the Session window and graphs, but don't be intimidated. Before we walk through the output, there are 3 measures you need to know.

Anderson-Darling statistic (AD):Lower AD values indicate a better fit. Its generally valid to compare AD values between distributions and go with the lowest.

P-value:You want a high p-value. A low p-value (e.g., < 0.05) indicates that the data dont follow that distribution. For some 3-parameter distributions, the p-value is impossible to calculate and is represented by asterisks.

LRT P:For 3-parameter distributions only, a low value indicates that adding the third parameter is a significant improvement over the 2-Parameter version. A higher value suggests that you may want to stick with the 2-Parameter version.

So, for my data, Ill fill out the main dialog like this:

Lets dive into the output. Well start with the Goodness of Fit Test table below.

The very first line shows our data are definitely not normally distributed, because the p-value for Normal is less than 0.005!

We'll skip the two transformations (Box-Cox and Johnson) because we want to identify the native distribution rather than transform it.

A good place to start is to skim through the AD values and look for the lowest. The lowest AD is for 3-Parameter Weibull. However, the AD values for 3-Parameter Lognormal, Largest Extreme Value, and 3-Parameter Gamma are all close. For the 3-Parameter Weibull, the LRT P is significant (0.000), which means that the third parameter significantly improves the fit. The LRT P is not significant for the other 3-Parameter candidate distributions.

Given the lower AD value and the significant LRT P value, we can pick the 3-Parameter Weibull distribution as the best fit for our data. We identified this distribution by looking at the table in the Session window, but Minitab also creates a series of graphs that provide most of the same information along with probability plots. You can see 3-Parameter Weibull in the graph below. The data points follow a fairly straight line, which indicates a fit.

Now we know what the distribution isbut what are the distribution's parameter values? For those, look at the next table down in the Minitab Session window output:

3 How Does Identifying the Distribution of Data Help with Analysis?

All right. Now we know that the body fat percentage data follow a 3-Parameter Weibull distribution with a shape of 1.85718, a scale of 14.07043, and a threshold of 16.06038.

At this point you may be wondering, "How does that help us?" The answer: with this information about the distribution, we can go beyond the raw sample data and make statistical inferences about the larger population.

Latihan1. Data seperti contoh no. 1, kemudian dilakukan pengacakan 15 kali dan diambil sampel ukuran 10, 20, 30. Buat histogram dengan kurva normalnya dan uji kenormalannya.

2. Bangkitkan data dari komputer, kemudian lakukan pengacakan 20 kali, dari data berdistribusi normal, poisson dengan rata-rata 2, binomial dengan p = 0.6 dan n = 15. Buatlah histogramnya.

4 TRANSFORMASI DATA

Overview

Modul ini memberikan panduan untuk melakukan tranformasi data baik untuk satu angkatan data maupun beberapa angkatan data. Transformasi terhadap satu angkatan data biasanya dilakukan agar asumsi data berdistribusi normal terpenuhi, sedangkan transformasi untuk beberapa data biasanya dilakukan agar asumsi ragam sama pada beberapa angkatan data terpenuhi. Tes kenormalan kemudian juga dilakukan untuk melihat apakah transformasi yang dilakukan sudah tepat.

Tujuan

1. Dapat melakukan transformasi data dengan menggunakan Tangga Transformasi Tukey untuk melihat bagaimana bentuk distribusi data setelah dilakukan transformasi

2. Dapat memilih transformasi yang tepat untuk me-normalkan data

4.1 Transformasi untuk satu angkatan data

Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data yang berdistribusi Normal dengan mean ( dapat digambarkan seperti grafik berikut

Bila dilihat, data yang berdistribusi Normal akan simetris terhadap ( dan sebagaian besar data akan mengelompok di tengah. Dalam kenyataannya seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan seperti gambar berikut

Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada gambar berikut :

Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data. Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut :

Tangga transformasi ini dapat diartikan sebagai berikut :

Transformasi akan membuat bentuk distribusi data menjadi menjulur kekanan secara kuat, sedangkan transformasi akan membuat bentuk distribusi data menjadi menjulur kekiri secara kuat. Sebagai contoh bila kita memiliki data yang menjulur kekanan secara lemah maka kita dapat transformasi agar data menjadi Normal, sebaliknya bila data menjulur kekanan secara sedang maka transformasi x3 agar data menjadi Normal. Penentuan bahwa suatu data menjulur secara lemah,sedang atau kuat besifat subyektif sehingga akan lebih baik bila digunakan beberapa transformasi sekaligus kemudian baru dibandingkan hasilnya. Penentuan apakah hasil transformasi sudah Normal atau tidak adalah melalui uji kenormalan

4.2 Transformasi untuk beberapa angkatan data (menyamakan sebaran)

Ketika dimiliki beberapa angkatan data, maka biasanya ingin dilakukan pembandingan antara angkatan satu dengan angkatan lainnya. Proses membandingkan ini lebih mudah bila semua angkatan data memiliki

Bentuk distribusi baku

Sebaran data yang sama

Bila kedua syarat diatas sudah dipenuhi, maka untuk membandingkan angkatan ( angkatan tersebut, cukup dibandingkan masing ( masing tarafnya ( nilai Median ) saja. Untuk menyamakan sebaran semua angkatan ( membuat sebaran hampir sama), digunakan transformasi seperti pada tangga transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing ( masing angkatan diukur dengan dQ = Q3 ( Q1 yaitu simpangan kuartil.

Penentuan transformasi yang tepat dilakukan dengan prosedur berikut

1. Hitung taraf dari setiap angkatan

2. Hitung sebaran dari setiap angkatan

3. Tentukan Taraf terbesar (TA), Taraf terkecil (TB), Sebaran yang berseuaian dengan TA (= SA) dan Sebaran yang berseuaian dengan TB (= SB) dari seluruh angkatan

4. Hitung koefisien arah b yang memiliki rumus

Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel berikut

Nilai b (disekitar)Transformasi yang dipilihKeterangan

NegatifxkMakin kecil b ((> makin besar k (k : bulat)

0,5

1Log x

1,5

2

4.3Aplikasi Minitab

Berikut ini contoh data (tabel data transformasi) yang menjulur ke kanan yang digambarkan dengan histogram. Tabel data transformasi

7.25.69.72.9

2.314.32.66.8

1.83.015.31.8

5.92.58.33.4

17.33.82.46.9

2.01.71.98.8

4.85.53.66.5

10.93.74.91.9

3.42.99.33.6

4.44.63.43.4

9.64.810.43.7

7.58.34.02.4

1.75.83.813.7

4.62.84.915.3

3.46.31.51.3

2.13.14.84.9

1.57.64.412.0

3.75.52.92.3

5.38.06.43.2

4.13.50.55.9

9.11.72.13.0

5.711.48.13.7

0.96.53.63.6

1.91.711.92.4

2.32.15.22.9

1. Buat file baru : file transformasi, kemudian simpan data diatas pada kolom c1

2. Buat histogramnya

3.Lakukan tes kenormalan data terhadap data C1

Dari hasil uji Anderson-Darling (lihat modul kenormalan data) ,didapatkan p-value = 0.000 ini berarti secara kuat disimpulkan bahwa data tidak berdistribusi Normal. 4.Lakukan transformasiterhadap C1, simpan datanya pada C2. Buat Histogram berdasarkan data C2, diperoleh

5.Lakukan tes kenormalan data terhadap data C2

Dari Dari hasil uji Anderson-Darling,didapatkan p-value = 0.001 ini berarti disimpulkan bahwa data juga tidak berdistribusi Normal. 6.Lakukan transformasi Log x terhadap C1, simpan datanya pada C3. Histogram berdasarkan data C3, diperoleh

7.Lakukan tes kenormalan data terhadap data C3

Dari hasil uji Anderson-Darling,didapatkan p-value = 0.849 ini berarti secara kuat disimpulkan bahwa data berdistribusi Normal.

Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya menjulur kekanan secara sedang, dengan transformasi bentuk data menjadi menjulur ke kanan secara lemah, sedangkan dengan transformasi Log x data menjadi Normal. Nantinya yang diolah dengan statistik adalah data Log x bukan data aslinya.

Sebagai eksperimen lainnya, lakukan tranformasi x2 atau x3 , simpan datanya pada C4, C5 kemudian buat histogram dan lakukan tes kenormalan maka diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan dari histogram berikut.

Latihan

Periksa distribusi data berikut, bila belum simetris, lakukan transformasi yang tepat seperti pada langkah langkah praktikum diatas605507633477

575468661498

553500420466

548498425588

457449451589

356513345547

445558377499

448486455503

450478361495

468426345519

501493531482

443555521545

489542360489

443510442392

426677503636

464763573672

428738571597

455608534597

552433414521

443460575576

485485635568

5 UJI HIPOTESIS STATISTIK DAN PROPORSI

Overview

Modul ini memberikan panduan untuk melakukan uji hipotesis terhadap nilai tengah dan proporsi. Uji hipotesis terhadap nilai tengah meliputi uji terhadap terhadap satu nilai tengah maupun perbandingan antara dua nilai tengah, sedangkan uji proporsi meliputi uji satu proporsi dan perbandingan dua proporsi. Semua uji hipotesis yang dilakukan berdasarkan beberapa asumsi yaitu ragam diketahui maupun ragam tidak diketahui.

Tujuan

1. Mahasiswa memahami tentang uji hipotesis statistik

2. Mahasiswa memahami tentang uji satu nilai tengah dengan ( diketahui atau tidak dan dapat menerapkannya

3. Mahasiswa memahami tentang uji selisih nilai tengah dari dua sampel dengan ( diketahui atau tidak dan dapat menerapkannya4. Mahasiswa memahami tentang uji proporsi satu dan dua proporsi

5.1 Hipotesis statistik

Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia. Hipotesis statistik yaitu suatu anggapan atau pernyataan yang mungkin benar atau tidak mengenai satu populasi atau lebih. Suatu hipotesis dianggap benar atau salah, tidak bias diketahui dengan pasti kecuali dilakukan pemeriksaan terhadap seluruh populasi. Tetapi hal tersebut tidak efisien. Untuk mengatasi hal tersebut dilakukan pengambilan sampel secara acak.

Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut hipotesis alternatif.

Prosedur pengambilan kesimpulan kadang(kadang dapat membawa pada kesimpulan yang salah. Dalam pengujian hipotesis statistik, ada dua jenis kesalahan yaitu:

a. Kesalahan jenis pertama (galat jenis I)

Yaitu penolakan hipotesis nol, padahal hipotesis nol benar. Peluang galat jenis I disebut taraf nyata yang dinotasikan dengan (. Biasanya taraf nyata disebut dengan ukuran wilayah kritis.

b. Kesalahan jenis kedua (galat jenis II)

Yaitu penerimaan hipotesis nol, padahal hipotesis nol salah. Peluang galat jenis II dinotasikan dengan (. Nilai dari ( tidak mungkin dihitung, kecuali bila hipotesis alternatifnya lebih spesifik.

Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :

( Hipotesis alternatif yang bersifat dua arah

H0 : ( = (0H1 : ( ( (0Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yang letaknya pada masing(masing ekor dari sebaran statistik ujinya.

( Hipotesi alternatif yang bersifat satu arah

a) H0 : ( ( (0 atau b) H0 : ( ( (0 H1 : ( > (0 H1 : ( < (0Wilayah kritis untuk a) terletak seluruhnya di ekor sebelah kanan dari sebaran statistik ujinya. Sedangkan untuk b) sebaliknya.

Dalam menentukan keputusan akhir untuk menerima atau menolak H0 , didasarkan pada wilayah kritis ( dengan p(value yang mendukung keberartian suatu uji dalam bentuk peluang. P(value adalah taraf keberartian terkecil, sehingga nilai suatu uji statistik yang diamati masih berarti.Bila p(value ( (, maka H0 ditolak.

Prosedur pengujian hipotesis dapat mengikuti langkah(langkah berikut :

1. Merancang hipotesis nol dan hipotesis alternatif

2. Menguji kenormalan

3. Memilih taraf keberartian (4. Menguji kesamaan ragam

5. Menentukan dan menghitung nilai statistik uji yang sesuai

6. Menentukan daerah kritis dan membuat keputusan apakah menerima atau menolak H0 (di mana pengambilan keputusan dapat didasarkan pada tiga hal yaitu nilai kristis dari statistik uji, selang kepercayaan, atau p(value)

7. Membuat kesimpulan akhir mengenai sampel yang diambil

5.1.1 Pengujian hipotesis untuk satu nilai tengah

X1, X2, , Xn merupakan peubah acak yang menyebar secara normal dengan nilai tengah tidak diketahui. Perumusan hipotesinya sebagai berikut :

H0 : ( = (0atauH0 : ( ( (0atauH0 : ( ( (0

H1 : ( ( (0

H1 : ( > (0

H1 : ( < (0Pengujian hipotesis terhadap nilai tengah ada dua asumsi :

1. Ragam diketahui

Uji hipotesis untuk rata(rata x, di mana hipotesis nol menyebar normal dengan nilai tengah (0 dan simpangan baku rata(rata populasi (/(n, statistik ujinya adalah :

Kriteria penolakan terhadap hipotesis nol ditampilkan dalam tabel berikut :

NOHipotesis AlternatifKriteria penolakan

1H1 : ( ( (0H0 ditolak pada saat Z ( Z(/2 atau Z ( Z1((/2

2H1 : ( > (0H0 ditolak pada saat Z ( Z1((

3H1 : ( < (0H0 ditolak pada saat Z ( Z(

2. Ragam tidak diketahui

Bila ragam tidak diketahui, maka statistik ujinya adalah t(student, di mana ragam populasi diduga oleh ragam sampel. Statistik ujinya didefinisikan sebagai berikut

Adapun kriteria penolakan terhadap hipotesis nol dijelaskan pada tabel berikut

NOHipotesis AlternatifKriteria penolakan

1H1 : ( ( (0H0 ditolak saat t ( t(/2, n(1 atau t ( t1((/2, n(1

2H1 : ( > (0H0 ditolak pada saat t ( t1((, n(1

3H1 : ( < (0H0 ditolak pada saat t ( t(, n(1

5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah

X1, X2, , Xn dan Y1, Y2, , Yn merupakan dua peubah acak yang saling bebas dan menyebar secara normal dengan nilai tengah (x dan (y, simpangan baku (x dan (y. Perumusan hipotesinya sebagai berikut :

H0 : (x ( (y = (0atauH0 : (x ( (y ( (0atauH0 : (x ( (y ( (0

H1 : (x ( (y ( (0

H1 : (x ( (y > (0

H1 : (x ( (y < (0Di mana (0 adalah suatu konstanta bernilai positif atau nol yang menunjukkan selisih antara dua nilai tengah yang tidak diketahui.seperti pada pengujian hipotesis untuk satu nilai tengah, ada dua asumsi yaitu :

1. Ragam diketahui

Statistik uji didefinisikan sebagai berikut

Kriteria penolakan terhadap hipotesis nol adalah :

NOHipotesis AlternatifKriteria penolakan

1H1 : (x ( (y ( (0H0 ditolak pada saat Z ( Z(/2 atau Z ( Z1((/2

2H1 : (x ( (y > (0H0 ditolak pada saat Z ( Z1((

3H1 : (x ( (y < (0H0 ditolak pada saat Z ( Z(

2. Ragam tidak diketahui

Bila ragam tidak diketahui, maka sebelum dilakukan pengujian hipotesis terlebih dahulu dilakukan pengujian terhadap ragam. Pengujian tersebut dilakukan untuk menduga apakah ragam kedua sampel sama atau tidak. Hipotesisnya adalah sebagai berikut : H0 : (x = (yH1 : (x ( (ySedangkan statistik ujinya adalah statistik uji Fisher yaitu .

Bila didapatkan bahwa F ( F((, (nx(1, ny(1)), maka H0 ditolak, artinya ragam kedua sampel tidak sama. Sehingga derajat bebas yang akan digunakan dalam statistik ujinya adalah

Statistik uji pengujian hipotesis terhadap selisih antara dua nilai tengah untuk ragam berbeda adalah

Sedangkan untuk ragam sama, dalam statistik ujinya menggunakan ragam gabungan, yaitu :

dimana statistik ujinya adalah

.

Kriteria penolakan terhadap hipotesis nol adalah :NOHipotesis AlternatifKriteria penolakan

1H1 : (x ( (y ( (0H0 ditolak pada saat t ( t(/2, m atau t ( t1((/2, m

2H1 : (x ( (y > (0H0 ditolak pada saat t ( t1((, m

3H1 : (x ( (y < (0H0 ditolak pada saat t ( t(, m

5.1.3Aplikasi dengan minitab

Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini banyak operator selular menggunakan teknologi berbasis CDMA, antara lain Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8 dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut adalah datanya :

NOFrenFlexiEsia

1556037

2423360

3453935

4716161

5834031

6479456

7757165

8486178

9607759

10696427

11856530

12547045

13318038

14256125

15305035

Langkah-langkah pengolahan dengan menggunakan minitab 15 :

1. Simpan data tersebut pada worksheet minitab

2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan uji dua ragam (ragam sama atau berbeda) dengan cara pilih menu stat, lalu basic statistics, kemudian dua ragam, maka akan muncul kotak dialog seperti di bawah kemudian ketikkan kolom data pada isian sampel, klik option atau storage bila perlu, lalu OK

3. Hasil yang diperoleh sebagai berikut :

Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam kedua sampel sama, karena Pvalue = 0.582 > 0.05

4. Pengujian hipotesis, dilakukan dengan cara pilih stat, basic statistics, kemudian pilih 2-sample t, kemudian isi kotak dialog

5. Hasil yang diperoleh adalah sebagai berikut :

Untuk menolak atau menerima Ho dapat dilihat dari 3 hal yaitu :

Karena selang kepercayaan untuk selisih nilai tengah adalah , sehingga nol termasuk di selang tersebut, maka Ho diterima

Pvalue = 0.284 > 0.05, maka Ho diterima

Nilai kritis (t hitung = -1.09 > t tabel) maka Ho diterima

Karena Ho diterima, maka dapat disimpulkan bahwa rata-rata jumlah pengguna produk fren dan flexi di 15 kecamatan kota Bandung sama. Hal itu dimungkinkan dua produk tersebut masing-masing mempunyai kelebihan dan kekurangan, sehingga konsumen akan memilih produk yang sesuai dengan kebutuhannya.

6. Untuk latihan, lakukan langkah dan analisis yang sama untuk fren vs esia, flexi vs esia.

5.2 Uji proporsi

Proporsi menyatakan perbandingan banyaknya sukses terhadap total pengamatan. Bila x menyatakan banyaknya sukses dari n ulangan, maka nilai proporsi p dihitung dengan rumus : .Uji proporsi dapat dilakukan terhadap satu nilai proporsi atau perbandingan beberapa nilai proporsi. Asumsi yang digunakan adalah proporsi berdistribusi binomial.

5.2.1 Uji terhadap satu nilai proporsi

Hipotesis yang digunakan untuk uji satu nilai proporsi dengan taraf ( antara lain berbentuk :

a.

Wilayah kritik: dimana a adalah bilangan bulat terbesar yang bersifat

: Distribusi Binomial dengan parameter n dan p0n : banyaknya eksperimen/ulangan

p0 : peluang sukses

b.

Wilayah kritik dimana a adalah bilangan bulat terkecil yang bersifat

: binomial dengan parameter n dan p0n : banyaknya eksperimen/ulangan

p0 : peluang sukses

c.

Wilayah kritik atau dimana a adalah bilangan bulat terkecil untuk atau bilangan bulat terbesar untuk yang bersifat

atau

: binomial dengan parameter n dan p0n : banyaknya eksperimen/ulangan

p0 : peluang sukses

Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka tolak H0.

5.2.2Aplikasi dengan Minitab

Contoh

Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota A sudah terpasang AC. Dari 15 yang rumah yang diamati, ternyata hanya 8 rumah yang telah terpasang AC. Benarkah pernyataan tersebut ?

Langkah langkah

1.Karena yang ingin disimpulkan adalah proporsi rumah terpasang AC = 70% atau tidak, maka uji hipotesis yang dipilih adalah

Taraf = 5% = 0,05

2.Pilih menu Basis Statistic , 1 Proportion

3.Isilah kotak dialog dengan isian berikut

Number of event = 8, menyatakan banyaknya kejadian sukses

Number of trial = 15, menyatakan banyaknya sampel yang diambil

Hypothesized proportion =0,7 menyatakan nilai dari H04.Klik option untuk menentukan tingkat signifikan (() dan jenis hipotesis yang akan dipilih

5.Hasilnya adalah sebagai berikut :

Karena nilai P-value=0.258 >0.05, maka H0 tidak ditolak. Data tidak cukup kuat untuk menolak pernyataan bahwa 70% rumah terpasang AC.

5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai proporsi

Pada pengujian satu nilai proporsi, ada situasi dimana tabel binomial sulit untuk digunakan, misalkan untuk nilai n yang sangat besar(kecuali dengan bantuan komputer). Salah satu pendekatan yang bisa digunakan adalah dengan melakukan transformasi ke bentuk normal baku. Parameter ( dan ditaksir dengan rumus : dan .

Statistik uji yang digunakan adalah

n : banyaknya eksperimen/ulangan

p0 : peluang sukses / proporsi

Z berdistribusi normal baku dengan dan . Wilayah kritiknya menjadi

bila uji hipotesisnya

bila uji hipotesisnya

atau bila uji hipotesisnya

5.2.4Aplikasi dengan Minitab

Contoh

Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah obat baru diuji terhadap 100 pasien, 70 orang sembuh sehingga tingkat keefektifannya 70%. Apakah obat baru tersebut bisa dikatakan lebih efektif dari obat lama?

Langkah langkah 1.Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60% atau tidak, maka uji hipotesis yang dipilih adalah

Taraf = 5% = 0,05

2.Langkah langkah yang dilakukan untuk uji hipotesis ini mirip dengan uji hipotesis tanpa menggunakan pendekatan normal. Perbedaannya adalah ketika memilih kotak option kita memilih check list use test and interval test based on normal distribution seperti berikut ini

3.Hasilnya adalah sebagai berikut :

Berarti nilai z masuk dalam wilayah kritik karena P-value= 0,021 < 0,05.Jadi dapat disimpulkan bahwa tingkat keefektifan obat baru lebih tinggi dari obat lama.

5.2.5 Pengujian perbandingan dua proporsi

Pengujian terhadap proporsi tidak hanya bisa dilakukan terhadap satu nilai proporsi. Bila kita sedang meneliti dua buah proporsi, maka kedua proporsi tersebut dapat diperbandingkan yaitu berdasarkan sebaran selisih proporsinya. Selisih proporsi ini kemudian ditransformasi kebentuk normal baku dengan rumus z yaitu :

Dimana

:Banyaknya sukses kategori 1

:Banyaknya sukses kategori 2

:Banyaknya ulangan/sampel kategori 1

:Banyaknya ulangan/sampel kategori 2

Hipotesisnya

Wilayah kritiknya sama seperti pendekatan normal baku untuk pengujian terhadap satu nilai proporsi yaitu :

bila uji hipotesisnya

bila uji hipotesisnya

atau bila uji hipotesisnya

5.2.6Aplikasi dengan Minitab

Contoh

Suatu penelitian dilakukan untuk melihat apakah proporsi lulusan smu kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu kabupaten Bandung(p2) yang akan melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil, diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang akan melanjutkan ke PT.

Langkah langkah 1.Karena yang ingin disimpulkan proporsi lulusan smu kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu kabupaten Bandung(p2), maka uji hipotesis yang dipilih adalah

atau

atau

Taraf = 5% = 0,025 ( selang kepercayaan = 97,5 %2.Pilih menu Basis Statistic , 2 Proportion

3.Isilah kotak dialog dengan isian berikut

Number of event menyatakan banyaknya kejadian sukses (siswa yang melanjutkan ke PT). First : kodya, Second : kabupaten

Number of trial , menyatakan banyaknya sampel yang diambil

4.Klik option untuk menentukan tingkat signifikan (() dan jenis hipotesis yang akan dipilih

5.Hasilnya adalah sebagai berikut :

Karena nilai P-value =0.002 0.05

4. Pengujian hipotesis, dilakukan dengan cara pilih Stat, ANOVA, kemudian pilih 2-sample t, kemudian isi kotak dialog

5. Hasil yang diperoleh adalah sebagai berikut :

Untuk menolak atau menerima Ho dapat dilihat dari 2 hal yaitu :

Pvalue = 0.045 < 0.05, maka Ho ditolak

Nilai kritis (F hitung = 3.35 > F tabel) maka Ho ditolak

Karena Ho ditolak, maka dapat disimpulkan bahwa rata-rata jumlah pengguna produk fren, flexi dan esia di 15 kecamatan kota Bandung berbeda. Hal itu dimungkinkan satu atau dua dari tiga produk tersebut ada yang mempunyai kelebihan, sehingga konsumen akan cenderung memilih produk tersebut.

Latihan1. Berikut adalah data pengunjung dari lima warnet dalam waktu 1 minggu.

Warnet/hr1234567

A1020258352020

B18151026253030

C1225303591010

D15152010252025

E201089353515

Lakukan pengujian apakah rata-rata pengunjung dari lima warnet dalam waktu satu minggu sama atau tidak, dengan taraf nyata 0.05 dan 0.01.

2. Berikut adalah data penjualan dari lima merk Laptop yang dijual di BEC dari 8 pusat penjualan selama satu bulan.

Merk/ TokoIIIIIIIVV

Accer6108125

Toshiba439102

Compac151081210

IBM53682

HP436103

Dengan menggunakan analisis ragam dan taraf nyata 0.05, uji apakah rata-rata penjualan dari kelima merk laptop di BEC sama, dengan menggunakan hipotesis seperti pada dasar teori di atas.

3. Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan TI angkatan 2006

STTIIF

426.667450.000453.333

520.000506.667480.000

216.667456.667550.000

290.000576.667460.000

410.000360.000403.333

400.000500.000380.000

370.000430.000443.333

490.000413.333216.667

343.333386.667450.000

390.000363.333453.333

373.333433.333216.667

430.000543.333463.333

456.667350.000430.000

580.000436.667363.333

410.000386.667430.000

436.667350.000216.667

423.333416.667473.333

413.333410.000403.333

396.667386.667406.667

430.000366.667413.333

410.000406.667446.667

430.000543.333416.667

510.000426.667416.667

216.667363.333443.333

420.000383.333540.000

420.000380.000473.333

483.333413.333413.333

370.000383.333520.000

433.333216.667510.000

476.667420.000420.000

Lakukan analisis ragam dengan taraf nyata 0.05 pada data tersebut. Kemudian uji apakah rata-rata nilai toefl mahasiswa dari tiga juruan sama ataukah berbeda.7 REGRESI LINIER DAN NON-LINIER SEDERHANAOverview

Dalam sebuah penelitian, sering kita memiliki data yang berpasangan (X,Y). Data tersebut bisa jadi diperoleh dari sebuah percobaan terhadap peubah X sedangkan respon yang terjadi dicatat sebagai peubah Y. Hal menarik yang bisa disimpulkan dari data yang berpasangan adalah tingkat keeratan hubungan antara X dan Y serta bentuk hubungan fungsionalnya. Modul ini memberikan panduan langkah langkah kepada mahasiswa dalam menentukan hubungan antara dua peubah X,Y yang paling tepat, langkah langkah pengujian koefisien regresi beserta penentuan tingkat keeratannya.

Tujuan

1. Mahasiswa dapat membuat model regresi linier maupun non-linier sederhana dari data berpasangan (X,Y).

2. Mahasiswa dapat memahami keterkaitan antara model linier dan model non-linier.3. Mahasiswa dapat menentukan model regresi yang terbaik berdasarkan pengujian terhadap koefisien regresi dan nilai R2

7.1 Regresi

Suatu permasalahan penelitian biasanya dapat dijelaskan oleh dua atau lebih variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling berhubungan tersebut membentuk suatu persamaan matematis yang dapat digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai variabel yang lain. Dalam statistika, hubungan fungsional antara variabel tak bebas ( dinotasikan Y ) dengan variabel bebas ( dinotasikan X ) disebut regresi antara Y dan X. Persamaan regresi yang akan dibahas pada bab ini persamaan linier sederhana, persamaan non-linier yang dibangkitkan dari persamaan linier yaitu eksponensial dan geometrik.

7.1.1 Model untuk regresi linier sederhana

Bentuk umum :

: variabel takbebas

: variabel bebas

: error yang terjadi pada eksperimen

Nilai selalu berubah ( ubah pada setiap x jadi sulit untuk ditebak, model ini kemudian diduga oleh dengan metode kuadrat terkecil yaitu meminimumkan jumlah kuadrat error ( ). Dari metode kuadrat terkecil didapatkan nilai untuk a dan b

dan

Untuk melihat seberapa baik model regresi yang diperoleh, dapat dilihat melalui nilai koefisien korelasi determinasi R2 yang memiliki nilai 0 sampai 1 dan memiliki rumus

Selain menggunakan R2, untuk mengetahui kelayakan suatu model regresi yang telah diperoleh yang digunakan menduga hubungan antara variabel X dengan variabel Y, dilakukan dengan pengujian terhadap koefisien-koefisien regresi yaitu :

1. Pengujian koefisien regresi secara serentak

Hipotesis :

H0 : a = b = 0

H1 : paling tidak terdapat satu koefisien tidak sama dengan nol

Tabel analisis ragam untuk uji koefisien regresi secara serentak

Sumber keragamanDerajat

bebasJumlah KuadratKuadrat TengahFhitung

Regresi p

Galatn-p-1Sisa

Totaln-1

Statistik uji untuk penolakan H0 adalah :

2. Pengujian koefisien regresi secara individu

Hipotesis :

H0 : bp = 0

H1 : bp 0

Statistik uji yang digunakan :

Kriteria penolakan H0 adalah

Arti penolakan terhadap H0 adalah variabel bebas berpengaruh nyata terhadap variabel tak bebas Y (untuk H0 : b1 = 0), sehingga model regresi linier dikatakan layak.

7.1.2 Model regresi non linier

7.1.2.1 Model eksponensial

Bentuk umum regresi model eksponensial adalah . Model tersebut diduga dengan .Nilai a dan b diperoleh dengan cara langkah ( langkah berikut :

Dengan melogaritmakan persamaan , diperoleh

Model tersebut berubah menjadi model linier, sehingga nilai c dan d didapatkan dari rumusan model linier yaitu

dan

dimana dan

7.1.2.2 Model geometrik (power )

Regresi model geometrik mempunyai bentuk umum . Pendugaan model tersebut adalah .Nilai a dan b diperoleh dengan cara sebagai berikut :

Dengan melogaritmakan persamaan , diperoleh

Nilai c dan d bisa didapatkan dari rumusan model linier yaitu

dan

dimana

7.1.3Aplikasi dengan minitab

Regresi Linier

Berikut adalah data produksi pulsa tingkat nasional (106)

TahunPulsa

199835451

199937221

200040905

200145875

200250260

200356852

200459981

200567230

200670020

a. Gambarkan diagram pencar

b. Tentukan persamaan regresinya

c. Hitung korelasinya

d. berapakah produksi pulsa pada tahun 2007

Langkah-langkah :

1. Ketik data tersebut pada kolom C1(X) dan C2(Y)

2. Membuat diagram pencar dengan cara: pilih menu graph, lalu pilih scatter plot, klik with regression. Setelah muncul kotak dialog, ketik kolom yang sesuai untuk variabel Y dan X, dan atur skala, dan lain-lain, kemudian OK

Outputnya sebagai berikut :

3. Pilih menu stat, kemudian basic statistics, lalu correlation. Setelah muncul kotak dialog berikut, isi kotak variabel dengan kolom tempat X dan Y, kalau ingin menyimpan matriknya klik store matrix, bila tidak, langsung klik OK

Hasilnya adalah Correlation of X and Y = 0.994, Pvalue = 0.00Karena korelasi antara X dan Y nilainya mendekati 1, maka antara tahun dengan produksi pulsa terdapat hubungan linier, sehingga dapat dianalisis dengan regresi linier.

4. Pilih menu stat, kemudian regression, lalu regression. Setelah muncul kotak dialog, pada kotak respon ketik kolom tempat Y, dan predictor dengan kolom tempat X, kemudian OK

Hasil yang diperoleh adalah :

Dari hasil yang diperoleh tersebut, dapat diketahui bahwa tiap tahun peningkatan produksi pulsa linier. Hal tersebut dapat dilihat dari uji koefisien regresi, semua koefisien, nilai P value nya nol (P value yang dihitung dari T). Dari segi kelayakan model regresi dapat dilihat dari nilai R2 = 98.8% dan pada analisis variansi, nilai P value juga nol. Sehingga dengan menggunakan model regresi di atas, dapat diprediksi produksi pulsa tingkat nasional pada tahun 2007 adalah 74653 (106).

Regresi Non Linier

Berikut ini merupakan contoh dari regresi non linear, diketahui bahwa data penjualan suatu produk dari mulai diproduksi sampai produk tersebut berumur 24 bulan (2 tahun).

Bulan ke-Keuntungan

(dalam ribuan rupiah)

1150

2270

3480

4750

51350

62310

73625

85390

99950

1015510

1126500

1240350

1377510

14111950

15165300

16311600

17627480

18804250

191540980

202314250

213923250

226010500

2312334230

2415975210

Dari data diatas, kita akan mencoba memprediksi keuntungan perusahaan saat produksi berlangsung selama 3 tahun (36 bulan).

Seperti yang telah diketahui sebelumnya, kita dapat membuat diagram pencar (scater plot) dengan mintab, yaitu :

Jelas bahwa regresi linear kurang baik untuk diterapkan. Melihat bentuk diagram pencar diatas kita akan mencoba mendekatinya dengan fungsi non linear yaitu atau . Untuk menentukan persamaan regresi yang terbaik antara dua model tersebut dapat dilihat dari nilai R2.Langkah langkah dengan Minitab

1.Pilih stat, kemudian Regression dan Fitted Line Plot

2.Isi kotak dialog dan optionnya seperti berikut,

Untuk model geometrik isi seperti ini

Untuk model eksponensial isi seperti ini

3.Hasilnya adalah sebagai berikut

Untuk model geometrik

Untuk model eksponensial

4.Kedua model, berdasarkan uji T cukup layak digunakan, tetapi berdasarkan nilai R2 masing masing model, maka diperoleh kesimpulan bahwa model eksponensial lebih baik daripada model geometric.

Jadi persamaan regresi nonlinier yang terbaik adalah

Atau bila dituliskan dalam menjadi

5.Bila dihitung keuntungan pada akhir tahun ke-3 (bulan ke 36) maka diperoleh hasil

ribu.Latihan

1. Berikut adalah pengaruh temperatur pada proses deodorizing terhadap warna suatu produk :

Temperatur (X)Warna (Y)

4600.3

4500.3

4400.4

4300.4

4200.6

4100.5

4500.5

4400.6

4300.6

4200.6

4100.7

4000.6

4200.6

4100.6

4000.6

a. tentukan model regresi linier Y = a + b X

b. Hitung korelasi antara Y dan X

2. Seorang distributor ingin mengetahui hubungan antara biaya pemasangan iklan per minggu dengan hasil penjualannya, datanya sebagai berikut :

Biaya iklan ($)Penjualan ($)

40385

20400

25395

20365

30475

50440

40490

20420

50560

40525

25480

50510

a. Buat diagram pencar

b. Tentukan persamaan garis regresi yang terbaik untuk meramalkan penjualan mingguan berdasarkan biaya iklan

3. Berikut adalah data tentang pengaruh antara nilai ujian pertama dengan nilai ujian kedua :

Nilai ujian pertama (X)Nilai ujian kedua (Y)

4.12.1

2.21.5

2.71.7

6.02.5

8.53.0

4.12.1

9.03.2

8.02.8

7.52.5

8.53.0

9.32.8

9.53.0

7.41.7

a. Gambarkan diagram pencar

b. Tentukan persamaan regresi linier dan non-liniernya

c. Hitung korelasinya dan tentukan regresi yang terbaik

d. berapakah nilai ujian kedua, jika nilai ujian pertama 6.4

8 ANALISIS KOMPONEN UTAMAAnalisis Komponen UtamaDalam statistika, analisis komponen utama (principal component analysis/ PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan.

Analisis komponen utamamerupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untukmereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut(Johnson & Wichern, 1982).Analisis komponen utamamerupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor.

Dilihat secaraaljabar linier,komponen utama adalah kombinasi linier-kombinasi linier tertentu dari p peubah acak x1,x2,x3,.,xp. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan x1,x2,.,xpsebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana.

Menurut Johnson dan Dean, Analisis Komponen Utama terkonsentrasi pada penjelasan struktur variansi dan kovariansi melalui suatu kombinasi linear variabel-variabel asal, dengan tujuan utama melakukan reduksi data dan membuat interpretasi. Analisis komponen utama lebih baik digunakan jika variabel-variabel asal saling berkorelasi (1988: 340).

Contoh:

Examination scores for graduate students in Mathematics

NoDiffgeomcomplexalgebrarealsstatistics

open bookclose book

13658433637

26254504652

33142414029

47678696681

54656525640

61242383828

73946515441

83051545232

92232432822

10940473024

113249543752

124062514049

136475706663

143638586262

152446445549

165050545251

174242523850

18235322216

195653424032

205972706662

212850504263

221946494030

233656565452

245457596258

251435382920

Dengan menggunakan program Minitab, dilakukan analisis data diatas sebagai berikut:

Dari menu pilih menu Stat, kemudian pilih Multivariate, dan pilih Principal Components. Sebagai input variabel, masukkan variabeldiffgeom, complex, algebra, reals dan statistics. Jumlah komponen yang akan dihitung 5, dengan menggunakan type matriks hubungan Covariance (karena memiliki skala ukuran yang sama).

Output yang dihasilkan sebagai berikut:

Statistik Deskriptif

Descriptive Statistics: diffgeom, complex, algebra, reals, statisticsVariable N N* Mean SE Mean StDev Minimum Q1 Median Q3diffgeom 25 0 36.76 3.74 18.68 2.00 23.00 36.00 52.00complex 25 0 50.60 2.41 12.07 32.00 42.00 50.00 56.50algebra 25 0 50.68 1.95 9.77 32.00 43.00 51.00 55.00reals 25 0 46.04 2.58 12.92 22.00 37.50 42.00 55.50statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00Variable Maximumdiffgeom 76.00complex 78.00algebra 70.00reals 66.00statistics 81.00

Analisis Komponen Utama

Principal Component Analysis: diffgeom, complex, algebra, reals, statisticsEigenanalysis of the Correlation MatrixEigenvalue 4.0812 0.3739 0.2166 0.2048 0.1236Proportion 0.816 0.075 0.043 0.041 0.025Cumulative 0.816 0.891 0.934 0.975 1.000Variable PC1 PC2 PC3 PC4 PC5diffgeom 0.443 0.473 -0.352 -0.615 -0.279complex 0.437 0.616 0.368 0.424 0.339algebra 0.462 -0.276 0.210 0.338 -0.743reals 0.445 -0.470 0.470 -0.476 0.367statistics 0.449 -0.317 -0.690 0.318 0.347

Dengan scree plot sebagai berikut:

Terlihat bahwa hanya komponen PC1 yang memiliki varians (atau eigenvalue) lebih besar dari 1, yaitu 4,0812. Komponen pertama ini (PC1) ini dapat menjelaskan 81,6 persen keragaman data. Skor untuk komponen yang dibentuk bisa dihitung dengan melihat nilai koefisien untuk masing-masing variabel. Untuk komponen PC1, skornya bisa dihitung sebagai berikut:

PC1 = 0,443 diffgeom + 0.437 complex + 0.462 algebra + 0.445 reals + 0.449 statistics

Komponen kedua (PC2) memiliki eigenvalue 0.3739 dan dapat menjelaskan 7,5 persen keragaman. Bersama dengan komponen pertama (PC1), keduanya merepresentasikan 89,1 persen dari keragaman total. Skor untuk PC2 dihitung sebagai berikut:

PC2 = 0,473 diffgeom + 0.616 complex 0.276 algebra 0.470 reals 0.317 statistics

Penentuan jumlah komponen yang akan digunakan sangat subjektif. Dalam kasus ini, kedua komponen PC1 dan PC2 yang merepresentasikan 89,1 persen keragaman total bisa dinilai telah cukup menangkap struktur data. Atau bahkan hanya dengan menggunakan komponen pertama pun telah cukup menangkap struktur data, jika dilihat dengan kriteria nilai eigenvalue lebih besar dari 1. Komponen-komponen lainnya memiliki proporsi keragaman yang kecil bisa dianggap tidak penting.

Analisis FaktorAnalisis faktor adalah alat analisis statistik yang dipergunakan untuk mereduksi faktor-faktor yang mempengaruhi suatu variabel menjadi beberapa set indikator saja, tanpa kehilangan informasi yang berarti. Sebagai ilustrasi, terdapat 50 indikator yang diidentifikasi mempunyai pengaruh terhadap keputusan pembelian konsumen. Dengan analisis faktor, ke-50 indikator tersebut akan dikelompokkan menjadi beberapa sub set indikator yang sejenis. Masing-masing kelompok sub set tersebut kemudian diberi nama sesuai dengan indikator yang mengelompok. Pengelompokan berdasarkan kedekatan korelasi antar masing-masing indikator dan penentuan banyaknya sub set berdasarkan nilai eigen values, yang biasanya diambil di atas 1.

Analisis faktor digunakan untuk penelitian awal di mana faktor-faktor yang mempengaruhi suatu variabel belum diidentifikasikan secara baik (explanatory research). Konsep dasar analisis faktor:

1. Bukan mengkaitkan antara dependen variabel dengan independen variabel, TAPI membuat REDUKSI atau ABSTRAKSI atau MERINGKAS dari BANYAK variabel menjadi SEDIKIT variabel.

2. Teknik yang digunakan adalah TEKNIK INTERDEPENSI, yakni SELURUH set HUBUNGAN yang interdependen diteliti. Prinsipnya menggunakan KORELASI r = 1 dan r = 0. Dipergunakan dalam hal mengidentifikasi variabel yang berKORELASI dan yang tidak/kecil KORELASI-nya.

3. Analisis Faktor menekankan adanya COMMUNALITY= jumlah varian yang disumbangkan oleh suatu variabel pada variabel lainnya.

4. Kovariasi antar-variabel yang diuraikan akan memunculkan COMMON FACTORS (jumlahnya sedikit) dan UNIQUE FACTORS setiap variabel. (FAKTOR-FAKTOR tidak secara jelas terlihat).

5. Adanya koefisien nilai faktor (factor score coefficient), sehingga faktor 1 menyerab sebagian besar seluruh variabel, faktor 2 menyerab sebagian besar sisa varian setelah diambil untuk faktor 1. Faktor 2 TIDAK berkorelasi dengan faktor 1.

Contoh:

Dengan menggunakan data pada contoh diatas, kita akan melakukan Analisis Faktor berikut dengan menggunakan program SPSS 16:

Dari menu pilih Analyze Data Reduction Factor..

Pilih kelima variabel sebagai variabel analisis. Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient dan KMO and Bartletts test of sphericity. Klik Continue.

Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue.

Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue.

Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue.

Berikut output dari SPSS:

Correlation Matrix

diffgeomcomplexalgebrarealsstatistics

CorrelationDiffgeom1.000.806.754.733.758

Complex.8061.000.774.695.715

Algebra.754.7741.000.841.838

Reals.733.695.8411.000.785

Statistics.758.715.838.7851.000

KMO and Bartletts Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy..871

Bartletts Test of SphericityApprox. Chi-Square102.847

Df10

Sig..000

Terlihat bahwa antar kelima variabel tersebut memiliki korelasi yang kuat satu sama lain. Uji Bartletts Test of Sphericity juga menunjukkan kelima variabel tersebut saling berkorelasi.

Communalities

InitialExtraction

Diffgeom1.000.803

Complex1.000.778

Algebra1.000.870