Home >Documents >BAB VII - Perception Audio Dan Mp3

BAB VII - Perception Audio Dan Mp3

Date post:05-Mar-2016
Category:
View:31 times
Download:0 times
Share this document with a friend
Description:
pengolahan sinyal multimedia
Transcript:
  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    BAB IIMULTIMEDIA SIGNAL PROCESSING

    a. PERCEPTUAL CODING AND MP3I. Tujuan Percobaan

    1. Mempelajari dasar-dasar persepsi pengkodean audio dan intelektual hakperlindungan dari multimedia.

    2. Desain audio digital watermarking sistem dalam waktu dan domainfrekuensi.

    3. Menjelajahi audio sintetis: MIDI dan MPEG4 Audio terstruktur.

    II. Teori DasarAudio atau suara merupakan gelombang yang mengandung sejumlah

    komponen penting (amplitudo, panjang gelombang dan frekuensi) yang dapatmenyebabkan suara yang satu berbeda dari suara lain. Amplitudo adalahkekuatan atau daya gelombang sinyal. Tinggi gelombang yang bisa dilihat sebagaigrafik, Gelombang yang lebih tinggi diinterpretasikan sebagai volume yang lebihtinggi, Suara beramplitudo lebih besar akan terdengar lebih keras. Frekuensiadalah jumlah dari siklus yang terjadi dalam satu detik. Satuan dari frekuensiadalah Hertz atau disingkat Hz. Getaran gelombang suara yang cepat membuatfrekuensi semakin tinggi. Misalnya, bila menyanyi dalam pita suara tinggimemaksa tali suara untuk bergetar secara cepat. Suara dengan frekuensi lebihbesar akan terdengar lebih tinggi.

    Gelombang suara adalah gelombang yang dihasilkan dari sebuah benda yangbergetar. Sebagai contoh, senar gitar yang dipetik, gitar akan bergetar dangetaran ini merambat di udara, atau air, atau material lainnya. Satu-satunyatempat dimana suara tak dapat merambat adalah ruangan hampa udara.Gelombang suara ini memiliki lembah dan bukit, satu buah lembah dan bukit akanmenghasilkan satu siklus atau periode. Siklus ini berlangsung berulang-ulang,yang membawa pada konsep frekuensi.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    WAV adalah format file audio standar Microsoft dan IBM untuk personalcomputer(PC), biasanya menggunakan pengkodean PCM (Pulse CodeModulation). WAV adalah data tidak terkompres sehingga seluruh sampel audiodisimpan semuanya di harddisk. Perangkat lunak yang dapat menciptakan WAVdari sinyal analog misalnya adalah Windows Sound Recorder. WAV jarang sekalidigunakan di internet karena ukurannya yang relatif besar dengan batasanmaksimal untuk file WAV adalah 2GB.

    Secara umum data audio digital dari WAV memiliki karakteristik yang dapatdinyatakan dengan parameter-parameter berikut:

    a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau4100 sampel/detik.

    b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.c. Jumlah kanal (channel), yaitu 1 untuk mono dan 2 untuk stereo.Parameter-parameter tersebut menyatakan pengaturan yang digunakan oleh

    ADC pada saat data audio direkam. Biasanya laju sampel juga dinyatakan dengansatuan Hz atau kHz. Sebagai gambaran, data audio digital yang tersimpan dalamCD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per sampel, dan 2kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100 sampel,dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju sampelselalu dinyatakan untuk setiap satu kanal (channel). Jadi misalkan suatu dataaudio digital memiliki 2 kanal (channel) dengan laju sampel 8000 sampel/detik,maka di dalam setiap detiknya akan terdapat 16000 sampel.

    MPEG-1 audio layer III atau yang lebih dikenal dengan MP3, adalahpengkodean dalam digital audio dan juga merupakan format kompresi audio yangmemiliki sifat menghilangkan. Istilah menghilangkan yang dimaksud adalahkompresi audio ke dalam format mp3 menghilangkan aspek-aspek yang tidaksignifikan pada pendengaran manusia untuk mengurangi besarnya file audio.

    Sejarah MP3 dimulai dari tahun 1991 saat proposal dari Phillips (Belanda),CCET (Perancis), dan Institut fr Rundfunktechnik (Jerman) memenangkan proyek

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    untuk DAB (Digital Audio Broadcast). Produk mereka seperti Musicam (lebihdikenal dengan layer 2) terpilih karena kesederhanaan, ketahanan terhadapkesalahan, dan perhitungan komputasi yang sederhana untuk melakukanpengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Padaakhirnya ide dan teknologi yang digunakan dikembangkan menjadi MPEG-1 audiolayer 3. MP3 adalah pengembangan dari teknologi sebelumnya sehingga denganukuran yang lebih kecil dapat menghasilkan kualitas yang setara dengan kualitasCD.

    III. Alat dan Bahan yang Digunakan1. 1 perangkat personal computer2. Program aplikasi Matlab

    IV. Prosedur Percobaan1. Model psychoacoustic dan persepsi pengkodean

    Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak penelitidi bidang psychoacoustics mengeksploitasi tidak relevan sinyal informasiyang tidak terdeteksi bahkan oleh pendengar terlatih atau sensitive . studi-studi ini menyebabkan lima psychoancoustic.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Ambang mutlak hearing : threshold ini merupakan jumlah minimal energyjika pendengar mampu mendeteksi nada murni dalam lingkungan takbersuara jika sebuah nada diberikan terlalu lemah, kita tidak bisamendengarnya, jadi kita tidak perlu menyalinnya.

    Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai nonuniform filter bank yang terdiri dari 25 filter bandpass sangat tumpangtindih. Band kritis adalah pass band dari filter mereka.

    Simultaneous masking : Dalam setiap critical band, satu suara (themaskee) diterjemahkan tak terdengar karena kehadiran suara yang lain(the masker ). Kita dapat mengidentifikasi sebuah masker dan tidakmenyandikan tak terdengar, masked tones.

    Spread of masking : masking pada sebuah critical band dapatmenyebarkan neighboring bands.

    Non-Simultaneous masking : Masking juga dapat dilakukan dalam domainwaktu.Untuk perceptual coding, encoder menghasilkan sebuah global masker

    yang sesuai dengan prinsip di atas dan memberikan parameter untuk diproseslebih lanjut. Pada bagian ini kami menyelidiki ambang mutlak pendengarandan prinsip-prinsip yang menandai simultan.

    a. The absolute threshold of hearingPada bagian ini kita menggunakan PM_Abs_Thre_Hearing.m. untuk

    mengeksplorasi batas absolute pendengaran. Tujuan dari penelitian ini adalahuntuk mengetahui ambang batas volume yang hanya auditable padafrekuensi tertentu. Dengan kata lain, diberikan nada dengan sama frekuensi,jika memilih volume sedikit lebih rendah dari batas ini, menjadi tak terdengar.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.Setelah mengatur buku ini, Anda akan melihat gambar diatas. Setiaplingkaranmewakili komponen frekuensi dan kita dapat mengurangi volumedengan hanyatertinggal mengklik mouse di sisi atas/bawah lingkaran ini. Andadapat klik kananmouse untuk keluar dari program ini. Menemukan jalankeluar untuk telinga Anda pada frekuensi 11 yang ditunjukkan padagambar.Sosok hasil Anda menggunakan mengedit salinan gambar dari menubarjendela gambar copy dan paste ke laporan Anda.

    b. Simultan Masking:Dalam bagian ini, kita menggunakan PM_Simu_Masking.m untuk

    menjelajahi maskingsimultan, yang berarti bahwa nada bisa menjadimerender jika ada nada simultandengan volume yang lebih tinggi padafrekuensi yang tetangga. Untuk setiap band yang kritis,kita bisa memperbaikivolume frekuensi tengah. Dengan menambahkan nada tetangga yangberbeda amplitudo, kita bisa menemukan ambang atas nada ini tetanggaterdengar jika amplitudo lebih rendah daripada batas, tapi audible jikaamplitudo lebih tinggi daripada ambang batas.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengarvolume minimal untuk 4KHz. Setelah kalibrasi, Anda akan melihat sosok lainyang digambarkan di bawah ini. Ada tujuh frekuensi yang ditunjukkan olehlingkaran. Tengah satu mewakili Pusat frekuensi band kritis yang spesifik.Ketika kita klik tetangga frekuensi, program ini akan menghasilkan sinyalaudio yang terdiri dari pusat frekuensi dan frekuensi dipilih. Kami dapatmenambah/mengurangi volume oleh hanya mengklik kiri mouse di sisiatas/bawah lingkaran ini. Setelah mencari tahu ambang frekuensi enam(kecuali frekuensi tengah), klik kanan mouse untuk keluar dari program ini.

    Pilih dua band kritis yang berbeda 3 dan mengetahui masking simultandari Anda telinga. Salin angkaangka ini dua menggunakan mengedit salinangambar dari menubar ini mencari jendela dan sisipkan mereka di laporanAnda. Untuk setiap band yang kritis,membandingkan topeng frekuensitetangga yang lebih tinggi dengan yang lebih rendah.

    2. Audio Ekstraksi dan MP3MP3 (MPEG1 Audio Layer 3) adalah standar pengkodean/kompresi audio

    yang menggunakan persepsi pengkodean teknologi. Dalam bagian ini, kitamenggunakan GoldWaveuntuk mengambil sepotong musik dan kompres dalam

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerjadengan membandingkan spektrum frekuensi sinyal mentah dan MP3 file:

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    a

Click here to load reader

Embed Size (px)
Recommended