YOU ARE DOWNLOADING DOCUMENT

Please tick the box to continue:

Transcript
  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    BAB IIMULTIMEDIA SIGNAL PROCESSING

    a. PERCEPTUAL CODING AND MP3I. Tujuan Percobaan

    1. Mempelajari dasar-dasar persepsi pengkodean audio dan intelektual hakperlindungan dari multimedia.

    2. Desain audio digital watermarking sistem dalam waktu dan domainfrekuensi.

    3. Menjelajahi audio sintetis: MIDI dan MPEG4 Audio terstruktur.

    II. Teori DasarAudio atau suara merupakan gelombang yang mengandung sejumlah

    komponen penting (amplitudo, panjang gelombang dan frekuensi) yang dapatmenyebabkan suara yang satu berbeda dari suara lain. Amplitudo adalahkekuatan atau daya gelombang sinyal. Tinggi gelombang yang bisa dilihat sebagaigrafik, Gelombang yang lebih tinggi diinterpretasikan sebagai volume yang lebihtinggi, Suara beramplitudo lebih besar akan terdengar lebih keras. Frekuensiadalah jumlah dari siklus yang terjadi dalam satu detik. Satuan dari frekuensiadalah Hertz atau disingkat Hz. Getaran gelombang suara yang cepat membuatfrekuensi semakin tinggi. Misalnya, bila menyanyi dalam pita suara tinggimemaksa tali suara untuk bergetar secara cepat. Suara dengan frekuensi lebihbesar akan terdengar lebih tinggi.

    Gelombang suara adalah gelombang yang dihasilkan dari sebuah benda yangbergetar. Sebagai contoh, senar gitar yang dipetik, gitar akan bergetar dangetaran ini merambat di udara, atau air, atau material lainnya. Satu-satunyatempat dimana suara tak dapat merambat adalah ruangan hampa udara.Gelombang suara ini memiliki lembah dan bukit, satu buah lembah dan bukit akanmenghasilkan satu siklus atau periode. Siklus ini berlangsung berulang-ulang,yang membawa pada konsep frekuensi.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    WAV adalah format file audio standar Microsoft dan IBM untuk personalcomputer(PC), biasanya menggunakan pengkodean PCM (Pulse CodeModulation). WAV adalah data tidak terkompres sehingga seluruh sampel audiodisimpan semuanya di harddisk. Perangkat lunak yang dapat menciptakan WAVdari sinyal analog misalnya adalah Windows Sound Recorder. WAV jarang sekalidigunakan di internet karena ukurannya yang relatif besar dengan batasanmaksimal untuk file WAV adalah 2GB.

    Secara umum data audio digital dari WAV memiliki karakteristik yang dapatdinyatakan dengan parameter-parameter berikut:

    a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau4100 sampel/detik.

    b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.c. Jumlah kanal (channel), yaitu 1 untuk mono dan 2 untuk stereo.Parameter-parameter tersebut menyatakan pengaturan yang digunakan oleh

    ADC pada saat data audio direkam. Biasanya laju sampel juga dinyatakan dengansatuan Hz atau kHz. Sebagai gambaran, data audio digital yang tersimpan dalamCD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per sampel, dan 2kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100 sampel,dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju sampelselalu dinyatakan untuk setiap satu kanal (channel). Jadi misalkan suatu dataaudio digital memiliki 2 kanal (channel) dengan laju sampel 8000 sampel/detik,maka di dalam setiap detiknya akan terdapat 16000 sampel.

    MPEG-1 audio layer III atau yang lebih dikenal dengan MP3, adalahpengkodean dalam digital audio dan juga merupakan format kompresi audio yangmemiliki sifat menghilangkan. Istilah menghilangkan yang dimaksud adalahkompresi audio ke dalam format mp3 menghilangkan aspek-aspek yang tidaksignifikan pada pendengaran manusia untuk mengurangi besarnya file audio.

    Sejarah MP3 dimulai dari tahun 1991 saat proposal dari Phillips (Belanda),CCET (Perancis), dan Institut fr Rundfunktechnik (Jerman) memenangkan proyek

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    untuk DAB (Digital Audio Broadcast). Produk mereka seperti Musicam (lebihdikenal dengan layer 2) terpilih karena kesederhanaan, ketahanan terhadapkesalahan, dan perhitungan komputasi yang sederhana untuk melakukanpengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Padaakhirnya ide dan teknologi yang digunakan dikembangkan menjadi MPEG-1 audiolayer 3. MP3 adalah pengembangan dari teknologi sebelumnya sehingga denganukuran yang lebih kecil dapat menghasilkan kualitas yang setara dengan kualitasCD.

    III. Alat dan Bahan yang Digunakan1. 1 perangkat personal computer2. Program aplikasi Matlab

    IV. Prosedur Percobaan1. Model psychoacoustic dan persepsi pengkodean

    Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak penelitidi bidang psychoacoustics mengeksploitasi tidak relevan sinyal informasiyang tidak terdeteksi bahkan oleh pendengar terlatih atau sensitive . studi-studi ini menyebabkan lima psychoancoustic.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Ambang mutlak hearing : threshold ini merupakan jumlah minimal energyjika pendengar mampu mendeteksi nada murni dalam lingkungan takbersuara jika sebuah nada diberikan terlalu lemah, kita tidak bisamendengarnya, jadi kita tidak perlu menyalinnya.

    Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai nonuniform filter bank yang terdiri dari 25 filter bandpass sangat tumpangtindih. Band kritis adalah pass band dari filter mereka.

    Simultaneous masking : Dalam setiap critical band, satu suara (themaskee) diterjemahkan tak terdengar karena kehadiran suara yang lain(the masker ). Kita dapat mengidentifikasi sebuah masker dan tidakmenyandikan tak terdengar, masked tones.

    Spread of masking : masking pada sebuah critical band dapatmenyebarkan neighboring bands.

    Non-Simultaneous masking : Masking juga dapat dilakukan dalam domainwaktu.Untuk perceptual coding, encoder menghasilkan sebuah global masker

    yang sesuai dengan prinsip di atas dan memberikan parameter untuk diproseslebih lanjut. Pada bagian ini kami menyelidiki ambang mutlak pendengarandan prinsip-prinsip yang menandai simultan.

    a. The absolute threshold of hearingPada bagian ini kita menggunakan PM_Abs_Thre_Hearing.m. untuk

    mengeksplorasi batas absolute pendengaran. Tujuan dari penelitian ini adalahuntuk mengetahui ambang batas volume yang hanya auditable padafrekuensi tertentu. Dengan kata lain, diberikan nada dengan sama frekuensi,jika memilih volume sedikit lebih rendah dari batas ini, menjadi tak terdengar.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.Setelah mengatur buku ini, Anda akan melihat gambar diatas. Setiaplingkaranmewakili komponen frekuensi dan kita dapat mengurangi volumedengan hanyatertinggal mengklik mouse di sisi atas/bawah lingkaran ini. Andadapat klik kananmouse untuk keluar dari program ini. Menemukan jalankeluar untuk telinga Anda pada frekuensi 11 yang ditunjukkan padagambar.Sosok hasil Anda menggunakan mengedit salinan gambar dari menubarjendela gambar copy dan paste ke laporan Anda.

    b. Simultan Masking:Dalam bagian ini, kita menggunakan PM_Simu_Masking.m untuk

    menjelajahi maskingsimultan, yang berarti bahwa nada bisa menjadimerender jika ada nada simultandengan volume yang lebih tinggi padafrekuensi yang tetangga. Untuk setiap band yang kritis,kita bisa memperbaikivolume frekuensi tengah. Dengan menambahkan nada tetangga yangberbeda amplitudo, kita bisa menemukan ambang atas nada ini tetanggaterdengar jika amplitudo lebih rendah daripada batas, tapi audible jikaamplitudo lebih tinggi daripada ambang batas.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengarvolume minimal untuk 4KHz. Setelah kalibrasi, Anda akan melihat sosok lainyang digambarkan di bawah ini. Ada tujuh frekuensi yang ditunjukkan olehlingkaran. Tengah satu mewakili Pusat frekuensi band kritis yang spesifik.Ketika kita klik tetangga frekuensi, program ini akan menghasilkan sinyalaudio yang terdiri dari pusat frekuensi dan frekuensi dipilih. Kami dapatmenambah/mengurangi volume oleh hanya mengklik kiri mouse di sisiatas/bawah lingkaran ini. Setelah mencari tahu ambang frekuensi enam(kecuali frekuensi tengah), klik kanan mouse untuk keluar dari program ini.

    Pilih dua band kritis yang berbeda 3 dan mengetahui masking simultandari Anda telinga. Salin angkaangka ini dua menggunakan mengedit salinangambar dari menubar ini mencari jendela dan sisipkan mereka di laporanAnda. Untuk setiap band yang kritis,membandingkan topeng frekuensitetangga yang lebih tinggi dengan yang lebih rendah.

    2. Audio Ekstraksi dan MP3MP3 (MPEG1 Audio Layer 3) adalah standar pengkodean/kompresi audio

    yang menggunakan persepsi pengkodean teknologi. Dalam bagian ini, kitamenggunakan GoldWaveuntuk mengambil sepotong musik dan kompres dalam

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerjadengan membandingkan spektrum frekuensi sinyal mentah dan MP3 file:

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    a. CD Audio ekstraksi: klik ToolsCD audio ekstraksi dari GoldWave's menuBar. Jendela ekstraksi audio yang akan muncul. Gunakan tool ini untukmengekstraksekitar sepuluh detik musik 4 dari CD musik favorit Andadan menyimpannya sebagai 16-bit stereo ditandatangani WAV file.Nama itu sebagai original.wav.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    b. Downsampling: untuk membandingkan dengan MP3, kita perludownsample fileWAV ini. Klik Efek Resample dan memilih 16000 Hz.Simpan file ini sebagai downsample.wav.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    c. Menghasilkan MP3 file oleh File Save As. pilih Simpan sebagai jenissebagaigelombang Audio. Menyesuaikan parameter dalam File atributsebagai MPEG Layer 3, 32kbps, 16000Hz, stereo. Nama file baru inisebagai wav2mp3.wav.

    d. Mengkonversi MP3 ke wave: Reload wav2mp3 file dan menyimpannyasebagai 16bit stereo ditandatangani WAV file. Nama itu sebagaireconstructed_wav.wav.

    e. Bandingkan spektrum: menggunakan Compare_Spectrum.m 5 untuk plotspektrum untuk downsample.wav dan reconstructed_wav.wav.Membandingkan perbedaan antara audio dua chip dan mendiskusikanpada frekuensi yang berkisar psychoacoustic model ini memiliki dampakyang signifikan.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    V.Data Hasil Simulasi1. Model Psychoacoustic dan Coding perseptual

    a. Absolute Threshold of HearingScript PM_Abs_Thre_Hearing.m

    function [LogX,volumnY]=PM_Abs_Thre_Hearing

    % function [LogX,volumnY]=PM_Abs_Thre_Hearing% measure absolute threshold of hearing

    % LogX : vector of x

    % volumnY : the corresponding absolute threshold of hearing

    % Two stages in this program

    % Stage 1: Calibrate the 4KHz threshold, adjust the volume to justnoticeable auditible.

    % We use this for reference to adjust the other frequency% Stage 2: Measure absolute threshold of hearing 10 frequencies

    % 1. For each frequenct,users can change the volume in a

    specific frequency

    % by left clicking mouse. Users can move upper and

    lower until selecting

    % a threshold which is just noticeable auditible.% Suggestion: the threshold had better to be choosed by

    increasing the volume.

    % Because if user changes it by reducing,

    he/she will expect the sound% 2. After setting those 10 frequencies, right click mouse

    and exit this program.

    % 3. This function also returns those thresholds ,

    [LogX,volumnY], back% 4. Users can also copy or save this figure by Edit -->

    Copy Figure or File --> Save As

    %

    % Author : Guan-Ming Su

    % Date : 3/10/02

    close all;

    clear all;

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    SampleRate=40000;

    Max_bit=16;

    total_time=0.75;

    t=0:total_time*SampleRate-1;

    %%%% calibrate 4k for min tone

    figure

    min_4K_amp=1;

    k4x=1:3; k4y=[0 1 0]; bar(k4x,k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click toStage 2');ylabel('Bits');xlabel('Current value: 1');grid on;

    CaliFlag=1;

    F4k=4000;

    while CaliFlag==1

    [x1,y1, butn]=ginput(1);if butn==3; break; % right click

    else ; min_4K_amp=y1; end;

    min_4K_amp=1/power(2,Max_bit-y1);y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);bar(k4x,y1*k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click

    to Stage 2');ylabel('Bits');xlabel(strcat('Current value: ',num2str(y1)));grid on;

    sound(y4k,SampleRate);end

    close all;

    % measure the absolute threshold of hearing

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    figure

    StopFlag=0;

    startLogX=2; EndLogX=4; numLogX=11;

    min_Volume=-10;max_Volume=40;

    volumnY=ones(1,numLogX);LogX=logspace(startLogX,EndLogX,numLogX);dividerLogX=logspace(startLogX,EndLogX,numLogX*2-1);dividerLogX=dividerLogX(2:2:end); dividerLogX=[0 dividerLogX];semilogx(LogX,volumnY,'-o');axis([power(10,startLogX) power(10,EndLogX) min_Volume max_Volume]);title('Stage 2: Measure Absolute Threshold of Hearing');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click toExit');grid on

    min_4K_power=min_4K_amp^2;

    while StopFlag==0

    [x1,y1, butn]=ginput(1);if butn==3; break; % right click

    else

    newFindex=find(x1 > dividerLogX );selectF=newFindex(end);newF=LogX(selectF);newAMP=sqrt(min_4K_power*power(10,y1/10));volumnY(selectF)=y1;semilogx(LogX,volumnY,'-o');title('Stage 2: Measure Absolute Threshold of Hearing');axis([power(10,startLogX) power(10,EndLogX) min_Volume

    max_Volume]);xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click to

    Exit');grid on

    y1=newAMP*sin(2*pi*newF*t/SampleRate);

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    sound(y1,SampleRate)end

    end

    Gambar 5.1 Hasil Running 1

    Gambar 5.2 Hasil Running 2b. Simultaneous Masking

    Script PM_Simu_Masking.mfunction [LinX,volumnY]=PM_Simu_Masking(ith_CB)

    % function [LinX,volumnY]=PM_Simu_Masking(ith_CB)% Measure simultaneous masking

    % output

    102 103 104-10

    -5

    0

    5

    10

    15

    20

    25

    30

    35

    40Stage 2: Measure Absolute Threshold of Hearing

    Frequency(Hz)

    Relat

    ed So

    und P

    ressu

    re Le

    vel to

    4K Hz

    , rSPL

    (dB)

    Left Click mouse to adjust the volume. Right click to Exit

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    % LinX : vector of x

    % volumnY : the corresponding simultaneous mask

    % input

    % ith_CB : select the ith Critical Band

    % Two stages in this program

    % Stage 1: Calibrate the 4KHz threshold, adjust the volume to justnoticeable auditible.

    % We use this for reference to adjust the other frequency% Stage 2: Measure Measure simultaneous masking for 6 frequencies

    % 1. For each frequenct,users can change the volume in a

    specific frequency

    % by left clicking mouse. Users can move upper and

    lower until selecting

    % a mask which the neighbor tone is maksed by the center

    frequency tone

    % Suggestion: the threshold had better to be choosed by

    increasing the volume.

    % Because if user changes it by reducing,

    he/she will expect the sound% 2. After setting those 6 frequencies, right click mouse

    and exit this program.

    % 3. This function also returns those thresholds ,

    [LogX,volumnY], back% 4. Users can also copy or save this figure by Edit -->

    Copy Figure or File --> Save As

    %

    % Author : Guan-Ming Su

    % Date : 3/10/02

    close all;

    % Idealized Critical Band Filter Bank.

    CB_FB=[ 50 0 100; 150 100 200; 250 200 300; 350 300400; 450 400 510; 570 510 630;

    700 630 770; 840 770 920; 1000 920 1080; 1175 1080

    1270; 1370 1270 1480; 1600 1480 1720;

    1850 1720 2000; 2150 2000 2320; 2500 2320 2700; 2900 2700

    3150; 3400 3150 3700; 4000 3700 4400;

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    4800 4400 5300; 5800 5300 6400; 7000 6400 7700; 8500 7700

    9500;10500 9500 12000; 13500 12000 15500];numX=7; % number fo frequencies to plot the masking

    NumCB=size(CB_FB,1);if (ith_CB > NumCB)|(ith_CB < 1) % error detection

    error('There is no such a critical band existing');end

    % initilized parameters.

    SampleRate=40000;

    Max_bit=16;

    total_time=0.75;

    t=0:total_time*SampleRate-1;

    min_4K_amp=1;

    %%%% calibrate 4k for min tone

    figure

    k4x=1:3; k4y=[0 1 0]; bar(k4x,k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click toStage 2');ylabel('Bits');xlabel('Current value: 1');grid on;

    CaliFlag=1;

    F4k=4000;

    while CaliFlag==1

    [x1,y1, butn]=ginput(1);if butn==3; break; % right click

    else ; min_4K_amp=y1; end;

    min_4K_amp=1/power(2,Max_bit-y1);y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);bar(k4x,y1*k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click

    to Stage 2');ylabel('Bits');

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    xlabel(strcat('Current value: ',num2str(y1)));grid on;

    sound(y4k,SampleRate);end

    close all;

    min_4K_power=min_4K_amp^2;

    % measure the simultaneous masking

    figure

    StopFlag=0;

    CenterX=CB_FB(ith_CB,1);startX=CB_FB(ith_CB,2);EndX=CB_FB(ith_CB,3);centerFreqIndex=ceil(numX/2);passband=EndX-startX; plot_range=[CenterX-passbandCenterX+passband];max_mid_Freq_AMP=0.45;

    mid_Freq_DB=10*log10((max_mid_Freq_AMP^2)/min_4K_power);min_Volume=-10; max_Volume=10*ceil(mid_Freq_DB/10)+10;volumnY=ones(1,numX); volumnY(centerFreqIndex)=mid_Freq_DB;LinX=linspace(startX,EndX,numX);dividerLinX=linspace(startX,EndX,numX*2-1);dividerLinX=dividerLinX(2:2:end); dividerLinX=[0 dividerLinX];plot(LinX,volumnY,'-o');axis([plot_range(1) plot_range(2) min_Volume max_Volume]);title('Stage 2: Measure simultaneous masking');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click toExit');grid on

    % centeral tone

    yc=max_mid_Freq_AMP*sin(2*pi*CenterX*t/SampleRate);

    while StopFlag==0

    [x1,y1, butn]=ginput(1);if butn==3; break; % right click

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    else

    newFindex=find(x1 > dividerLinX );selectF=newFindex(end);if selectF==centerFreqIndex % centeral tone

    sound(yc,SampleRate);else

    newF=LinX(selectF);newAMP=sqrt(min_4K_power*power(10,y1/10));volumnY(selectF)=y1;plot(LinX,volumnY,'-o');axis([plot_range(1) plot_range(2) min_Volume max_Volume]);title('Stage 2: Measure simultaneous masking');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click to

    Exit');grid on

    y1=newAMP*sin(2*pi*newF*t/SampleRate); % generateneighboring tone

    ymix=y1+yc; % add two tones

    sound(ymix,SampleRate);end

    end

    end

    Gambar 5.3 Idealized Critical Band Filter Bank

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Gambar 5.4 Ketik kode critical band yang akan digunakanKode yang digunakan adalah 1, yaitu 50 0 100;

    Gambar 5.5 Kalibrasi 4K Hz treshold pada 10 bits

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    Gambar 5.6 Hasil running 12. Audio Extraction and MP3

    a. Audio Extraction

    Gambar 5.7 original.wav

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    b. Downsampling

    Gambar 5.8 downsampling.wavc. Generate MP3

    Gambar 5.9 wav2mp3.wav

    d. Convert to MP3

    Gambar 5.10 wav2mp3.mp3

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    e. Compare Spectrum

    Gambar 5.12 Hasil Compare

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    VI.Analisa Data Hasil Simulasi1. Psychoacoustic Models and Perceptual Coding

    a. Absolute Threshold of HearingPada percobaan kali ini, software Matlab-lah yang digunakan sebagaisoftware utama. Absolute Threshold of Hearing atau Ambang mutlakpendengaran ( ATH ) adalah tingkat suara minimal nada murni bahwatelinga manusia rata-rata dengan pendengaran normal bisa mendengartanpa hadir suara lainnya . Ambang mutlak berkaitan dengan suara yanghanya dapat didengar oleh organisme . Ambang batas absolut bukanlahtitik diskrit oleh karena itu digolongkan sebagai titik di mana suaramemunculkan respon persentase tertentu dari waktu . Dari langkah-langkah yang dilakukan diperoleh nilai sebesar 9.4269 untuk kalibrasi 4KHz threshold.

    b. Simultaneous MaskingUntuk percobaannya ini, hampir sama dengan langkah sebelumnya.Dibutuhkan kalibrasi 4 KHz. Simultaneous masking merupakan fenomenadomain frekuensi di mana sinyal rendah tingkat , misalnya , suarasmallband ( maskee ) dapat dibuat tak terdengar oleh simultan yangterjadi sinyal yang lebih kuat ( masker ) , misalnya , nada murni, jikamasker dan maskee cukup untuk menutup satu sama lain dalam frekuensi.Sebuah ambang masking dapat diukur di bawah ini yang sinyal apapuntidak akan terdengar. Pada masking threshold tergantung pada tingkattekanan suara ( SPL ) dan frekuensi masker , dan pada karakteristik maskerdan maskee.

    2. Audio Extraction and MP3a. Audio Extraction

    Untuk langkah kedua ini, software yang digunakan adalah Goldwave . Fileaudio yang berformat mp3 dengan size 7.34 MB dikonfersi ke format wavdengna size yan meningkat drastic menjadi 34.8 MB. Hal ini dikarenakan

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    kualitas audio yang dihasilkan dari format lebih jernih dan lebih baikdibanding mp3. WAV adalah format file audio standar Microsoft dan IBMuntuk personal computer (PC), biasanya menggunakan pengkodean PCM(Pulse Code Modulation). Pada WAV, data tidak terkompres sehinggaseluruh sampel audio tetap ada.

    b. DownsamplingPada percobaan downsampling, diperoleh size 11 MB. Hal ini dikarenakandownsampling adalah teknik untuk menurunkan sample rate audionya.

    c. Generate MP3Pada langkah ini, file yang berdurasi 10 detik dengan format WAVberukuran 34.8 MB dikonversi ke format MP3 dan diperoleh size 744 KB.Hal ini dikarenakan format MP3 membuat audio-audio yang tidakdibutuhkan oleh telinga, sehingga size-nya berkurang.

    d. RekonstruksiPada langkah ini, hasil yang diperoleh tidak jauh beda dengan langkahsebelumya.

    e. Compare SpectrumPada langkah ini, digunakan Matlab untuk dapat membandingkan dua dileaudio. Dari hasil matlab diperoleh perbedaannya sangat sedikit. Hal inidikarenakan size dari file yang direkonstruksi dan downsamplingperbedaannya hanya sedikit.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    VII.Kesimpulan1. Bunyi dengan frekuensi 20-20.000 Hz hanya dapat didengar ole telinga

    manusia2. Format audio file WAV atau waveform audio merupakan format audio yang

    yang tidak terkompres sehingga ukurannya besar sekali. Sedangkan formatMP3 merupakan format audio yang umum digunakan karena size-nya cukuprendah karena audio dikompresi atau audio yang tidak dibutuhkan olehtelinga dibuang.

    3. Downsampling merupakan teknik untuk menurunkan sample rate audio-nya.

  • PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

    IMAGE PROCESSING

    LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

    MAHARANI AYU LESTARI / D41112285

    DAFTAR PUSTAKA

    http://core.ac.uk/download/pdf/11719325.pdf

    http://lecturer.polindra.ac.id/~munengsih/wp-content/uploads/2012/04/3-Audio-dan-Video1.pdf

    http://repository.usu.ac.id/bitstream/123456789/19785/3/Chapter%20II.pdf