BAB VII - Perception Audio Dan Mp3

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

IMAGE PROCESSING

LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

MAHARANI AYU LESTARI / D41112285

BAB IIMULTIMEDIA SIGNAL PROCESSING

a. PERCEPTUAL CODING AND MP3I. Tujuan Percobaan

1. Mempelajari dasar-dasar persepsi pengkodean audio dan intelektual hakperlindungan dari multimedia.

2. Desain audio digital watermarking sistem dalam waktu dan domainfrekuensi.

3. Menjelajahi audio sintetis: MIDI dan MPEG4 Audio terstruktur.

II. Teori DasarAudio atau suara merupakan gelombang yang mengandung sejumlah

komponen penting (amplitudo, panjang gelombang dan frekuensi) yang dapatmenyebabkan suara yang satu berbeda dari suara lain. Amplitudo adalahkekuatan atau daya gelombang sinyal. Tinggi gelombang yang bisa dilihat sebagaigrafik, Gelombang yang lebih tinggi diinterpretasikan sebagai volume yang lebihtinggi, Suara beramplitudo lebih besar akan terdengar lebih keras. Frekuensiadalah jumlah dari siklus yang terjadi dalam satu detik. Satuan dari frekuensiadalah Hertz atau disingkat Hz. Getaran gelombang suara yang cepat membuatfrekuensi semakin tinggi. Misalnya, bila menyanyi dalam pita suara tinggimemaksa tali suara untuk bergetar secara cepat. Suara dengan frekuensi lebihbesar akan terdengar lebih tinggi.

Gelombang suara adalah gelombang yang dihasilkan dari sebuah benda yangbergetar. Sebagai contoh, senar gitar yang dipetik, gitar akan bergetar dangetaran ini merambat di udara, atau air, atau material lainnya. Satu-satunyatempat dimana suara tak dapat merambat adalah ruangan hampa udara.Gelombang suara ini memiliki lembah dan bukit, satu buah lembah dan bukit akanmenghasilkan satu siklus atau periode. Siklus ini berlangsung berulang-ulang,yang membawa pada konsep frekuensi.


IMAGE PROCESSING



WAV adalah format file audio standar Microsoft dan IBM untuk personalcomputer(PC), biasanya menggunakan pengkodean PCM (Pulse CodeModulation). WAV adalah data tidak terkompres sehingga seluruh sampel audiodisimpan semuanya di harddisk. Perangkat lunak yang dapat menciptakan WAVdari sinyal analog misalnya adalah Windows Sound Recorder. WAV jarang sekalidigunakan di internet karena ukurannya yang relatif besar dengan batasanmaksimal untuk file WAV adalah 2GB.

Secara umum data audio digital dari WAV memiliki karakteristik yang dapatdinyatakan dengan parameter-parameter berikut:

a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau4100 sampel/detik.

b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.c. Jumlah kanal (channel), yaitu 1 untuk mono dan 2 untuk stereo.Parameter-parameter tersebut menyatakan pengaturan yang digunakan oleh

ADC pada saat data audio direkam. Biasanya laju sampel juga dinyatakan dengansatuan Hz atau kHz. Sebagai gambaran, data audio digital yang tersimpan dalamCD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per sampel, dan 2kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100 sampel,dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju sampelselalu dinyatakan untuk setiap satu kanal (channel). Jadi misalkan suatu dataaudio digital memiliki 2 kanal (channel) dengan laju sampel 8000 sampel/detik,maka di dalam setiap detiknya akan terdapat 16000 sampel.

MPEG-1 audio layer III atau yang lebih dikenal dengan MP3, adalahpengkodean dalam digital audio dan juga merupakan format kompresi audio yangmemiliki sifat menghilangkan. Istilah menghilangkan yang dimaksud adalahkompresi audio ke dalam format mp3 menghilangkan aspek-aspek yang tidaksignifikan pada pendengaran manusia untuk mengurangi besarnya file audio.

Sejarah MP3 dimulai dari tahun 1991 saat proposal dari Phillips (Belanda),CCET (Perancis), dan Institut fr Rundfunktechnik (Jerman) memenangkan proyek


IMAGE PROCESSING



untuk DAB (Digital Audio Broadcast). Produk mereka seperti Musicam (lebihdikenal dengan layer 2) terpilih karena kesederhanaan, ketahanan terhadapkesalahan, dan perhitungan komputasi yang sederhana untuk melakukanpengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Padaakhirnya ide dan teknologi yang digunakan dikembangkan menjadi MPEG-1 audiolayer 3. MP3 adalah pengembangan dari teknologi sebelumnya sehingga denganukuran yang lebih kecil dapat menghasilkan kualitas yang setara dengan kualitasCD.

III. Alat dan Bahan yang Digunakan1. 1 perangkat personal computer2. Program aplikasi Matlab

IV. Prosedur Percobaan1. Model psychoacoustic dan persepsi pengkodean

Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak penelitidi bidang psychoacoustics mengeksploitasi tidak relevan sinyal informasiyang tidak terdeteksi bahkan oleh pendengar terlatih atau sensitive . studi-studi ini menyebabkan lima psychoancoustic.


IMAGE PROCESSING



Ambang mutlak hearing : threshold ini merupakan jumlah minimal energyjika pendengar mampu mendeteksi nada murni dalam lingkungan takbersuara jika sebuah nada diberikan terlalu lemah, kita tidak bisamendengarnya, jadi kita tidak perlu menyalinnya.

Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai nonuniform filter bank yang terdiri dari 25 filter bandpass sangat tumpangtindih. Band kritis adalah pass band dari filter mereka.

Simultaneous masking : Dalam setiap critical band, satu suara (themaskee) diterjemahkan tak terdengar karena kehadiran suara yang lain(the masker ). Kita dapat mengidentifikasi sebuah masker dan tidakmenyandikan tak terdengar, masked tones.

Spread of masking : masking pada sebuah critical band dapatmenyebarkan neighboring bands.

Non-Simultaneous masking : Masking juga dapat dilakukan dalam domainwaktu.Untuk perceptual coding, encoder menghasilkan sebuah global masker

yang sesuai dengan prinsip di atas dan memberikan parameter untuk diproseslebih lanjut. Pada bagian ini kami menyelidiki ambang mutlak pendengarandan prinsip-prinsip yang menandai simultan.

a. The absolute threshold of hearingPada bagian ini kita menggunakan PM_Abs_Thre_Hearing.m. untuk

mengeksplorasi batas absolute pendengaran. Tujuan dari penelitian ini adalahuntuk mengetahui ambang batas volume yang hanya auditable padafrekuensi tertentu. Dengan kata lain, diberikan nada dengan sama frekuensi,jika memilih volume sedikit lebih rendah dari batas ini, menjadi tak terdengar.


IMAGE PROCESSING



Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.Setelah mengatur buku ini, Anda akan melihat gambar diatas. Setiaplingkaranmewakili komponen frekuensi dan kita dapat mengurangi volumedengan hanyatertinggal mengklik mouse di sisi atas/bawah lingkaran ini. Andadapat klik kananmouse untuk keluar dari program ini. Menemukan jalankeluar untuk telinga Anda pada frekuensi 11 yang ditunjukkan padagambar.Sosok hasil Anda menggunakan mengedit salinan gambar dari menubarjendela gambar copy dan paste ke laporan Anda.

b. Simultan Masking:Dalam bagian ini, kita menggunakan PM_Simu_Masking.m untuk

menjelajahi maskingsimultan, yang berarti bahwa nada bisa menjadimerender jika ada nada simultandengan volume yang lebih tinggi padafrekuensi yang tetangga. Untuk setiap band yang kritis,kita bisa memperbaikivolume frekuensi tengah. Dengan menambahkan nada tetangga yangberbeda amplitudo, kita bisa menemukan ambang atas nada ini tetanggaterdengar jika amplitudo lebih rendah daripada batas, tapi audible jikaamplitudo lebih tinggi daripada ambang batas.


IMAGE PROCESSING



Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengarvolume minimal untuk 4KHz. Setelah kalibrasi, Anda akan melihat sosok lainyang digambarkan di bawah ini. Ada tujuh frekuensi yang ditunjukkan olehlingkaran. Tengah satu mewakili Pusat frekuensi band kritis yang spesifik.Ketika kita klik tetangga frekuensi, program ini akan menghasilkan sinyalaudio yang terdiri dari pusat frekuensi dan frekuensi dipilih. Kami dapatmenambah/mengurangi volume oleh hanya mengklik kiri mouse di sisiatas/bawah lingkaran ini. Setelah mencari tahu ambang frekuensi enam(kecuali frekuensi tengah), klik kanan mouse untuk keluar dari program ini.

Pilih dua band kritis yang berbeda 3 dan mengetahui masking simultandari Anda telinga. Salin angkaangka ini dua menggunakan mengedit salinangambar dari menubar ini mencari jendela dan sisipkan mereka di laporanAnda. Untuk setiap band yang kritis,membandingkan topeng frekuensitetangga yang lebih tinggi dengan yang lebih rendah.

2. Audio Ekstraksi dan MP3MP3 (MPEG1 Audio Layer 3) adalah standar pengkodean/kompresi audio

yang menggunakan persepsi pengkodean teknologi. Dalam bagian ini, kitamenggunakan GoldWaveuntuk mengambil sepotong musik dan kompres dalam


IMAGE PROCESSING



MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerjadengan membandingkan spektrum frekuensi sinyal mentah dan MP3 file:


IMAGE PROCESSING



a. CD Audio ekstraksi: klik ToolsCD audio ekstraksi dari GoldWave's menuBar. Jendela ekstraksi audio yang akan muncul. Gunakan tool ini untukmengekstraksekitar sepuluh detik musik 4 dari CD musik favorit Andadan menyimpannya sebagai 16-bit stereo ditandatangani WAV file.Nama itu sebagai original.wav.


IMAGE PROCESSING



b. Downsampling: untuk membandingkan dengan MP3, kita perludownsample fileWAV ini. Klik Efek Resample dan memilih 16000 Hz.Simpan file ini sebagai downsample.wav.


IMAGE PROCESSING



c. Menghasilkan MP3 file oleh File Save As. pilih Simpan sebagai jenissebagaigelombang Audio. Menyesuaikan parameter dalam File atributsebagai MPEG Layer 3, 32kbps, 16000Hz, stereo. Nama file baru inisebagai wav2mp3.wav.

d. Mengkonversi MP3 ke wave: Reload wav2mp3 file dan menyimpannyasebagai 16bit stereo ditandatangani WAV file. Nama itu sebagaireconstructed_wav.wav.

e. Bandingkan spektrum: menggunakan Compare_Spectrum.m 5 untuk plotspektrum untuk downsample.wav dan reconstructed_wav.wav.Membandingkan perbedaan antara audio dua chip dan mendiskusikanpada frekuensi yang berkisar psychoacoustic model ini memiliki dampakyang signifikan.


IMAGE PROCESSING




IMAGE PROCESSING



V.Data Hasil Simulasi1. Model Psychoacoustic dan Coding perseptual

a. Absolute Threshold of HearingScript PM_Abs_Thre_Hearing.m

function [LogX,volumnY]=PM_Abs_Thre_Hearing

% function [LogX,volumnY]=PM_Abs_Thre_Hearing% measure absolute threshold of hearing

% LogX : vector of x

% volumnY : the corresponding absolute threshold of hearing

% Two stages in this program

% Stage 1: Calibrate the 4KHz threshold, adjust the volume to justnoticeable auditible.

% We use this for reference to adjust the other frequency% Stage 2: Measure absolute threshold of hearing 10 frequencies

% 1. For each frequenct,users can change the volume in a

specific frequency

% by left clicking mouse. Users can move upper and

lower until selecting

% a threshold which is just noticeable auditible.% Suggestion: the threshold had better to be choosed by

increasing the volume.

% Because if user changes it by reducing,

he/she will expect the sound% 2. After setting those 10 frequencies, right click mouse

and exit this program.

% 3. This function also returns those thresholds ,

[LogX,volumnY], back% 4. Users can also copy or save this figure by Edit -->

Copy Figure or File --> Save As

%

% Author : Guan-Ming Su

% Date : 3/10/02

close all;

clear all;


IMAGE PROCESSING



SampleRate=40000;

Max_bit=16;

total_time=0.75;

t=0:total_time*SampleRate-1;

%%%% calibrate 4k for min tone

figure

min_4K_amp=1;

k4x=1:3; k4y=[0 1 0]; bar(k4x,k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click toStage 2');ylabel('Bits');xlabel('Current value: 1');grid on;

CaliFlag=1;

F4k=4000;

while CaliFlag==1

[x1,y1, butn]=ginput(1);if butn==3; break; % right click

else ; min_4K_amp=y1; end;

min_4K_amp=1/power(2,Max_bit-y1);y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);bar(k4x,y1*k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click

to Stage 2');ylabel('Bits');xlabel(strcat('Current value: ',num2str(y1)));grid on;

sound(y4k,SampleRate);end

close all;

% measure the absolute threshold of hearing


IMAGE PROCESSING



figure

StopFlag=0;

startLogX=2; EndLogX=4; numLogX=11;

min_Volume=-10;max_Volume=40;

volumnY=ones(1,numLogX);LogX=logspace(startLogX,EndLogX,numLogX);dividerLogX=logspace(startLogX,EndLogX,numLogX*2-1);dividerLogX=dividerLogX(2:2:end); dividerLogX=[0 dividerLogX];semilogx(LogX,volumnY,'-o');axis([power(10,startLogX) power(10,EndLogX) min_Volume max_Volume]);title('Stage 2: Measure Absolute Threshold of Hearing');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click toExit');grid on

min_4K_power=min_4K_amp^2;

while StopFlag==0


else

newFindex=find(x1 > dividerLogX );selectF=newFindex(end);newF=LogX(selectF);newAMP=sqrt(min_4K_power*power(10,y1/10));volumnY(selectF)=y1;semilogx(LogX,volumnY,'-o');title('Stage 2: Measure Absolute Threshold of Hearing');axis([power(10,startLogX) power(10,EndLogX) min_Volume

max_Volume]);xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click to

Exit');grid on

y1=newAMP*sin(2*pi*newF*t/SampleRate);


IMAGE PROCESSING



sound(y1,SampleRate)end

end

Gambar 5.1 Hasil Running 1

Gambar 5.2 Hasil Running 2b. Simultaneous Masking

Script PM_Simu_Masking.mfunction [LinX,volumnY]=PM_Simu_Masking(ith_CB)

% function [LinX,volumnY]=PM_Simu_Masking(ith_CB)% Measure simultaneous masking

% output

102 103 104-10

-5

0

5

10

15

20

25

30

35

40Stage 2: Measure Absolute Threshold of Hearing

Frequency(Hz)

Relat

ed So

und P

ressu

re Le

vel to

4K Hz

, rSPL

(dB)

Left Click mouse to adjust the volume. Right click to Exit


IMAGE PROCESSING



% LinX : vector of x

% volumnY : the corresponding simultaneous mask

% input

% ith_CB : select the ith Critical Band

% Two stages in this program

% Stage 1: Calibrate the 4KHz threshold, adjust the volume to justnoticeable auditible.

% We use this for reference to adjust the other frequency% Stage 2: Measure Measure simultaneous masking for 6 frequencies

% 1. For each frequenct,users can change the volume in a

specific frequency

% by left clicking mouse. Users can move upper and

lower until selecting

% a mask which the neighbor tone is maksed by the center

frequency tone

% Suggestion: the threshold had better to be choosed by

increasing the volume.

% Because if user changes it by reducing,

he/she will expect the sound% 2. After setting those 6 frequencies, right click mouse

and exit this program.

% 3. This function also returns those thresholds ,

[LogX,volumnY], back% 4. Users can also copy or save this figure by Edit -->

Copy Figure or File --> Save As

%

% Author : Guan-Ming Su

% Date : 3/10/02

close all;

% Idealized Critical Band Filter Bank.

CB_FB=[ 50 0 100; 150 100 200; 250 200 300; 350 300400; 450 400 510; 570 510 630;

700 630 770; 840 770 920; 1000 920 1080; 1175 1080

1270; 1370 1270 1480; 1600 1480 1720;

1850 1720 2000; 2150 2000 2320; 2500 2320 2700; 2900 2700

3150; 3400 3150 3700; 4000 3700 4400;


IMAGE PROCESSING



4800 4400 5300; 5800 5300 6400; 7000 6400 7700; 8500 7700

9500;10500 9500 12000; 13500 12000 15500];numX=7; % number fo frequencies to plot the masking

NumCB=size(CB_FB,1);if (ith_CB > NumCB)|(ith_CB < 1) % error detection

error('There is no such a critical band existing');end

% initilized parameters.

SampleRate=40000;

Max_bit=16;

total_time=0.75;

t=0:total_time*SampleRate-1;

min_4K_amp=1;

%%%% calibrate 4k for min tone

figure

k4x=1:3; k4y=[0 1 0]; bar(k4x,k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click toStage 2');ylabel('Bits');xlabel('Current value: 1');grid on;

CaliFlag=1;

F4k=4000;

while CaliFlag==1


else ; min_4K_amp=y1; end;

min_4K_amp=1/power(2,Max_bit-y1);y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);bar(k4x,y1*k4y); axis([1 3 0 16]);title('Stage 1: Calibrating 4K Hz threshold ');legend('Left Click mouse to seek the minimal volumn, Right click

to Stage 2');ylabel('Bits');


IMAGE PROCESSING



xlabel(strcat('Current value: ',num2str(y1)));grid on;

sound(y4k,SampleRate);end

close all;

min_4K_power=min_4K_amp^2;

% measure the simultaneous masking

figure

StopFlag=0;

CenterX=CB_FB(ith_CB,1);startX=CB_FB(ith_CB,2);EndX=CB_FB(ith_CB,3);centerFreqIndex=ceil(numX/2);passband=EndX-startX; plot_range=[CenterX-passbandCenterX+passband];max_mid_Freq_AMP=0.45;

mid_Freq_DB=10*log10((max_mid_Freq_AMP^2)/min_4K_power);min_Volume=-10; max_Volume=10*ceil(mid_Freq_DB/10)+10;volumnY=ones(1,numX); volumnY(centerFreqIndex)=mid_Freq_DB;LinX=linspace(startX,EndX,numX);dividerLinX=linspace(startX,EndX,numX*2-1);dividerLinX=dividerLinX(2:2:end); dividerLinX=[0 dividerLinX];plot(LinX,volumnY,'-o');axis([plot_range(1) plot_range(2) min_Volume max_Volume]);title('Stage 2: Measure simultaneous masking');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click toExit');grid on

% centeral tone

yc=max_mid_Freq_AMP*sin(2*pi*CenterX*t/SampleRate);

while StopFlag==0



IMAGE PROCESSING



else

newFindex=find(x1 > dividerLinX );selectF=newFindex(end);if selectF==centerFreqIndex % centeral tone

sound(yc,SampleRate);else

newF=LinX(selectF);newAMP=sqrt(min_4K_power*power(10,y1/10));volumnY(selectF)=y1;plot(LinX,volumnY,'-o');axis([plot_range(1) plot_range(2) min_Volume max_Volume]);title('Stage 2: Measure simultaneous masking');xlabel('Frequency(Hz)');ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');legend('Left Click mouse to adjust the volume. Right click to

Exit');grid on

y1=newAMP*sin(2*pi*newF*t/SampleRate); % generateneighboring tone

ymix=y1+yc; % add two tones

sound(ymix,SampleRate);end

end

end

Gambar 5.3 Idealized Critical Band Filter Bank


IMAGE PROCESSING



Gambar 5.4 Ketik kode critical band yang akan digunakanKode yang digunakan adalah 1, yaitu 50 0 100;

Gambar 5.5 Kalibrasi 4K Hz treshold pada 10 bits


IMAGE PROCESSING



Gambar 5.6 Hasil running 12. Audio Extraction and MP3

a. Audio Extraction

Gambar 5.7 original.wav


IMAGE PROCESSING



b. Downsampling

Gambar 5.8 downsampling.wavc. Generate MP3

Gambar 5.9 wav2mp3.wav

d. Convert to MP3

Gambar 5.10 wav2mp3.mp3


IMAGE PROCESSING



e. Compare Spectrum

Gambar 5.12 Hasil Compare


IMAGE PROCESSING



VI.Analisa Data Hasil Simulasi1. Psychoacoustic Models and Perceptual Coding

a. Absolute Threshold of HearingPada percobaan kali ini, software Matlab-lah yang digunakan sebagaisoftware utama. Absolute Threshold of Hearing atau Ambang mutlakpendengaran ( ATH ) adalah tingkat suara minimal nada murni bahwatelinga manusia rata-rata dengan pendengaran normal bisa mendengartanpa hadir suara lainnya . Ambang mutlak berkaitan dengan suara yanghanya dapat didengar oleh organisme . Ambang batas absolut bukanlahtitik diskrit oleh karena itu digolongkan sebagai titik di mana suaramemunculkan respon persentase tertentu dari waktu . Dari langkah-langkah yang dilakukan diperoleh nilai sebesar 9.4269 untuk kalibrasi 4KHz threshold.

b. Simultaneous MaskingUntuk percobaannya ini, hampir sama dengan langkah sebelumnya.Dibutuhkan kalibrasi 4 KHz. Simultaneous masking merupakan fenomenadomain frekuensi di mana sinyal rendah tingkat , misalnya , suarasmallband ( maskee ) dapat dibuat tak terdengar oleh simultan yangterjadi sinyal yang lebih kuat ( masker ) , misalnya , nada murni, jikamasker dan maskee cukup untuk menutup satu sama lain dalam frekuensi.Sebuah ambang masking dapat diukur di bawah ini yang sinyal apapuntidak akan terdengar. Pada masking threshold tergantung pada tingkattekanan suara ( SPL ) dan frekuensi masker , dan pada karakteristik maskerdan maskee.

2. Audio Extraction and MP3a. Audio Extraction

Untuk langkah kedua ini, software yang digunakan adalah Goldwave . Fileaudio yang berformat mp3 dengan size 7.34 MB dikonfersi ke format wavdengna size yan meningkat drastic menjadi 34.8 MB. Hal ini dikarenakan


IMAGE PROCESSING



kualitas audio yang dihasilkan dari format lebih jernih dan lebih baikdibanding mp3. WAV adalah format file audio standar Microsoft dan IBMuntuk personal computer (PC), biasanya menggunakan pengkodean PCM(Pulse Code Modulation). Pada WAV, data tidak terkompres sehinggaseluruh sampel audio tetap ada.

b. DownsamplingPada percobaan downsampling, diperoleh size 11 MB. Hal ini dikarenakandownsampling adalah teknik untuk menurunkan sample rate audionya.

c. Generate MP3Pada langkah ini, file yang berdurasi 10 detik dengan format WAVberukuran 34.8 MB dikonversi ke format MP3 dan diperoleh size 744 KB.Hal ini dikarenakan format MP3 membuat audio-audio yang tidakdibutuhkan oleh telinga, sehingga size-nya berkurang.

d. RekonstruksiPada langkah ini, hasil yang diperoleh tidak jauh beda dengan langkahsebelumya.

e. Compare SpectrumPada langkah ini, digunakan Matlab untuk dapat membandingkan dua dileaudio. Dari hasil matlab diperoleh perbedaannya sangat sedikit. Hal inidikarenakan size dari file yang direkonstruksi dan downsamplingperbedaannya hanya sedikit.


IMAGE PROCESSING



VII.Kesimpulan1. Bunyi dengan frekuensi 20-20.000 Hz hanya dapat didengar ole telinga

manusia2. Format audio file WAV atau waveform audio merupakan format audio yang

yang tidak terkompres sehingga ukurannya besar sekali. Sedangkan formatMP3 merupakan format audio yang umum digunakan karena size-nya cukuprendah karena audio dikompresi atau audio yang tidak dibutuhkan olehtelinga dibuang.

3. Downsampling merupakan teknik untuk menurunkan sample rate audio-nya.


IMAGE PROCESSING



DAFTAR PUSTAKA

http://core.ac.uk/download/pdf/11719325.pdf

http://lecturer.polindra.ac.id/~munengsih/wp-content/uploads/2012/04/3-Audio-dan-Video1.pdf

http://repository.usu.ac.id/bitstream/123456789/19785/3/Chapter%20II.pdf

BAB VII - Perception Audio Dan Mp3

Documents