Top Banner
ARISTEKTUR KOMPUTER PARALEL
25

Aristektur Komputer Paralel

Dec 17, 2015

Download

Documents

MegawatiSinaga

arsitektur
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

ARISTEKTUR KOMPUTER PARALEL

PENGERTIAN MULTIPROSESSOR

Sebuah sistem komputer paralel yang didasrkan pada pemakaian memori tunggal secara bersama-samaModel multiprosesor berkembang menjadi software Menggunakan bersama sebuah ruang alamat virtual tunggal yang dipetakan pada memori bersamaUntuk membaca atau menulis sebuah word memori dengan menjalankan instruksi LOAD dan STOREContoh : Sun Enterprise 10000, Sequent NUMA-Q, SGI Origin 2000 dan HP/ Convex Exemplar MULTIPROCESSOR & MULTIKOMPUTERMULTIKOMPUTER PENYAMPAIAN PESANMultikomputer dapat dianggap beruapa suatu computer NUMA loosely atau cluster yang tightly coupled. Untuk mengembangkan dan menggunakan computer-komputer parallel dimana setiap CPU memiliki memorinya sendiri, yang tidak bisa diakses secara langsung ke CPU lainnya.Inila yang disebut multicomputer. Program-program atau CPU-CPU multicomputer berkomunikasi dengan menggunakan primitive-primitif seperti send dan receive untuk menyampaikan pesan-pesan dengan jelas karena mereka tidak bisa saling bertukar memori dengan instruksi-insrtuksi LOAD dan STORE. Secara umum, semua multicomputer memiliki ciri-ciri yang sama yakni ketika suatu program aplikasi menjalankan primitive send, prosessor komunikasi dberitahu dan mentransmisikan sekumpulan data pemakaian ke mesin tujuan.

Uniform Memory Access(UMA)Memori dibagi secara merata ke semua prosessorSemua prosessor mempunyai waktu akses yang sama ke semua word memoriSetiap prosessor menggunakan private cacheUntuk peripheral juga dishare dengan cara yang samaCocok untuk general purpose dan aplikasi time sharing oleh multiple userDapat digunakan untuk meningkatkan eksekusi dari program memori yang besar pada aplikasi time- criticalCache Only Memory Access (COMA)Multiprocessor yang hanya menggunakan cache memoryDapat ditemukan pada NUMA machine. Dimana pendistribusian main memory dirubah ke cache. Semua cache berasal dari raung alamat global. Akses ke cache jauh dibantu oleh direktori cache yang didistribuskan. Tegantung kepada interkoneksi jaringa yang digunakan, terkadang direktori digunakan untuk membantu penempatan copian dari blok-blok cachePenempatan data tidak penting karena menempati tempat dimana data tersebut akan digunakan

Non-Uniform Memory Access (NUMA) NUMA multiprocessor adalah sebuah system shared memory dimana waktu aksesnya bervariasi kelokasi word memoriShared memory yang secara fisik didistribusikan ke semua processor disebut local memori dan kumpulan dari local memori membentuk ruang alamat global yang dapat diakses oleh semua prosessorNUMA dapat mengakses local memori lebih cepat dengan local processor sedangkan akses memori yang jauh diberikan ke proc. Lainyang kapasitasnya lebih besar untuk ditambah delay interkoneksi jaringanMPPs-Massively Parallel Processor

Yang merupakan supercomputer-superkomputer raksasa berharga multi-juta dollar.Prosessor-prosessor ini digunakan dalam sains, dalam bidang teknik, industry untuk kalkulasi-kalkulasi yang sangat besar, untuk menangani jumlah-jumlah transaksi yang sangat besar perdetik, atau untuk pangkalan data.

MULTIPROSESSOR MEMORI BERSAMA Sebuah multiprosessor adalah suatu system computer yang memiliki banyak CPU dan sebuah ruang alamat tunggal yang bisa dilihat oleh semua CPU. Sebuah multiprosessor, seperti semua computer, harus memiliki peralatan-peralatan seperti I/O, seperti disk-disk, adaptor-adaptor jaringan, dan perlatan lain. SMP (symmetric Multiprocessor) adalah ketika setiap CPU memiliki akses yang sama ke semua modul memori dan semua peralatan I/O, dan dianggap bisa saling bergantian dengan CPU-CPU lainnya oleh system operasiSEMANTIK SEMANTIK MEMORIKonsistensi Sekuensial Adalah adanya penyelipan permintaan yang dipilih oleh hardware untuk membaca dan menulis.

Konsistensi ProsessorAdalah konsistensi yang memiliki 2 ciri:Penulisan oleh CPU dapat dlihat oleh semua CPU.Untuk setiap world memori dapat dilihat pada setiap CPU dalam urutan yang sama.

SEMANTIK SEMANTIK MEMORIKonsistensi Lemah Adalah Konsistensi yang tidak bisa menjamin untuk setiap penulisan oleh satu CPU akan dapat dilihat oleh CPU lainnya dalam suatu urutan yang sama.

Konsitensi Release Adalah konsistensi yang melakukan penulisan pada daerah penting dimana penulisan dilakukan sebelum setiap proses melakukan aktivitasnya kembali ke daerah tersebut. Arsitektur-arsitektur SMP berbasiskan Bus UMA

Dua CPU atau lebih dan satu modul memori atau lebih semuanya menggunakan bus yang sama untuk komunikasi.system tersebut akan dibatasi sepenuhnya oleh bandwith bus, dan sebagian besar CPU sering tidak digunakan. Solusi untuk masalah ini adalah:Cache mata-mataProtocol koherensi cache memoryMultiprosessor UMA yang menggunakan Switch Crossbar

Bahkan dengan semua optimalisasi yang bisa dilakukann, penggunaan suatu bus tunggal membatasi ukuran dari sebuah multi prosessor UMA(Uniform Memory Acces) hingga sekitar CPU. Maka dibutuhkan sebuah rangkaian paling sederhana untuk menghubungkan n CPU dengan k memori yang disebut switch crossbar. Dan ciri paling buruknya sendiri adalah fakta bahwa jumlah titik potong- titik potong meningkat sekitar dan kuadrat.

Multiprosesor-multiprosessor UMA yang menggunakan jaringan-jaringan switching Multi-Tingkat

Bidang Module memberitahukan memori mana yang akan digunakan. Bidang address menentukan sebuah alamat dalam sebuah modul. Bidang opcode menyediakan operas, seperti READ atau WRITE. Terakhir bidang Value opsional mungkin berisi sebuah operand seperti sebuah word 32 Bit yang akan ditulis pada suatu operasi WRITE. Switch tersebut memeriksa bidang module dan menggunakannya untuk menentukan apakah pesan itu harus diteruskan ke X atau ke y.Berbeda dengan switch crossbar, jaringan omega adalah sebuah jaringan blocking yang bersifat setiap kumpulan tidak akaan bisa diproses secara bersamaan. Konflik bisa terjadi karena penggunaan sebuah kabel atau karena penggunaan sebuah switch, serta antar permintaan-permintaan ke memori dan jawaban-jawaban dari memori.

Multiprosessor-multiprosessor NUMAMultiprosessor NUMA(Non Uniformed Acces Memory) adalah multiprosessor yang menyediakan suatu ruang alamat tunggal pada semua CPU dimana akses ke modul memori local akan lebih cepat dibandingkan akses ke modul memori yang jauh. Jadi semua program UMA akan beroperasi tanpa perubahan pada mesin-mesin NUMA, tetapi kinerjanya akan lebih buruk daripada pada sebuah mesin UMA dengan kecepatan detak yang sama. 3 ciri penting multiprosessor NUMA :Terdapat sebuah ruang alamat tunggal yang bisa dilihat oleh semua CPU Akses ke memori yang jauh dilakukan dengan menggunakan instruksi-instruksi LOAD dan STOREAkses ke memori yang jauh lebih lamban daripada akses ke memori local.

Multiprosessor-multiprosessor NUMA yang berkoherensi dengan Cache

Pendekatan yang paling popular untuk membuat multiprosessor-multiprosessor CC-NUMA(cache coherent NUMA) dan multiprosessor masa kini adalah multiprosessor yang berbasiskan direktori. Multiprosessor yang berbasiskan direktori sebuah multiprosessor yang mempertahankan database yang memberitahukan dimana setiap jalur cache berada dan apa statusnya.Kemajuan lain pada rancangan direktori ini sendiri ialah tetap mengawasi apakah jalur cache dalam keadaan bersih(memori asal terbaru) atau kotor (memori tidak baru).Kelemahan nyata dari rancangan ini adalah bahwa sebuah jalur dapat di cache-kan hanya pada satu nodeOptimalisasi kinerja tambahan untuk CC-NUMA:Multiprosessor Stanford DASHDASH(Directory Architecture for Shared memory) adalah multiprosessor CC-NUMA yang pertama berbasiskan direktori. Multiprosessor ini memiliki rancangan yang mudah dijelaskan dan sangat mempengaruhi produk lain. Setiap jalur cache bisa berada di dalam salah satu dari tiga keadaan berikut ini:UNCHANGED- Satu-satunya salinan dari jalur cache berda dalam memori ini.SHARED- Memori selalu terbaru; jalur tersebut mungkin terdapat dalam beberapa cacheMODIFIED memori tidak benar; hanya satu cache yang menangani jalur tersebut.

Multiprosessor Sequent NUMA-QSCI (Scalable coherent interface) adalah sebuah protocol koherensi cache yang digunakan pada mesin sequent NUMA-Q. mesin ini didasarkan pada quad board yaitu standart yang digunakan oleh intel yang terdiri dari empat chip CPU Pentium Pro dan RAM 4Gb. Setiap CPU memiliki sebuah cache level 1 dan sebuah cache level 2. Semua cache ini dijaga agar tetap memiliki koherensi dengan memata-matai bus local dari papan quad dengan menggunakan protocol MESI. Jadi rancangan ini memiliki dua level protocol koherensi, sama seperti yang dimiliki DASH. Setiap jalur cache memiliki posisi tetap dalam satu memori yan disebutnya induk. Jalur-jalur ini bisa berada dalam salah satu dari 3 keadaan : HOME, FRESH, dan GONE. HOME berarti bahwa jalur tersebut tidak berada dalam cache papan IQ-penghubung, meskipun ia mungkin berada dalam sebuah cache local pada papan quad yang sama. FRESH berarti bahwa jalur itu paling tidak berada dalam satu cache papan IQ-penghubung, mungkin lebih, dan bahwa memori selalu terbaru. GONE bahwa jalur tersebut di cache-kan pada papan IQ-penghubung tertentu dan mungkin telah berubah di sana sehingga memori tidak lagi terbaru.

Multiprosessor-multiprosessor COMACOMA (Cache Only Memory Acces) adalh sebuah multiprosessor yang menggunakan memori utama dari setiap CPU sebagai sebuah cache.Sebuah memori yang hanya menarik jalur-jalur sesuai yang dibutuhkannya disebut memori penarik. Menggubakan RAM utama sebagai sebuah cache besar akan meningkatkan kecepatan bisa, karena itu juga meningkatkan kerja. Cray T3ET3E memiliki akses ke memori yang jauh, tetapi tidak melalui instruksi-instruksi LOAD dan STORE yang biasa. Hal ini tampaknya seperti perpaduan antara sebuah mesin NC-UMA dan sebuah MPP, tetapi lebih menyerupai sebuah MPP, karena system operasi tentu menyadari fakta bahwa ia tidak bisa begitu saja membaca atau menulis memori yang jauh seperti membaca atau menulis memori localOption Red Intel/SandiaMesin Option Red sendiri terdiri dari 4608 node yang diatur dalam hubungan 3D.CPU-CPU dikemas pada dua jenis papan yang berbeda. Papan kestrel digunakan sebagai node-node komputasi, dan papan-papan eagle digunakan untuk service, disk, jaringan,dan node-node boot. Software Komunikasi untuk Multikomputer-multikomputerSebagian besar penyampaian pesan menyediakan dua primitif (biasanya panggilan perpustakaan), send and receive, tetapi beberapa jenis semantik mungkin juga disediakan. Tiga varian utama adalah :1.Penyampaian pesan sinkronDalam penyampaian pesan sinkron, jika pengirim menjalankan instruksi send dan penerima belum menjalankan instruksi receive, pengirim tersebut ditunda sampai penerima menjalankan instruksi receive pada saat pesan tersebut disalin.II.Penyampaian pesan yang disanggaDalam penyampaian pesan yang disangga, ketika sebuah pesan dikirim sebelum penerima siap pesan itu diamankan, disangga ditempat lain contoh didalam sebuah mailbox, sampai penerima mengeluarkannya.III.Penyampaian pesan nonblockingDalam penyampaian pesan nonblocking, pengirim diijinkan untuk melanjutkan segera setelah membuat panggilan sistem.

TERIMA KASIH