SHARED MEMORY MULTIPROCESSORS ARSITEKTUR KOMPUTER LANJUT CHAPTER I SUB BAB 2 3 MODEL SHARED MEMORY MULTIPROCESSORS [ UNIFORM MEMORY ACCESS (UMA) [ NONUNIFORM MEMORY ACCESS (NUMA) [ CACHE ONLY MEMORY ARCHITECTURE (COMA) YANG MULTIPROCESSORS AND MULTICOMPUTERS I/O SM1 SM2 Sequent Symetry S-81 Terlihat bahwa memori dibagi secara merata ke semua processor. Semua Processor mempunyai waktu akses yang sama ke semua word memori. Setiap Processor menggunakan private cache Dan untuk peripheral juga dishare dengan cara yang sama UMA cocok untuk general purpose dan aplikasi time sharing oleh multiple user. UMA dapat digunakan untuk meningkatkan kecepatan eksekusi dari program tunggal yang besar pada aplikasi time-critical MODEL DIATAS SYMMETRIC & ASYMMETRIC MULTIPROCESSOR P3 System Interconnect (Bus, Crossbar, Multistage Network) KETIGA DISHARED ATAU DIDISTRIBUSIKAN UNIFORM MEMORY ACCESS (UMA) P2 DARI ADALAH BAGAIMANA MEMORI DAN PERIPHERAL DEVICE DESI RAMAYANTI 23206006 P1 MEMBEDAKAN Symmetric Multiprocessor merupakan sebuah sistem, dimana semua processor mempunyai p p y akses yyangg sama kesemua p peripheral p device. Dalam hal ini semua processor mempunyai kemampuan yang sama menjalankan executive program seperti OS kernel dan I/O service routine. Asymmetric Multiprocessors. Pada Asymmetric Multiprocessors hanya satu atau sebagian dari processor yang mampu sebagai pelaksana, master processor dapat mengeksekusi OS dan menangani I/O, I/O sedangkan sisanya processor tidak punya kemampuan I/O dan disebut sebagai Attached Processor (Aps). APs mengeksekusi kode-kode user dibawah pengawasan master processor. 1 NONUNIFORM MEMORY ACCESS (NUMA) CONT NUMA Hierarchical Cluster Model (Chedar System) NUMA multiprocessor adalah sebuah sistem shared memory dimana GSM waktu aksesnya bervariasi ke lokasi memori word. word GSM GSM Global Interconnect Network Shared Local Memories (BBN Butterfly) LSM P1 LM1 P1 LM2 P2 LM3 Pn P2 Interconection Network Pn LSM P1 LSM P2 LSM Pn C I N LSM LSM GSM = Global Share Memori CIN = Cluster Interconnection Network CSM = Cluster Shared memori CACHE ONLY MEMORY ARCHITECTURE (COMA) CONT NUMA C I N Shared memory yang secara phisik didistribusikan kesemua proc disebut lokal memori, dan Interconection Network kumpulan dari lokal memori membentuk ruang alamat global yang dapat diakses oleh semua proc. memori yang jauh diberikan ke proc lain yang kapasistasnya lebih besar untuk ditambah delay melalui interconeksi jaringan (BBN Butterfly). D D D C C C P P P NUMA dapat mengakses lokal memori lebih cepat dengan local proc, sedangkan akses ke Disamping distribusi memori, secara umum shared memory dapat ditambahkan ke multiprocessor system, dalam hal ini ada tiga pola akses memory, dimana yang tercepat adalah akses k k lokal ke l k l memori, m m ri akses k k global ke l b l memori m m ri dan d n yang n paling p lin lambat l mb t adalah d l h akses k d ri dari memory yang jauh (Hierarchical Cluster Model (Chedar System)) COMA adalah multiprocessor yang hanya menggunakan cache memory. COMA dapat ditemukan pada NUMA machines, dimana pendistribusian main memori dirubah ke cache. Disini tidak ada hirarki memori pada setiap node computer. S Semua cache h berasal b r l dari d ri ruang r alamat l t global. l b l Akses Ak ke k cache h yang jauh j h dibantu dib t oleh l h direktori dir kt ri cache yang didistribusikan. Tergantung kepada interkoneksi jaringan yang digunakan, terkadang direktori digunakan untuk membantu penempatan copian dari blok-blok cache. Penempatan awal data tidak penting karena data akan menempati tempat dimana data tersebut akan digunakan. 2 CACHE COHERENT NON UNIFORM MEMORY ACCESS (CC-NUMA) CC NUMA dapat dispesifikasikan dengan pendistribusian shared memory dan cache direktori. Dan pada CC NUMA semua copy cache harus dijaga secara konsisten. konsisten Kesimpulan: Sistem Multiprocessor cocok untuk aplikasi general purpose multiuser dimana perhatian utamanya pada programmability. Kekurangan utama dari multiprocessor adalah scalabiliti yang rendah, sehingga cukup sulit untuk membangun mesin MPP (Massively Parallel Processing) g) yyangg menggunakan gg model shared memori yyangg tersentralisasi. Toleransi terhadap latensi untuk akses memori yang jauh, juga merupakan keterbatasan utama. MULTICOMPUTER GENERATION Generasi I (1983-1987) Didasarkan pada teknologi board proc yang menggunakan arsitektur hypercube dan software controlled message switching. Ex. Caltech Cosmic dan Intel iPSC/1 / Generasi 2 (1988 - 1992) Diimplementasikan dengan arsitektur mesh-connected, hardware message routing, dan software environment untuk medium grain distibuted computing, ex.Intel Paragon dan Persys Supernode 1000. Generasi 3(1993 – 1997) Dii l Diimplementasikan ik dengan d proc dan d komunikasi k ik i gear pada d chip hi VLSI yang sama. Modern Multicomputer menggunakan router untuk passing message. Komputer node ditambahkan kesetiap router. Setiap batas dari router akan dihubungkan denganI/O dan peripheral device. DISTRIBUTED MEMORY MULTICOMPUTER M P M P M M M P P P Message Passing Interconection Network (Mesh, (Mesh Ring, Ring Torus Torus, Hypercube, Connected Cycle, dll M M M P P P M P M P Sistem ini terdiri dari multiple computer yang sering disebut nodes, yang diinterkoneksikan pada jaringan message passing, setiap node adalah computer autonomous yyangg terdiri dari p proc, lokal memori, dan terkadangg ditambah disk dan peripheral I/O. Jaringan Message passing menyediakan hubungan yang statis point to point diantara node. Semua lokal memori adalah private dan hanya diakses oleh lokal processor. Oleh sebab itu Multicomputer tradisional disebut NORMA (no remote memory access), namun keterbatasan ini secara perlahan akan dihilangkan pada multicomputer yang akan datang dengan distributed shared memory TAXONOMY OF MIMD COMPUTER Tren arsitektur yang akan datang untuk komputer general purpose menyerupai konfigurasi MIMD dengan distribusi memori yang secara global dishare ke ruang alamat virtual. Oleh sebab itu Gordon Bell (1992) membuat taxonomy dari mesin MIMD dengan pertimbangan multiprocessor dengan shared memory yang mempunyai ruang alamat tunggal. Multiprocessor atau multicomputer yang scalable harus menggunakan shared memory yang didistribusikan, sedangkan multiprocessor yang tidak scalable menggunakan shared memori yang terpusat. 3 Bells Taxonomy of MIMD Computer Distributed Memory Multiproc (Scalable) Dynamic binding of addresses to proc KSR Static binding, ring multi IEEE SCI standard proposal Static binding, caching alliant, Dash Multiprocessor Single Addresses Space Shared Memory Computation Central Memory Multiprocessor(Not Scalable) Distributed Multicomputer (Scalable) MIMD Static program binding, BBN, Cedar Cross Point/multistage cray, Fujitsu, Hitachi, IBM, NEC Simple, ring multi, bus multi replacement Bus multis, DEC, Encore, SYCR, …..sequent, SGI Sun Mesh connected Intel Butterfly?fat tree CM5 Hypercubes NCUBE Multicomputer Multiple Address space message passing computation Fast Laris for high availability & High capacity cluster DEC, Tnader Lans for distributed processor workstation, PCs Central Multicomputer 4