ARSITEKTUR KOMPUTER LANJUT

advertisement
SHARED MEMORY MULTIPROCESSORS
ARSITEKTUR KOMPUTER LANJUT
CHAPTER I
SUB BAB 2
3 MODEL SHARED MEMORY MULTIPROCESSORS
[
UNIFORM MEMORY ACCESS (UMA)
[
NONUNIFORM MEMORY ACCESS (NUMA)
[
CACHE ONLY MEMORY ARCHITECTURE (COMA)
YANG
MULTIPROCESSORS AND MULTICOMPUTERS
I/O
SM1
„
„
„
„
„
„
SM2
Sequent Symetry S-81
„
Terlihat bahwa memori dibagi secara merata ke semua processor.
Semua Processor mempunyai waktu akses yang sama ke semua word memori.
Setiap Processor menggunakan private cache
Dan untuk peripheral juga dishare dengan cara yang sama
UMA cocok untuk general purpose dan aplikasi time sharing oleh multiple user.
UMA dapat digunakan untuk meningkatkan kecepatan eksekusi dari program tunggal
yang besar pada aplikasi time-critical
MODEL
DIATAS
SYMMETRIC & ASYMMETRIC
MULTIPROCESSOR
P3
System Interconnect (Bus, Crossbar, Multistage Network)
KETIGA
DISHARED ATAU DIDISTRIBUSIKAN
UNIFORM MEMORY ACCESS (UMA)
P2
DARI
ADALAH BAGAIMANA MEMORI DAN PERIPHERAL DEVICE
DESI RAMAYANTI
23206006
P1
MEMBEDAKAN
„
Symmetric Multiprocessor merupakan sebuah sistem, dimana semua
processor mempunyai
p
p y akses yyangg sama kesemua p
peripheral
p
device.
Dalam hal ini semua processor mempunyai kemampuan yang sama
menjalankan executive program seperti OS kernel dan I/O service
routine.
Asymmetric Multiprocessors.
Pada Asymmetric Multiprocessors hanya satu atau sebagian dari
processor yang mampu sebagai pelaksana, master processor dapat
mengeksekusi OS dan menangani I/O,
I/O sedangkan sisanya processor
tidak punya kemampuan I/O dan disebut sebagai Attached Processor
(Aps). APs mengeksekusi kode-kode user dibawah pengawasan master
processor.
1
NONUNIFORM MEMORY ACCESS (NUMA)
CONT NUMA
Hierarchical Cluster Model (Chedar System)
„
NUMA multiprocessor adalah sebuah sistem shared memory dimana
GSM
waktu aksesnya bervariasi ke lokasi memori word.
word
GSM
GSM
Global Interconnect Network
Shared Local Memories (BBN Butterfly)
LSM
P1
LM1
P1
LM2
P2
LM3
Pn
P2
Interconection
Network
Pn
„
„
„
LSM
P1
LSM
P2
LSM
Pn
C
I
N
LSM
LSM
GSM = Global Share Memori
CIN = Cluster Interconnection Network
CSM = Cluster Shared memori
CACHE ONLY MEMORY ARCHITECTURE (COMA)
CONT NUMA
„
C
I
N
Shared memory yang secara phisik didistribusikan kesemua proc disebut lokal memori, dan
Interconection Network
kumpulan dari lokal memori membentuk ruang alamat global yang dapat diakses oleh semua
proc.
„
memori yang jauh diberikan ke proc lain yang kapasistasnya lebih besar untuk ditambah delay
melalui interconeksi jaringan (BBN Butterfly).
„
D
D
D
C
C
C
P
P
P
NUMA dapat mengakses lokal memori lebih cepat dengan local proc, sedangkan akses ke
Disamping distribusi memori, secara umum shared memory dapat ditambahkan ke
multiprocessor system, dalam hal ini ada tiga pola akses memory, dimana yang tercepat adalah
akses
k
k lokal
ke
l k l memori,
m m ri akses
k
k global
ke
l b l memori
m m ri dan
d n yang
n paling
p lin lambat
l mb t adalah
d l h akses
k
d ri
dari
„
„
memory yang jauh (Hierarchical Cluster Model (Chedar System))
„
COMA adalah multiprocessor yang
hanya menggunakan cache memory.
COMA dapat ditemukan pada NUMA machines, dimana pendistribusian main memori
dirubah ke cache. Disini tidak ada hirarki memori pada setiap node computer.
S
Semua
cache
h berasal
b r l dari
d ri ruang
r
alamat
l
t global.
l b l Akses
Ak ke
k cache
h yang jauh
j h dibantu
dib t oleh
l h direktori
dir kt ri
cache yang didistribusikan. Tergantung kepada interkoneksi jaringan yang digunakan,
terkadang direktori digunakan untuk membantu penempatan copian dari blok-blok cache.
Penempatan awal data tidak penting karena data akan menempati tempat dimana data tersebut
akan digunakan.
2
CACHE COHERENT NON UNIFORM MEMORY
ACCESS (CC-NUMA)
„
„
„
„
„
CC NUMA dapat dispesifikasikan dengan pendistribusian shared
memory dan cache direktori. Dan pada CC NUMA semua copy cache
harus dijaga secara konsisten.
konsisten
Kesimpulan:
Sistem Multiprocessor cocok untuk aplikasi general purpose multiuser
dimana perhatian utamanya pada programmability.
Kekurangan utama dari multiprocessor adalah scalabiliti yang rendah,
sehingga cukup sulit untuk membangun mesin MPP (Massively Parallel
Processing)
g) yyangg menggunakan
gg
model shared memori yyangg
tersentralisasi.
Toleransi terhadap latensi untuk akses memori yang jauh, juga
merupakan keterbatasan utama.
MULTICOMPUTER GENERATION
„
„
„
„
Generasi I (1983-1987)
Didasarkan pada teknologi board proc yang menggunakan arsitektur
hypercube dan software controlled message switching. Ex. Caltech
Cosmic dan Intel iPSC/1
/
Generasi 2 (1988 - 1992)
Diimplementasikan dengan arsitektur mesh-connected, hardware
message routing, dan software environment untuk medium grain
distibuted computing, ex.Intel Paragon dan Persys Supernode 1000.
Generasi 3(1993 – 1997)
Dii l
Diimplementasikan
ik dengan
d
proc dan
d komunikasi
k
ik i gear pada
d chip
hi VLSI
yang sama.
Modern Multicomputer menggunakan router untuk passing message.
Komputer node ditambahkan kesetiap router. Setiap batas dari router
akan dihubungkan denganI/O dan peripheral device.
DISTRIBUTED MEMORY MULTICOMPUTER
„
„
M
P
M
P
M
M
M
P
P
P
Message Passing Interconection
Network (Mesh,
(Mesh Ring,
Ring Torus
Torus,
Hypercube, Connected Cycle, dll
M
M
M
P
P
P
M
P
M
P
Sistem ini terdiri dari multiple computer yang sering disebut nodes, yang
diinterkoneksikan pada jaringan message passing, setiap node adalah computer
autonomous yyangg terdiri dari p
proc, lokal memori, dan terkadangg ditambah disk dan
peripheral I/O.
Jaringan Message passing menyediakan hubungan yang statis point to point diantara node.
Semua lokal memori adalah private dan hanya diakses oleh lokal processor. Oleh sebab
itu Multicomputer tradisional disebut NORMA (no remote memory access), namun
keterbatasan ini secara perlahan akan dihilangkan pada multicomputer yang akan datang
dengan distributed shared memory
TAXONOMY OF MIMD COMPUTER
„
„
„
Tren arsitektur yang akan datang untuk komputer general purpose
menyerupai konfigurasi MIMD dengan distribusi memori yang secara global
dishare ke ruang alamat virtual.
Oleh sebab itu Gordon Bell (1992) membuat taxonomy dari mesin MIMD
dengan pertimbangan multiprocessor dengan shared memory yang
mempunyai ruang alamat tunggal.
Multiprocessor atau multicomputer yang scalable harus menggunakan shared
memory yang didistribusikan, sedangkan multiprocessor yang tidak scalable
menggunakan shared memori yang terpusat.
3
Bells Taxonomy of MIMD Computer
Distributed Memory Multiproc (Scalable)
Dynamic binding of addresses to proc KSR
Static binding, ring multi IEEE SCI standard
proposal
Static binding, caching alliant, Dash
Multiprocessor Single Addresses Space Shared
Memory Computation
Central Memory
Multiprocessor(Not
Scalable)
Distributed Multicomputer
(Scalable)
MIMD
Static program binding, BBN, Cedar
Cross Point/multistage cray, Fujitsu, Hitachi, IBM,
NEC
Simple, ring multi, bus multi replacement
Bus multis, DEC, Encore, SYCR, …..sequent, SGI
Sun
Mesh connected Intel
Butterfly?fat tree CM5
Hypercubes NCUBE
Multicomputer Multiple
Address space message
passing computation
Fast Laris for high availability & High capacity cluster
DEC, Tnader
Lans for distributed processor workstation, PCs
Central Multicomputer
4
Download