AMD har altid været med helt i front, når det gælder anvendelse af ny RAM-teknologi til grafikkort. Senest med GDDR4 og GDDR5, hvor AMD var først på markedet. Nu er de klar til at benytte endnu en ny teknologi; HBM.
HBM står for High Bandwidth Memory og er frugten af et samarbejde mellem AMD og Hynix. Det er en helt ny type RAM til grafikkort og vil være at finde på AMDs kommende topmodeller, der skulle komme på markedet en gang i juni måned, omkring E3.
Den nye RAM-type byder på en række fordele sammenlignet med GDDR-teknologien. Selvom båndbredden på moderne grafikkort med GDDR5-RAM i dag kan komme op på 3-400GB/s, er der visse ulemper ved GDDR5 chipsene i sig selv.
De bygger grundlæggende på den, efterhånden, aldrende DDR3-teknologi, og vil, selv med de allerede foreslåede forbedringer, snart være forældet og ikke kunne byde på en høj nok båndbredde pr. chip. i forhold til strømforbruget, der allerede er i den høje ende: ca. 1/5 af det samlede forbrug for et moderne grafikkort går til RAM-kredsene. Dette vil HBM forbedre.
GDDR5-chips står for en stor del af den anvendte plads på et grafikkort. Sammenligner man arealet med en HBM-chip, så fylder 1 GB GDDR5-RAM (4 chips af 256 MB) et areal på 672 mm2, da de 4 chips ligger side om side. En 1 GB HBM-chip, også bestående af 4×256 MB dies, fylder ikke mere end 35 mm2 da de er stablet oven på hinanden. Et areal der er 19 gange mindre. I praksis vil et Radeon R9 290X grafikkort således kunne laves mindst 50 % mindre.
Yderligere beskrivelse af teknologien kan læses herunder.
Som nævnt er HMB baseret på stablede RAM-dies. I første generation består én HBM-stak af 4 chips á 2Gbit RAM (altså 1 GB) og nederst en 5. die, RAM-stak-controlleren. Disse 5 chip-dies er forbundet med en teknik kaldet “throug silicon vias” (TSV) og er ganske enkelt direkte forbindelser ned igennem de enkelte chips, lidt ligesom elevatorer i et højhus. Hver 2Gbit lag er forbundet med to, mere eller mindre, uafhængige 128 bits busser til controlleren og de andre dies i stakken.
Teknologien åbner også muligheden for (via Interposeren), at tilføje for eksempel cache-RAM mellem de enkelte HBM-stakke, eller andre former for logiske kredsløb, der kunne være anvendelige på samme chip-die som RAM-forbindelserne og GPU’en er forbundet til.
Til trods for, at der er tale om en “sandwich” af chips: En HBM-stak med 4 RAM-dies og 1 controller-die samt Interposeren, er sammenlagt kun cirka 0,1 millimeter tyk.
Når de enkelte dele er så tæt placeret på hinanden, opnås der mange fordele. Hvor GDDR5-RAM har en busbredde på op til 512 bits, har man med HBM 1024 bits til rådighed pr. stak (2*128bits databus per die). Med 4 stakke (4 GB) opnår man derfor en samlet busbredde på 4096 bits og betyder så, at man kan skrue voldsomt ned for clockfrekvensen. De første HBM’s forventes at komme med 500 MHz.
Med HBM kan RAM fjernes fra grafikkortets print og flyttes direkte ind ved siden af GPU’en. Dette betyder, at der er meget kort vej mellem GPU og RAM, med lav latency og lavt strømforbrug til følge, specielt da kobberbanerne ud til RAM-chipsene helt og aldeles er elimineret. Et stort skridt fremad.
Hver RAM-stak opnår således en båndbredde på hele 128 GB/s og dermed en båndbredde for 4 GB RAM på minimum* 512GB/s.
*AMD giver et fingerpeg om, at grundet simplere RAM-kredsløb generelt, er overclocking nok en reel mulighed og hvor 50MHz OC er lig med +12,5 GB/s.
Målt på strømforbruget, opnår man med HBM gennem ovenstående teknikker og en sænkning af spændingen (i forhold til GDDR5, grundet blandt andet simplere clock-kredsløb), en halvering til en trediedel af forbruget. I stedet for de nuværende ~30-60 Watt til RAM, vil et HBM-baseret grafikkort kunne nøjes med ~10-20 Watt, måske mindre. Teknologien vil også med fordel kunne anvendes til håndholdte enheder som smartphones og tablets.
HBM er netop først annonceret, men HBM2 er allerede i støbeskeen og skulle byde på en fordobling af båndbredden til mindst 1TB/s og den samlede mulige mængde RAM.