Snälla skriv en artikel om hur minne på grafikkort fungerar

Permalänk
Medlem

Snälla skriv en artikel om hur minne på grafikkort fungerar

Orkar inte förklara en gång till varför Nvidia inte bara kan sätta 12GB på 4060 eller liknande.

Visa signatur

5900X | 6700XT

Permalänk
Skrivet av mpat:

Orkar inte förklara en gång till varför Nvidia inte bara kan sätta 12GB på 4060 eller liknande.

Svaret är väl helt enkelt: man gjorde designval för att nå en viss kombination av storlek, effektuttag och pris, och då föll minneskapaciteten bort. Det är inte att de inte i teorin hade kunnat designa för 12 GB minne, men den möjligheten stod inte öppen för dem efter att de redan spikat designen.

Permalänk
Medlem

Det handlar ju inte heller om att bara bygga den bästa produkten man kan i förhållande till pris, det handlar ju om att maximera sin vinst över hela sin portfölj - För bara X mer pengar kan du få Y, och om du ändå tittar på Y, så för lite extra kan du få Z, etc.

Jag skulle tro att en väldigt stor del av valen inom designen är direkt relaterad till vinst snarare än en perfekt produkt.

Om du inte har råd med ett 4070, köper du ett 4060. Om du vill ha mer RAM än ett 4060, köper du ett 4070, etc.

Permalänk
Medlem
Skrivet av mpat:

Orkar inte förklara en gång till varför Nvidia inte bara kan sätta 12GB på 4060 eller liknande.

Varför kan dom inte bara sätta 12GB på 4060? Dom kontrollerar hela kedjan och gjorde ett val.
Istället för att sätta på mer minne, så lägger dom antagligen miljontals om inte miljarder kronor på att utveckla kompressionsteknologi som körs på grafikkortet för att göra texturer mindre live.
Är grafikminne så dyrt?

Permalänk
Medlem
Skrivet av m4gnify:

Varför kan dom inte bara sätta 12GB på 4060? Dom kontrollerar hela kedjan och gjorde ett val.
Istället för att sätta på mer minne, så lägger dom antagligen miljontals om inte miljarder kronor på att utveckla kompressionsteknologi som körs på grafikkortet för att göra texturer mindre live.
Är grafikminne så dyrt?

Det handlar om hur stort chippet är, vissa delar finns då inte tillgängliga. Bus är det som styr Vram mängden.
på de billigare kretsarna så har man relativ liten bus och därav får man antingen köra enkel eller dubbelmacka.

Skulle de göra en större bus så skulle de tag wafer från xx70 och förlora inkomst och sedan få massa wafer över som de inte kan sälja

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem

Du kanske kan hänvisa folk till AI istället?

Perplexity säger

## Why Graphics Cards Have Fixed VRAM Allocations: The Case of the 12GB NVIDIA RTX 4060

Graphics cards are limited to specific VRAM capacities due to **memory bus width constraints** and **design trade-offs**. The NVIDIA RTX 4060’s hypothetical 12GB configuration (or the real-world 16GB RTX 4060 Ti variant) exemplifies these limitations.

### 1. Memory Bus Width Dictates VRAM Capacity
A GPU’s memory bus width determines how much VRAM can be attached. For example:
- A **192-bit bus** (like the RTX 3060) allows configurations of **6GB or 12GB** (1GB or 2GB per controller).
- A **128-bit bus** (standard RTX 4060 Ti) limits VRAM to **8GB** (1GB per controller).

NVIDIA’s design choices are tied to these constraints. The RTX 4060 Ti 16GB variant, for instance, uses a **192-bit bus** to accommodate double the VRAM[8].

### 2. Cost and Performance Balancing
Manufacturers like NVIDIA prioritize **cost efficiency** and **target performance tiers**. The RTX 3060’s 12GB VRAM was chosen to avoid criticism over its predecessor’s 6GB, despite its narrower bus[4]. Similarly, the RTX 4060 Ti’s 8GB VRAM reflects a balance between price and modern gaming needs, though some argue it risks future-proofing[6].

### 3. VRAM Utilization Depends on GPU Power
Having more VRAM doesn’t always translate to better performance. A GPU’s **processing power** and **memory bandwidth** are equally critical. For example:
- The RTX 3060’s 12GB VRAM can handle texture-heavy games at 4K, but its weaker CUDA cores limit frame rates[3].
- The RTX 4060 Ti’s 8GB VRAM may struggle with spillover into system RAM in VRAM-intensive scenarios, causing performance drops[2].

### 4. Exceptions and Variants
NVIDIA occasionally releases variants with wider buses for more VRAM (e.g., RTX 4060 Ti 16GB). These exceptions highlight how bus width flexibility enables higher capacities but at a cost premium[8].

### **Key Takeaway**
VRAM allocations are not arbitrary—they’re shaped by **technical limitations** (bus width), **market strategy**, and **performance balancing**. While more VRAM is beneficial for future-proofing, it’s only effective if paired with sufficient GPU power and bandwidth. The 12GB RTX 4060 (or its 16GB sibling) underscores this interplay, showing how hardware design choices directly impact a card’s capabilities.

Citations:
[1] https://www.digitaltrends.com/computing/how-much-gpu-memory-d...
[2] https://www.youtube.com/watch?v=vLbr0NCaMSQ
[3] https://www.reddit.com/r/nvidia/comments/m6wl44/can_i_use_all...
[4] https://www.reddit.com/r/buildapc/comments/uo41sq/how_much_do...
[5] https://www.reddit.com/r/nvidia/comments/15dnj6z/rtx_3060_vs_...
[6] https://www.tomshardware.com/reviews/best-gpus,4380.html
[7] https://superuser.com/questions/1400946/is-maximum-graphic-me...
[8] https://www.nvidia.com/en-us/geforce/news/rtx-40-series-vram-...
[9] https://www.youtube.com/watch?v=6vuFU_EF-38

---
Answer from Perplexity: pplx.ai/share

Visa signatur

Speldator :[I] AMD 5600X - 16GB fläskigt ram - AMD 580RX - AOC 32" Wide
HTPC : i5 3450S - 8GB G.Skill - Streacom F8

Permalänk
Medlem
Skrivet av MoNkeY-05:

Du kanske kan hänvisa folk till AI istället?

Man kan förstås hänvisa folk till att försöka ta reda på svar själva, men det kan ju kännas bättre att veta att det är ett visst svar man hänvisar dem till.

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

I slutändan handlar det väl om pengar och snålhet. Du behöver inte förklara mer än så.

Permalänk
Medlem
Skrivet av MoNkeY-05:

Du kanske kan hänvisa folk till AI istället?

Perplexity säger

## Why Graphics Cards Have Fixed VRAM Allocations: The Case of the 12GB NVIDIA RTX 4060

Graphics cards are limited to specific VRAM capacities due to **memory bus width constraints** and **design trade-offs**. The NVIDIA RTX 4060’s hypothetical 12GB configuration (or the real-world 16GB RTX 4060 Ti variant) exemplifies these limitations.

### 1. Memory Bus Width Dictates VRAM Capacity
A GPU’s memory bus width determines how much VRAM can be attached. For example:
- A **192-bit bus** (like the RTX 3060) allows configurations of **6GB or 12GB** (1GB or 2GB per controller).
- A **128-bit bus** (standard RTX 4060 Ti) limits VRAM to **8GB** (1GB per controller).

NVIDIA’s design choices are tied to these constraints. The RTX 4060 Ti 16GB variant, for instance, uses a **192-bit bus** to accommodate double the VRAM[8].

### 2. Cost and Performance Balancing
Manufacturers like NVIDIA prioritize **cost efficiency** and **target performance tiers**. The RTX 3060’s 12GB VRAM was chosen to avoid criticism over its predecessor’s 6GB, despite its narrower bus[4]. Similarly, the RTX 4060 Ti’s 8GB VRAM reflects a balance between price and modern gaming needs, though some argue it risks future-proofing[6].

### 3. VRAM Utilization Depends on GPU Power
Having more VRAM doesn’t always translate to better performance. A GPU’s **processing power** and **memory bandwidth** are equally critical. For example:
- The RTX 3060’s 12GB VRAM can handle texture-heavy games at 4K, but its weaker CUDA cores limit frame rates[3].
- The RTX 4060 Ti’s 8GB VRAM may struggle with spillover into system RAM in VRAM-intensive scenarios, causing performance drops[2].

### 4. Exceptions and Variants
NVIDIA occasionally releases variants with wider buses for more VRAM (e.g., RTX 4060 Ti 16GB). These exceptions highlight how bus width flexibility enables higher capacities but at a cost premium[8].

### **Key Takeaway**
VRAM allocations are not arbitrary—they’re shaped by **technical limitations** (bus width), **market strategy**, and **performance balancing**. While more VRAM is beneficial for future-proofing, it’s only effective if paired with sufficient GPU power and bandwidth. The 12GB RTX 4060 (or its 16GB sibling) underscores this interplay, showing how hardware design choices directly impact a card’s capabilities.

Citations:
[1] https://www.digitaltrends.com/computing/how-much-gpu-memory-d...
[2] https://www.youtube.com/watch?v=vLbr0NCaMSQ
[3] https://www.reddit.com/r/nvidia/comments/m6wl44/can_i_use_all...
[4] https://www.reddit.com/r/buildapc/comments/uo41sq/how_much_do...
[5] https://www.reddit.com/r/nvidia/comments/15dnj6z/rtx_3060_vs_...
[6] https://www.tomshardware.com/reviews/best-gpus,4380.html
[7] https://superuser.com/questions/1400946/is-maximum-graphic-me...
[8] https://www.nvidia.com/en-us/geforce/news/rtx-40-series-vram-...
[9] https://www.youtube.com/watch?v=6vuFU_EF-38

---
Answer from Perplexity: pplx.ai/share

Dela helst inte AI-slop om du inte korrekturläst det själv. Det är flera fel i det du delat. 4060 Ti 16 GB har t.ex. inte en 192-bitars buss, utan 128 bitar precis som 8GB-varianten.

Permalänk
Medlem
Skrivet av urban22:

Dela helst inte AI-slop om du inte korrekturläst det själv. Det är flera fel i det du delat. 4060 Ti 16 GB har t.ex. inte en 192-bitars buss, utan 128 bitar precis som 8GB-varianten.

Det var mer ett tips till en TS som inte orkar förklara för randomjeppar - tror alla vet begränsningar med AI idag.

Visa signatur

Speldator :[I] AMD 5600X - 16GB fläskigt ram - AMD 580RX - AOC 32" Wide
HTPC : i5 3450S - 8GB G.Skill - Streacom F8

Permalänk
Redaktion
Chefredaktör
Skrivet av mpat:

Orkar inte förklara en gång till varför Nvidia inte bara kan sätta 12GB på 4060 eller liknande.

Om vi skulle göra en sådan artikel, vilka frågeställningar tycker du ska besvaras?

Permalänk
Medlem
Skrivet av Enviro:

Om vi skulle göra en sådan artikel, vilka frågeställningar tycker du ska besvaras?

Jag tror själva kärnan i frågeställningen är minnesbussens bredd för en GPU.
Hur ett visst chip har designats med en viss minnesbandbredd (något slags pris/prestanda-designval), och minnesbandbredden ger då hur bred minnesbussen är, och det i sin tur ger då den multipel som man har att jobba med vad gäller minnesmängden.

Så ett visst chip kan då t.ex. ha kort med 8 eller 16 GB, ett annat chip kan ha 12 eller 24 GB. (eller iaf ha de teoretiska möjligheterna oavsett om sådana kort faktiskt produceras)

Men man har aldrig då t.ex. 8 eller 12 GB som alternativ för samma. (Och jag tror det är just på den här sista punkten som TS upplever att det kommer upprepade frågor)

Edit: fixade till rent språkligt trasig formulering

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av evil penguin:

Men man har aldrig då t.ex. 8 eller 12 GB som alternativ för samma. (Och jag tror det är just på den här sista punkten som TS upplever att det kommer upprepade frågor)

Du skall aldrig säga aldrig, Samsung har ju lanserat 3GB/chip GDDR7 moduler som skulle kunna göra så att du kan få 12 GB minne på en 128 bit buss: https://overclock3d.net/news/gpu-displays/samsung-reveals-the...

Och teoretisk sett så kan det ju tillverkas fler olika kapaciteter än så:

Skrivet av Reddit:

The JEDEC standard for GDDR6 defines 8Gb, 12Gb, 16Gb, 24Gb and 32Gb destinies (in Gigabytes, that's 1GB, 1.5GB, 2GB, 3GB and 4GB)

Så det borde gå att få många olika kapaciteter på grafikkort ifall de bara vill. Dock så håller de väl sig till standardkapaciteterna 1, 2, 4 GB då de tillverkas i större volymer att de blir billigare oavsett.

Permalänk
Medlem
Skrivet av loefet:

Du skall aldrig säga aldrig, Samsung har ju lanserat 3GB/chip GDDR7 moduler som skulle kunna göra så att du kan få 12 GB minne på en 128 bit buss: https://overclock3d.net/news/gpu-displays/samsung-reveals-the...

Och teoretisk sett så kan det ju tillverkas fler olika kapaciteter än så:
Så det borde gå att få många olika kapaciteter på grafikkort ifall de bara vill. Dock så håller de väl sig till standardkapaciteterna 1, 2, 4 GB då de tillverkas i större volymer att de blir billigare oavsett.

Okej, bra synpunkt till den tänkta artikeln. Aldrig är väl alldeles för starkt eftersom även DRAM kan ha "intressant" spec... men om man förklarar principen så blir det tydligt.

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av Enviro:

Om vi skulle göra en sådan artikel, vilka frågeställningar tycker du ska besvaras?

Väldigt mycket som Evil Penguin skrivit nedan, men i princip så här var vad jag hade tänkt:

  • En memory controller (GDDR6, men rätt många äldre också) är 32 bitar bred. Är det 128-bitars minnesbuss, är det således fyra controllers

  • Varje controller kan hantera 1 eller 2 chip. Storleken på dessa chip är specade i standarden, och för GDDR6 finns det bara två storlekar - 1GB och 2GB.

  • Alla kanaler måste ha lika mycket minne för godkänd prestanda

  • Att sätta två chip på samma kanal (dubbelmacka) kostar mer än ett dubbelt så stort

  • OEMerna köper grafikchip och minne i ett paket från AMD eller Nvidia, och det är dessa som beställer minnet långt i förväg. Det är alltså dem, och inte OEMerna, som styr vilka minnessorter som finns tillgängliga

Vet man bara detta blir det snart ganska enkelt att räkna ut hur mycket minne som kan erbjudas. Också värt att påpeka när andra storlekar finns - GDDR7 har 3GB - så ändras förutsättningarna.

Visa signatur

5900X | 6700XT

Permalänk
Hedersmedlem

En ytterligare fråga som vore intressant är varför det är 128-bitars minnesbuss på de billigare korten, och inte t ex 192-bit.
Bestäms det av utrymme längs sidan av die som det gör för 5090 (vars die inte kan vara mindre då minnesbussens PHY tar upp 3 hela sidor av die)? Dvs en krets med 192-bits minnesbuss skulle bli för stor -> för dyr för ett kort som NVIDIAs xx60?
Eller är det bara ett medvetet val för segmentering?

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
NAS: 6700K/16GB/Debian+ZFS | Backup (offsite): 9600K/16GB/Debian+ZFS

Permalänk
Medlem
Skrivet av Thomas:

En ytterligare fråga som vore intressant är varför det är 128-bitars minnesbuss på de billigare korten, och inte t ex 192-bit.
Bestäms det av utrymme längs sidan av die som det gör för 5090 (vars die inte kan vara mindre då minnesbussens PHY tar upp 3 hela sidor av die)? Dvs en krets med 192-bits minnesbuss skulle bli för stor -> för dyr för ett kort som NVIDIAs xx60?
Eller är det bara ett medvetet val för segmentering?

Jag förmodar att det även helt enkelt är en av rattarna de har att vrida på vad gäller att hitta en prestandapunkt som ska fylla något slags lucka i det egna utbudet. (Dvs, produktsegmenteringen du är inne på)

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av m4gnify:

Varför kan dom inte bara sätta 12GB på 4060? Dom kontrollerar hela kedjan och gjorde ett val.
Istället för att sätta på mer minne, så lägger dom antagligen miljontals om inte miljarder kronor på att utveckla kompressionsteknologi som körs på grafikkortet för att göra texturer mindre live.
Är grafikminne så dyrt?

Skriver det i lite mer detalj i annat inlägg, men:

1) Varje memory controller är 32 bitar bred. 4060 har alltså 4 st.
2) Varje controller måste ha lika mycket minne.
3) Varje controller kan ha ett eller två chip, där det senare är markant dyrare att tillverka
4) GDDR6 finns standardiserat i två storlekar - 1GB eller 2GB per chip.

Detta tagit tillsammans gör att man kan 4 eller 8 chip, och varje chip är 1 eller 2GB. Det gör att man kan 4, 8 eller 16GB minne.

Obs att GDDR7 är standardiserat i fler storlekar, inklusive 3 och 4GB per chip.

Visa signatur

5900X | 6700XT

Permalänk
Medlem
Skrivet av Thomas:

En ytterligare fråga som vore intressant är varför det är 128-bitars minnesbuss på de billigare korten, och inte t ex 192-bit.
Bestäms det av utrymme längs sidan av die som det gör för 5090 (vars die inte kan vara mindre då minnesbussens PHY tar upp 3 hela sidor av die)? Dvs en krets med 192-bits minnesbuss skulle bli för stor -> för dyr för ett kort som NVIDIAs xx60?
Eller är det bara ett medvetet val för segmentering?

Fler memory controllers kostar pengar - dels genom att de tar upp en större del av chippet (de krymper inte längre) och dels för att kretskortet kostar mer att tillverka (fler ledningsbanor och för riktigt många fler lager i kretskortet). Det är en rimlig besparing att försöka hålla ner dem.

Nvidias agerande är inte irrationellt, med ett enda undantag (3070). De försöker göra kostnadseffektiva kort. Mycket tyder på att GDDR7 kom lite senare än man hade önskat, antagligen för att NVidia gjorde det ganska misslyckade försöket med GDDR6X, och då hamnade en del kort i kläm.

Visa signatur

5900X | 6700XT