Skrivet av Broken-arrow:
Var det som skrevs i annan tråd även jag förde budskapet vidare (dock inte koll på om det är bekräftat, är ju sommar så håller inte jätte koll på media flödet).
Tonga spekuleras det i att fury ärvt delar ifrån som en front end, men har dubbla back end (inte exakt koll vad detta är exakt, mer än att back end "typ tar hand om högre upplösningar" eller ja gör nytta vid höga upplösningar och front end tar han dom låga grovt förenklat). Typ detta är tonga pro som de spekulerades för snart ett år se om (kan ha varit fury kretsen).
Nvidia fick offra höga upplösningar när dom gjorde 900 serien, AMD offra låga upplösningar för att pressa strömförbrukningen. Är inget som swec verkar tänka så mycket på.
Tycker båda sidornas kort är rätt ointressanta sett till prestanda. Fury nano och 980TI är dom mest intressanta för mig i denna serie (full medveten om detta är olika prestanda klasser).
Byggstenen i GCN är något som kallas Compute Unit (CU). Varje CU består av fyra st SIMD-enheter som var och en kan köra en s.k. "wavefront". En wavefront består av upp till 64 st trådar (är det färre än 64 trådar så kan inte resurser användas optimalt).
Det som kallas "streamprocessor" är därför rent tekniskt bara 1/64 (en "pipeline") i det som närmast kan liknas vid en kärna i en vanlig CPU. Eller omvänt så skulle man kunna kalla en fyrkärnig Haswell för 32 "streams" (4 kärnor med 8 SP pipelines per kärna via AVX).
Varje av de fyra SIMD-enheterna kan ha upp till 10 st wavefronts aktiva (totalt upp till 40 wavefronts och upp till 2560 aktiva trådar per CU), vilket är väldigt snarlikt SMT (Intel Hyperthreading) på en vanlig CPU.
Jobben till alla dessa trådar kommer i GCN från (Asynchronous Compute Engines) ACE, som är en form av jobbkö. Här är min gissning till vad problemet är i Fiji: ett problem som GCN1.1/1.2 kretsar hela tiden dragits med är stor varians i renderingstider (låg lägsta FPS på de 0.1%-1% mest komplicerade scenerna) jämfört både med Maxwell/Kepler/Fermi, men även jämfört med GCN1.0.
Det är ett betydligt enklare jobb att via drivers lägga ut en jämnt fördelad mängd jobb på två st ACE (som GCN1.0 har) än på de 8 st som senare revisioner har. AMD tyckte då kanske att det inte var värt att öka de resurserna än mer i Fiji då man inte fått till drivarna för Hawaii riktigt bra än.
Problemet är bara att samma antal ACE ska nu mata en långt hungrigare "back-end", så gissar att detta kan vara flaskhalsen man ser i Fiji vid lägre upplösningar där varje enskild wavefront spendera relativt kort tid i CU och därför hinner man inte hålla alla CU med jobb. I högre upplösningar ska varje wavefront hantera mer data och frekvensen av wavefronts per tidsenhet som blir klar och måste ersättas är lägre.
Eller betydligt kortare beskrivet: Fiji verkar vara en väldigt obalanserad design för dagens spel, är först i 4k som man till viss del får lite balans. Om det är sant har "Fury" den mest optimala Fiji-kretsen, blir helt enkelt extremt lågt effekt av mer beräkningskraft så "Fury X" och "Nano" är mindre effektiva sett till perf/cykel i dagens titlar.
Går inte säga om detta ändras i titlar specifikt designade för DX12. Däremot kan man konstatera att Fiji och Maxwell helt klart divergerat i styrkor jämfört med Hawaii och Kepler. Fiji har fått betydligt mer kraft för per pixel beräkningar (ljus/skuggor etc) medan Maxwell fått betydligt mer kapacitet att rendera trianglar (tessellation och på andra sätt mer komplicerad geometri). Knappast något som gör det lättare för speltillverkarna...
Skrivet av Broken-arrow:
Jo, är troligt det, men hur är det med tidigare kort som går varmt? Lika illa där med läckström eller är det något speciellt designval dom har gjort med fury som det blir mer påtagligt?
Det jag menade är att AMD själva gick ut och sa att ett sämre chipp skulle orsaka högre strömförbrukning, ihop med fury nano artikeln som ligger ute på swec därför det kortet är fullsakliga fury x dock nerklockat.
Läckström är tydligen temperaturberoende, ökar vid ökad temperatur, så här lär Nano inte ha någon direkt fördel över Fury.
Strömförbrukning vid aktivt användande är däremot beroende av frekvens och teoretiskt sett är förbrukningen också beroende mot spänningen i kvadrat (och krävs typiskt något högre spänning för högre frekvens på en viss tillverkningsnod). M.a.o. så kan man få ner effekten rejält på Nano genom att köra en "full" krets på lägre maxfrekvens.
Det som kan bli ett problem (och när Nano lanseras lär mer ljus kastas över detta) är om "front-end" är den stora flaskhalsen i Fiji. Kapaciteten i alla delar av kretsen skalar linjärt med frekvens , om "front-end" är flaskhals så kommer Nano få svårt att prestera bättre än 290x/390x.