AMD A-serien "Trinity" i prislista

2012-09-04 16:20

Permalänk

Skippy

Medlem ★

Registrerad: Okt 2006

●

Skrivet av bourne94:

bra pris, men lär väll bli dyrare i sverige?

Gå till inlägget

Räkna en dollar som 10kr så brukar man få fram ca pris..
.

Rapportera Redigera

Citera flera Citera (2)

2012-09-04 16:26

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Yoshman:

Nu har det i.o.f.s. visat sig att den delade avkodaren är en rejäl flaskhals när båda "kärnorna" används i en modul.

www.agner.org/optimize/microarchitecture.pdf
The decode unit can handle four instructions per clock cycle. It is alternating between the two threads so that each thread gets up to four instructions every second clock cycle, or two instructions per clock cycle on average. This is a serious bottleneck in my tests because the rest of the pipeline can handle up to four instructions per clock.

AMD verkar ha kommit till samma slutsats då Steamroller ska fixa just detta.

Men även den delade "prefetchern" är ett problem, något som INTE kommer fixas i Steamroller

The shared instruction fetch unit can fetch up to 32 bytes per clock cycle or 16 bytes per core. This may be a bottleneck when both cores are active or when frequent jumps produce bubbles in the pipeline.

"Riktiga" kärnor delar inget av detta.

Gå till inlägget

Men de där begränsningarna är innan kärnorna, en dualcore som begränsas av dålig L3 och dåliga minnen är fortfarande en dualcore.

Skrivet av Yoshman:

Och varför skulle inte Intel kunna kalla HT för "kärnor" om AMD kallar sina moduler för två "kärnor"? Exakt vart går gränsen för när det är en kärna med HT eller två kärnor?

Gå till inlägget

HT körs på en och samma kärna så att pipelinen skiftar mellan olika trådar. I en BD-modul så är det två dedikerade kärnor med varsin ALU och FPU. Det som är delat på AMD processorn är egentligen inget som har med själva kärnan att göra, utan sitter innan. Det går att bygga processorer som inte ens har dessa enheter.

Skrivet av Yoshman:

Och angående testet jag länkade ovan, man körde ju med 8GB DDR3-1600, vilket är den snabbaste minnestypen som laptop varianten av Trinity officiellt stödjer.

Gå till inlägget

Gjorde man det? De listade även 4GB RAM som en konfiguration, när använde man vilken?

Rapportera Redigera

Citera flera Citera

2012-09-04 16:28

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Skippy:

Räkna en dollar som 10kr så brukar man få fram ca pris..
.

Gå till inlägget

Har inte fungerar på över ett halvt decennium. Snarare 0.8 om du vill ha priset inklusive moms. Något som kostar 300$ ligger ofta på 2500:- inklusive moms här.

Rapportera Redigera

Citera flera Citera

2012-09-04 16:33

Permalänk

rektor

Avstängd

Registrerad: Okt 2011

●

Skrivet av Aleshi:

Skojar du? AMDs chipsetdrivrutiner är stabilare än något annat. Jag har aldrig någonsin hört talas om någon som har problem med dem, går säkert att hitta om man söker men det är ovanligt. Jag har själv haft problem med intels en gång på C2D-tiden. Men skulle väl påstå att båda är så stabila det kan bli. Kommer vi till grafikdrivrutiner däremot är AMD överlägsna. Det finns många spel intels GPU egentligen borde klara mycket bättre än den gör.

Gå till inlägget

Jag vet inte hur det är på Windows, men på Linux (som jag kör) så har Intel bättre grafikdrivrutiner än AMD.

Rapportera Redigera

Citera flera Citera

2012-09-04 16:36

Permalänk

bourne94

Medlem

Registrerad: Jan 2011

●

Skrivet av Skippy:

Räkna en dollar som 10kr så brukar man få fram ca pris..
.

Gå till inlägget

Skrivet av Aleshi:

Har inte fungerar på över ett halvt decennium. Snarare 0.8 om du vill ha priset inklusive moms. Något som kostar 300$ ligger ofta på 2500:- inklusive moms här.

Gå till inlägget

tack för tipsen, det ger ju lite mer ett hum om vad det kan ligga på här i sverige

Visa signatur

Rapportera Redigera

Citera flera Citera

2012-09-04 16:40

Permalänk

anon127948

Inaktiv

Registrerad: Dec 2008

●

Skrivet av roykio:

Vet du hur stor skillnad det är på AMDs arkitektur och Intels? Dom har inga likheter ö.h.t

Du kan inte jämföra dom på det sättet. Intel har bara fyra kärnor och lagt in instruktionen att varje kärna ses som två medan AMD faktiskt har två fysiska kärnor!

Gå till inlägget

Som delar en hel del så att beroende på lasten blir det lång slöare än att ha två riktiga kärnor. Varför tror du att gamla Phenom med 6 riktiga kärnor spöade Bulldozer?

Rapportera Redigera

Citera flera Citera

2012-09-04 16:53

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Aleshi:

Men de där begränsningarna är innan kärnorna, en dualcore som begränsas av dålig L3 och dåliga minnen är fortfarande en dualcore.

Gå till inlägget

Öh, hit-rate i L1 på en modern CPU är runt 85-90% och hit-rate på L2 är över 95%. Så problemet som beskrivs är INTE ett L3 problem.
Stod ju klart och tydligt vad problem var: avkodaren fixar bara att maximal avkoda 4 instruktioner per cykel medan resten av pipe:en klarar 4*2 instruktioner.

Skrivet av Aleshi:

HT körs på en och samma kärna så att pipelinen skiftar mellan olika trådar. I en BD-modul så är det två dedikerade kärnor med varsin ALU och FPU. Det som är delat på AMD processorn är egentligen inget som har med själva kärnan att göra, utan sitter innan. Det går att bygga processorer som inte ens har dessa enheter.

Gå till inlägget

Du beskriver den av HT (eller rättare sagt "chip level multithreding", HT är bara Intels namn på deras implementation av detta) som används av s.k. barrel processors där endast en av trådarna kan köras vid varje given klockcykel, en metod som t.ex. SPARC använder sig av.

Men det är INTE den implementation som Intel använder i HT. Varje tråd delar front-end + cache och Sandy/Ivys avkodare kan avkoda maximal 5 instruktioner och till skillnad från Bulldozer så kan instruktioner till olika trådar avkodas i SAMMA klockcykel, men summan kan aldrig överstiga 5, så har är ju Intels CPU MER parallellism.

Sedan skiljer det sig rejält.

En Bulldozer modul består av två helt separata pipes med 4 "exekveringsportar" i varje pipa, 2 kan utföra minnesoperationer och 2 kan utföra heltalsoperationer (FPU är ju separat). Ingenting delas här

En Sandy/Ivy kärna består av 6 "exekveringsportar", 1 kan utföra "stores", 2 kan utföra "loads" och 3 kan utföra heltals-/flyttals-operationer. Så båda trådarna kan köra samtidigt under SAMMA cykel förutsatt att de instruktioner de vill köra använder olika exekveringsportar. Så det är fullt möjligt att ena tråden utför "mov->RAM + mov<-RAM + heltal/FPU-beräkning" och den andra tråden utför "mov->RAM + 2*hetal/FPU-beräkning". Kanske inte så sannolikt att det matchar så väl och om det gjorde det så blev ändå avkodaren en flaskhals då den inte kan avkoda mer än 5 instruktioner.

Det sagt: naturligtvis är AMDs modell i praktiken mer lik en "riktigt" 2-kärnig CPU då de duplicerar hela heltals-pipe:en. Å andra sidan kostar HT långt mindre transistorer att implementera. Men frågan är ändå varför den ena implementationen "riktiga" kärnor men den andra tydligen inte kan kallas för det?
Själv skulle jag säga att ingen av dessa ska ses som "riktiga" kärnor av den enkla anledningen att prestanda på tråd A påverkas negativt om man kör något totalt orelaterat på tråd B, något som inte är fallet med "riktigt" kärnor.

Med det säger jag inte att AMDs moduler är en dålig idé, tvärt om verkar det fungera riktigt bra i en hel del fall.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (1)

2012-09-04 17:15

Permalänk

SwedenVirre

Medlem

Plats: Ängelholm
Registrerad: Jul 2009

●

Skrivet av anon127948:

Som delar en hel del så att beroende på lasten blir det lång slöare än att ha två riktiga kärnor. Varför tror du att gamla Phenom med 6 riktiga kärnor spöade Bulldozer?

Gå till inlägget

Jag har en AMD X6 och jag har haft en 8C BD

Thuban kommer inte i närheten När det kommer till flera öppna program/multi taksing, speciellt inte vid överklockning!

Bulldozern var en hel del rappare när det kom till encoding också!

Visa signatur

12900K, 48GB DDR5, RTX 3080Ti

Rapportera Redigera

Citera flera Citera

2012-09-04 17:33

Permalänk

Mooter

Medlem ★

Plats: Stockholm
Registrerad: Aug 2007

●

Skrivet av rektor:

Låter väldigt billigt.

Vad är det tänkt att den ska konkurra emot?
Är det tänkt att den ska konkurrera emot Intel Core i3 prestandamässigt?

Vad ska dessa processorer användas till?
Nettops och chrometops?

Gå till inlägget

Nettops är mer budgetsortiment. Där t.ex. AMD E-serien konkurrerar mot Atom och Celeron. A- serien (trinity) konkurrerar främst mot Pentium, i3 och vissa i5.

Det är Mainstream helt enkelt. Även om det kan verka budget i sverige som är världens mesta high-end land(efter norge,)

Skickades från m.sweclockers.com

Rapportera Redigera

Citera flera Citera (1)

2012-09-04 17:37

Permalänk

Swedish Berserk

Medlem ★

Plats: Skåne
Registrerad: Apr 2009

●

Ser bra ut! Kan bli riktigt bra att ha i de flesta datorer. Den kommer nog stå sig bra mot Core i3 får vi hoppas som konsumenter. Ska bli spännande att läsa tester sen.

Senast redigerat 2012-09-04 17:44

Visa signatur

Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti
Xiaomi Poco X3 Pro I Nvidia Shield TV V2 I PS4 I

Rapportera Redigera

Citera flera Citera

2012-09-04 18:14

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Yoshman:

Öh, hit-rate i L1 på en modern CPU är runt 85-90% och hit-rate på L2 är över 95%. Så problemet som beskrivs är INTE ett L3 problem.
Stod ju klart och tydligt vad problem var: avkodaren fixar bara att maximal avkoda 4 instruktioner per cykel medan resten av pipe:en klarar 4*2 instruktioner.

Gå till inlägget

Du förstår inte liknelser. Att något som är delat innan själva kärnan begränsar gör det inte mindre till en dualcore.

Skrivet av Yoshman:

Du beskriver den av HT (eller rättare sagt "chip level multithreding", HT är bara Intels namn på deras implementation av detta) som används av s.k. barrel processors där endast en av trådarna kan köras vid varje given klockcykel, en metod som t.ex. SPARC använder sig av.

Men det är INTE den implementation som Intel använder i HT. Varje tråd delar front-end + cache och Sandy/Ivys avkodare kan avkoda maximal 5 instruktioner och till skillnad från Bulldozer så kan instruktioner till olika trådar avkodas i SAMMA klockcykel, men summan kan aldrig överstiga 5, så har är ju Intels CPU MER parallellism.

Gå till inlägget

Nej, jag vet att den kan köra olika saker på olika exekveringsportar samtidigt. Men inget är dedikerat. Det är inte garanterat att en tråd kan få sin önskade exekveringsport då en annan tråd kanske redan använder den.

Skrivet av Yoshman:

Sedan skiljer det sig rejält.

En Bulldozer modul består av två helt separata pipes med 4 "exekveringsportar" i varje pipa, 2 kan utföra minnesoperationer och 2 kan utföra heltalsoperationer (FPU är ju separat). Ingenting delas här

Gå till inlägget

Precis, dedikerade resurser hela vägen här.

Skrivet av Yoshman:

En Sandy/Ivy kärna består av 6 "exekveringsportar", 1 kan utföra "stores", 2 kan utföra "loads" och 3 kan utföra heltals-/flyttals-operationer. Så båda trådarna kan köra samtidigt under SAMMA cykel förutsatt att de instruktioner de vill köra använder olika exekveringsportar. Så det är fullt möjligt att ena tråden utför "mov->RAM + mov<-RAM + heltal/FPU-beräkning" och den andra tråden utför "mov->RAM + 2*hetal/FPU-beräkning". Kanske inte så sannolikt att det matchar så väl och om det gjorde det så blev ändå avkodaren en flaskhals då den inte kan avkoda mer än 5 instruktioner.

Gå till inlägget

Nej, ganska osannolikt att det matchar särskilt bra. Du glömmer bort att intel kör heltal och flyttal på samma portar, en av AMDs 128bits FMAC kan exekvera 4 flyttalsoperationer också, med Flex FP där de kan låna från varandra så är det 8 flyttalsoperationer. Detta helt oberoende av övriga kärnans exekverignsenheter.

Skrivet av Yoshman:

Det sagt: naturligtvis är AMDs modell i praktiken mer lik en "riktigt" 2-kärnig CPU då de duplicerar hela heltals-pipe:en. Å andra sidan kostar HT långt mindre transistorer att implementera. Men frågan är ändå varför den ena implementationen "riktiga" kärnor men den andra tydligen inte kan kallas för det?

Gå till inlägget

För att du kan i princip lyfta ut en av AMDs pipes så har du en RISC-processorkärna. Den behöver inte prefetch, och den behöver inte decoder. Den blir ganska primitiv i sin enkelhet. Men det är en CPU.

Skrivet av Yoshman:

Själv skulle jag säga att ingen av dessa ska ses som "riktiga" kärnor av den enkla anledningen att prestanda på tråd A påverkas negativt om man kör något totalt orelaterat på tråd B, något som inte är fallet med "riktigt" kärnor.

Gå till inlägget

I en normal dualcore så når man inte perfekt skalning heller. Det kommer alltid bli begränsningar när de ska dela minne, buss, cache och strömutrymme med mera.

Skrivet av Yoshman:

Med det säger jag inte att AMDs moduler är en dålig idé, tvärt om verkar det fungera riktigt bra i en hel del fall.

Gå till inlägget

Jag skulle säga att den är en dålig idé, i alla fall i nuvarande utformning. Den är inte så bra utformad i nuläget, men Steamroller kanske kan ändra på detta. En Bulldozermodul är ju i princip lika stor som två stars kärnor på samma tillverkningsprocess. Inte så konstigt då allt det viktiga finns i dubbel uppsättning och det som delas är uppbiffat. Men jag tror att 8 starskärnor hade presterat bättre än 4 BD-moduler, då AMDs svaghet gentemot intel redan innan var att de inte kunde mata sina exekverinsenheter tillräckligt bra. Det blev inte bättre med den sneda balanseringen i BD. SR löser nog det bra dock.

Rapportera Redigera

Citera flera Citera

2012-09-04 18:24

Permalänk

Typhonos

Medlem

Plats: Norrköööping
Registrerad: Dec 2007

●

Besviken att se så låga klockfrekvenser, hade hoppats på 4 Ghz utan turbo med bibehållen strömförbrukning. Blir inte nytt AMD i höst heller.

Visa signatur

Core i5 2500K@4Ghz, 8 Gb Kingston Hyper X 1600 DDR3, MSI Z68-GD55, OCZ Vertex 4, Asus GTX670 DC2, Corsair VX 450.
Kyld av Hyper 212 Plus Evo: Corsair SP120 Quiet PWM, 3 Nexus Real Silent 120 mm @ 7V.

Rapportera Redigera

Citera flera Citera

2012-09-04 18:27

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Typhonos:

Besviken att se så låga klockfrekvenser, hade hoppats på 4 Ghz utan turbo med bibehållen strömförbrukning. Blir inte nytt AMD i höst heller.

Gå till inlägget

Så gott som omöjligt med en så stor GPU inbyggd. Piledriver för AM3+ kanske är intressant?

Rapportera Redigera

Citera flera Citera

2012-09-04 18:29

Permalänk

backfeed

Medlem ★

Plats: Westrobothnia
Registrerad: Okt 2008

●

Någon som råkar veta mer specifikt vilken/vilka gpu-delar som är integrerade?

Är klart intresserad av någon av 65-wattarna, förutsatt att någon av dem har en gpu-del med tillräcklig kräm (och drivrutinstöd) för att få höga poäng i HQV HD-testet. Hittills har det varit dåligt med detta för alla varianter av integrerad grafik, så vitt jag vet, så jag hoppas på en förbättring.

Vill hemskt gärna slippa grafikkort i min htpc, så jag äntligen kan bygga en minimal mini-itx-gurka.

Visa signatur

5950X, 3090

Rapportera Redigera

Citera flera Citera

2012-09-04 18:32

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av backfeed:

Någon som råkar veta mer specifikt vilken/vilka gpu-delar som är integrerade?

Är klart intresserad av någon av 65-wattarna, förutsatt att någon av dem har en gpu-del med tillräcklig kräm (och drivrutinstöd) för att få höga poäng i HQV HD-testet. Hittills har det varit dåligt med detta för alla varianter av integrerad grafik, så vitt jag vet, så jag hoppas på en förbättring.

Vill hemskt gärna slippa grafikkort i min htpc, så jag äntligen kan bygga en minimal mini-itx-gurka.

Gå till inlägget

http://www.nordichardware.se/nyheter/69-cpu-chipset/46529-pri...

Tyvärr så blir alla baserade på samma kärna. Hade de gjort ett chip med bara två fysiska kärnor så hade de nog kunnat få ner strömkraven ytterligare.

Rapportera Redigera

Citera flera Citera

2012-09-04 18:52

Permalänk

jacozz

Medlem ★

Plats: Stockholm
Registrerad: Jan 2006

●

Virtual Void #30
Och jag håller med.
Bulldozerkärnorna är inte jämförbara med vare sig Phenom eller Intels nuvarande modeller.
Det tekniskt enda vettiga är att jämföra AMD:s (4-kärniga) med Intels (2kärniga med HT), då bulldozerarkitekturen är ett svar på på Intels Hypertreading.
I teorin så är AMD:s angreppssätt vassare då man når ca: 80% mot en fullfjädrad extra core.
Intels motsvarighet med HT ligger på ca 30-40%.

Men... men eftersom Bulldozer (hittills är så uselt både på SC och MC hjälper inte detta), men det betyder inte att grundtanken är fel, tvärsom. Frågan är bara om man hinner göra om och göra rätt innan det är för sent?

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Rapportera Redigera

Citera flera Citera

2012-09-04 19:32

Permalänk

anon177582

Inaktiv

Registrerad: Sep 2011

●

Skrivet av Typhonos:

Besviken att se så låga klockfrekvenser, hade hoppats på 4 Ghz utan turbo med bibehållen strömförbrukning. Blir inte nytt AMD i höst heller.

Gå till inlägget

Sitter i samma båt som du. Har varit villig att uppgradera (el. snarare nedgradera mig kraftigt) till en AMD-processor sedan 2010, men de är helt enkelt för varma och energiineffektiva när de kommer till prestanda per watt.

Rapportera Redigera

Citera flera Citera

2012-09-04 19:37

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av jacozz:

Virtual Void #30
Och jag håller med.
Bulldozerkärnorna är inte jämförbara med vare sig Phenom eller Intels nuvarande modeller.
Det tekniskt enda vettiga är att jämföra AMD:s (4-kärniga) med Intels (2kärniga med HT), då bulldozerarkitekturen är ett svar på på Intels Hypertreading.
I teorin så är AMD:s angreppssätt vassare då man når ca: 80% mot en fullfjädrad extra core.
Intels motsvarighet med HT ligger på ca 30-40%.

Men... men eftersom Bulldozer (hittills är så uselt både på SC och MC hjälper inte detta), men det betyder inte att grundtanken är fel, tvärsom. Frågan är bara om man hinner göra om och göra rätt innan det är för sent?

Gå till inlägget

Du nämner en sak där, dåliga både på SC och MC. Det håller jag med om. Men det är nog mest deras frekvensjakt som gjort att de fått värmeproblem och inte nått tänkta frekvenser som är en bov där. De har satsat mycket på att möjliggöra högre frekvenser genom åtgärder som sänker IPC. De hade väl väntat sig att modul-designen skulle spara in energikraven så att det skulle gå bra ändå.

Rapportera Redigera

Citera flera Citera

2012-09-04 19:46

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Värt att notera är att Trinity klarar minnen i 1825MHz, något man också bör satsa på om man köper en.
Orsaken är att CPUn och GPUn delar på samma minne vilket gör att minneshastigheten påverkar prestanda rejält.
För vanliga CPUr gör minneshastigheten ganska lite.

Visa signatur

Rapportera Redigera

Citera flera Citera

2012-09-04 20:06

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Aleshi:

Du förstår inte liknelser. Att något som är delat innan själva kärnan begränsar gör det inte mindre till en dualcore.

Gå till inlägget

Så din definition är alltså: dual-core == 2 st separerade ALU/ALG enheter.
Men faller inte då modulerna på att ALU enheterna för FPU är delad? Och med delad här menar jag att det bara finns en schemaläggare för FPUn och jag är medveten att det är möjligt i vissa lägen att FPUn ändå klarar av att köra två 128-bitars instruktioner samma cykel. Men den är fortfarande delad vilket borde diskvalificera den som dual-core enligt dig.

Skrivet av Aleshi:

Nej, jag vet att den kan köra olika saker på olika exekveringsportar samtidigt. Men inget är dedikerat. Det är inte garanterat att en tråd kan få sin önskade exekveringsport då en annan tråd kanske redan använder den.

Gå till inlägget

Men bulldozer delar ju back-end så det är möjligt att en instruktion inte kan färdigställas (retire) p.g.a. att den andra kärnan använder den resursen. Det ska alltså inte räknas, men en eventuell konflikt på en exekveringsport ska räknas?

Skrivet av Aleshi:

Precis, dedikerade resurser hela vägen här.
Nej, ganska osannolikt att det matchar särskilt bra. Du glömmer bort att intel kör heltal och flyttal på samma portar, en av AMDs 128bits FMAC kan exekvera 4 flyttalsoperationer också, med Flex FP där de kan låna från varandra så är det 8 flyttalsoperationer. Detta helt oberoende av övriga kärnans exekverignsenheter.

Gå till inlägget

Visst är det helt oberoende, men som alla vet finns inga gratis-luncher. Kostnaden AMD betalar för denna design är högre latens än Intels design. I vissa lägen är det inget problem, i andra kommer det orsaka "stalls" i heltalsdelen då den inte kan fortsätta innan resultatet från FPUn är klart. Och då FPUn är delat kan detta mycket väl få effekter på BÅDA trådarna.

Man får inte glömma att de flesta Intel "µops" kräver bara en port och man kan bara avkoda 4 sådana per cykel, så det är totalt 4 instruktioner från 2 olika strömmar som ska samsas om 6 exikveringsportar, så det är inte SÅ osannolikt att man får en riktigt bra match. Har sett uppmätt IPC på Sandy på ~2 i verkliga program, vilket är något högre än vad jag sett på Bulldozer räknat över HELA modulen.

Här är ett sådant exempel, Bulldozer klara totalt sett 0.73*2=1.46 på Cinebench medan Sandy Bridge (Xeon) klara 2.0 (man visar summan av två trådar).

Skrivet av Aleshi:

För att du kan i princip lyfta ut en av AMDs pipes så har du en RISC-processorkärna. Den behöver inte prefetch, och den behöver inte decoder. Den blir ganska primitiv i sin enkelhet. Men det är en CPU.

Gå till inlägget

AMD kör "micro-ops" internt och dessa är "riktiga" RISC instruktioner i att de är fix-längd och endast kan göra load, store eller beräkning. Men Intel har i princip samma sak då de internt kör "µops" som är fix-längd och till största del bara kan göra load,store eller beräkning, man har i vissa lägen valt att kunna göra load-op i samma instruktion då det är VÄLDIGT vanligt i x86 kod. Men resultatet av detta är att den teoretiska kraften hos en Sandy/Ivy-kärna inte alls är speciellt långt i från summan av båda pipes i en modul.
Så diskussionen om det är en "riktigt" kärna är ur det perspektivet meningslös, det enda som räknas är faktiskt prestanda och här har Sandy/Ivy fördelen i att vara mer flexibel då kraften kan alltid används av den tråd som råkar behöva den för tillfället. Vad HT gör är öka genomsnittligt antal exekverade instruktioner då det finns fler val att göra när man ska lägga instruktioner på exikveringsportarna, HT kan också "gömma" latens då den andra tråden kan köra till 100% om den andra måste vänta på en load/store operation. Alla dessa fördelar missar man med separata pipor.

Skrivet av Aleshi:

I en normal dualcore så når man inte perfekt skalning heller. Det kommer alltid bli begränsningar när de ska dela minne, buss, cache och strömutrymme med mera.

Gå till inlägget

Då man i de flesta "desktop" arbetslaster har en total cache-hit-rate i L1/L2 (som både är privat per CPU-kärna på både Nehalem->Ivy och Phenom->Trinity) som ligger över 95% så är det full möjligt att få mer eller mindre perfekt skalning. Med HW-stöd som avancerade NICs och DDIO (Intel's Data Direct I/O en finess i Sandy Bridge baserade Xeon) kan man även få nära nog perfekt skalning i system med flera CPU-sockets och 6-8 CPU-kärnor per socket, vi har det i alla fall i de system vi utvecklar på jobbet. På denna typ av arbetslast är HT mer eller mindre helt värdelöst och har tyvärr inte haft möjlighet att testa hur Bulldozer (Opteron) hanterar detta.

Skrivet av Aleshi:

Jag skulle säga att den är en dålig idé, i alla fall i nuvarande utformning. Den är inte så bra utformad i nuläget, men Steamroller kanske kan ändra på detta. En Bulldozermodul är ju i princip lika stor som två stars kärnor på samma tillverkningsprocess. Inte så konstigt då allt det viktiga finns i dubbel uppsättning och det som delas är uppbiffat. Men jag tror att 8 starskärnor hade presterat bättre än 4 BD-moduler, då AMDs svaghet gentemot intel redan innan var att de inte kunde mata sina exekverinsenheter tillräckligt bra. Det blev inte bättre med den sneda balanseringen i BD. SR löser nog det bra dock.

Gå till inlägget

Frågan är bara vilken marknad AMD vänder sig mot med denna design. Vanliga servers är inte CPU-bundna, utan I/O-bundna, där har man lite nytta av mer kraft för heltasberäkningar. HT fungerar i vissa fall otroligt bra på servers (inte för inte som moderna SPARC och POWER CPUer har 8 resp 4 "HT" per CPU-kärna)
För desktop är hög prestanda per tråd LÅNGT mycket viktigare än många CPU-trådar, i alla fall så fort man har 4 eller fler CPU-trådar totalt sett.
I steamroller kommer AMD även duplicera avkodaren, som för x86 är relativt komplex. Det enda man då "vinner" på att inte köra med "riktiga" kärnor är delad FPU (fast med nackdelen att få hög latens) och delad L1I och L2 cache (frågan hur bra det är då L2 cachen lätt borde bli en flaskhals om den ska mata 2 "riktiga" kärnor).

Så steamroller blir garanterat en förbättring, men det är inte så mycket kvar av den ursprungliga tanken att spara på transistorer genom att dela på saker.
Men anser fortfarande att även dagens modell är helt OK då man ändå uppnår 80% effektivitet på trådarna när båda två i en och samma modul används. Problemet är att prestanda per tråd är alldeles för lågt, DET är vad man måste fixa inte göra ännu fler "kärnor".

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (3)

2012-09-04 20:07

Permalänk

jacozz

Medlem ★

Plats: Stockholm
Registrerad: Jan 2006

●

Aleshi #48

Citat:

Du nämner en sak där, dåliga både på SC och MC. Det håller jag med om. Men det är nog mest deras frekvensjakt som gjort att de fått värmeproblem och inte nått tänkta frekvenser som är en bov där.

Jo, visst är det en missräkning teori kontra praktisk tillämpning.
Personligen skulle jag om jag vore AMD kassera Vishera och försöka tidigarelägga Steamroller istället, då denna arkitektur verkar vara det Bulldozer borde ha varit från början.
Det pratas om 30% högre prestanda än (Piledriver), vilket borde betyda ca: 45% bättre än Bulldozer V1.0
Och då ser det ju inte lika illa ut helt plötsligt.

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Rapportera Redigera

Citera flera Citera

2012-09-04 20:21

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Skrivet av jacozz:

Aleshi #48

Jo, visst är det en missräkning teori kontra praktisk tillämpning.
Personligen skulle jag om jag vore AMD kassera Vishera och försöka tidigarelägga Steamroller istället, då denna arkitektur verkar vara det Bulldozer borde ha varit från början.
Det pratas om 30% högre prestanda än (Piledriver), vilket borde betyda ca: 45% bättre än Bulldozer V1.0
Och då ser det ju inte lika illa ut helt plötsligt.

Gå till inlägget

Nej!
Vill ha Vishera nu.

Visa signatur

Rapportera Redigera

Citera flera Citera

2012-09-04 20:29

Permalänk

jacozz

Medlem ★

Plats: Stockholm
Registrerad: Jan 2006

●

Ratatosk, Okdå!
Du får väl Vishera dårå
När jag uppgraderade förra året försökte jag verkligen välja ett AMD-system... men det gick inte även om jag föredrar AMD före Intel. skillnaden var för stor. Speciellt prestanda per watt (och där tänker jag inte så mycket på elförbrukningen, utan snarare värmeutvecklingen = fläktoljud).
Hade dom släppt Vishera förra året hade jag nog valt det istället... (förutsatt att ryktena stämmer om ca: 15% bättre ipc).

Nåja... Kom igen nu AMD så det blir lite konkurrens!

Senast redigerat 2012-09-04 20:34 stavfel

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Rapportera Redigera

Citera flera Citera

2012-09-04 20:42

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Yoshman:

Wall of Text

Gå till inlägget

Okej, jag ger mig, även om jag inte håller med om allt så bombar du på med så många poänger att jag får böja mig. Men jag kommer fortsätta förklara det som 2 kärnor i vissa fall när man beskriver funktionen. Du kan väl komma och påminna mig om denna tråden om jag glömmer bort mig för mycket bara.

Skrivet av jacozz:

Aleshi #48

Jo, visst är det en missräkning teori kontra praktisk tillämpning.
Personligen skulle jag om jag vore AMD kassera Vishera och försöka tidigarelägga Steamroller istället, då denna arkitektur verkar vara det Bulldozer borde ha varit från början.
Det pratas om 30% högre prestanda än (Piledriver), vilket borde betyda ca: 45% bättre än Bulldozer V1.0
Och då ser det ju inte lika illa ut helt plötsligt.

Gå till inlägget

Fast att de skrotar den ena gör inte att den andra kommer snabbare. Det fungerar inte så.

Rapportera Redigera

Citera flera Citera

2012-09-04 20:50

Permalänk

alibababert

Medlem

Plats: i källarn
Registrerad: Sep 2008

●

Skrivet av jacozz:

Aleshi #48

Jo, visst är det en missräkning teori kontra praktisk tillämpning.
Personligen skulle jag om jag vore AMD kassera Vishera och försöka tidigarelägga Steamroller istället, då denna arkitektur verkar vara det Bulldozer borde ha varit från början.
Det pratas om 30% högre prestanda än (Piledriver), vilket borde betyda ca: 45% bättre än Bulldozer V1.0
Och då ser det ju inte lika illa ut helt plötsligt.

Gå till inlägget

fast steamroller kommer typ ändå baseras på mycket som används i vishera, dvs bra att ha vishera som lite av en betatest samt kanske dra in några kronor

Rapportera Redigera

Citera flera Citera

2012-09-04 21:35

Permalänk

Pimpim666

Medlem ★

Registrerad: Nov 2005

●

Trinity cpu 1000kr
Moderkort 800kr
Ram 400kr
Chassi 400kr
Nätagg 400kr
Trådlöst tangentbord och mus 300kr
Totalt: 3300kr

Koppla den till TV och köra spel i 720p på low eller medium settings. Perfekt liten gaming maskin som klarar spel som Left4Dead, Call of Duty, Diablo 3, Minecraft och Counter Strike utan problem. Kommer fungera att titta film och använda som media station.
Blir som en billig liten konsol för lite mindre krävande titlar.

Tycker du 720p är för lågt? Köp till ett skitkort som Radeon 7750 för 900kr och kör crossfire med inbyggda GPUn och du kommer kunna köra spel i 1080p utan större problem.

Blir som en liten dyr konsol som spelar PC spel.

Visa signatur

Sex kärnigt på modermodemet och ett gäng 680s i hårddisken

Rapportera Redigera

Citera flera Citera (3)

2012-09-05 13:10

Permalänk

Zizoor

Medlem ★

Plats: Forsheda
Registrerad: Jun 2012

●

Skrivet av Pimpim666:

Trinity cpu 1000kr
Moderkort 800kr
Ram 400kr
Chassi 400kr
Nätagg 400kr
Trådlöst tangentbord och mus 300kr
Totalt: 3300kr

Koppla den till TV och köra spel i 720p på low eller medium settings. Perfekt liten gaming maskin som klarar spel som Left4Dead, Call of Duty, Diablo 3, Minecraft och Counter Strike utan problem. Kommer fungera att titta film och använda som media station.
Blir som en billig liten konsol för lite mindre krävande titlar.

Tycker du 720p är för lågt? Köp till ett skitkort som Radeon 7750 för 900kr och kör crossfire med inbyggda GPUn och du kommer kunna köra spel i 1080p utan större problem.

Blir som en liten dyr konsol som spelar PC spel.

Gå till inlägget

Kanske ska ha en HDD eller SSD med? :>

Visa signatur

Ignorance is voluntary misfortune.

Rapportera Redigera

Citera flera Citera

2012-09-05 13:12

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Pimpim666:

Trinity cpu 1000kr
Moderkort 800kr
Ram 400kr
Chassi 400kr
Nätagg 400kr
Trådlöst tangentbord och mus 300kr
Totalt: 3300kr

Koppla den till TV och köra spel i 720p på low eller medium settings. Perfekt liten gaming maskin som klarar spel som Left4Dead, Call of Duty, Diablo 3, Minecraft och Counter Strike utan problem. Kommer fungera att titta film och använda som media station.
Blir som en billig liten konsol för lite mindre krävande titlar.

Tycker du 720p är för lågt? Köp till ett skitkort som Radeon 7750 för 900kr och kör crossfire med inbyggda GPUn och du kommer kunna köra spel i 1080p utan större problem.

Blir som en liten dyr konsol som spelar PC spel.

Gå till inlägget

Då har du ändå kostat på dig vill jag säga. Finns inte en komponent i listan man inte skulle kunna prispressa med minst 100:- om det skulle krisa. Så det är mycket för pengarna. För de där pengarna får man ju bra saker.

Rapportera Redigera

Citera flera Citera

2012-09-05 15:47

Permalänk

Pimpim666

Medlem ★

Registrerad: Nov 2005

●

Skrivet av Zizoor:

Kanske ska ha en HDD eller SSD med? :>

Gå till inlägget

Har beställt en liknande burk själv för någon dag sedan och har en SSD och några HDDs som jag ska trycka in så tänkte inte på det när jag skrev det här inlägget.

Skrivet av Aleshi:

Då har du ändå kostat på dig vill jag säga. Finns inte en komponent i listan man inte skulle kunna prispressa med minst 100:- om det skulle krisa. Så det är mycket för pengarna. För de där pengarna får man ju bra saker.

Gå till inlägget

Det går nog alltid att pressa priset lite men någon form av kvalitet vill man ha.

Visa signatur

Sex kärnigt på modermodemet och ett gäng 680s i hårddisken

Rapportera Redigera

Citera flera Citera

2012-09-05 17:08

Permalänk

Aleshi

Medlem ★