Hur bra presterar Hyper Threading i jämförelse med fysiska kärnor?

Permalänk

Hur bra presterar Hyper Threading i jämförelse med fysiska kärnor?

Hej!

Jag har inte hittat något konkret svar på denna frågan på google än, så jag hoppas att någon här kan hjälpa mig. Min fråga är:

Hur bra presterar Hyper Threading-tekniken om man jämför den med riktiga fysiska kärnor?

Alltså, teoretiskt sett, om jag har en processor med 4 fysiska kärnor och 8 processortrådar, samt en annan processor med enbart 8 fysiska kärnor som båda kör på samma klockhastigheter, vilken av dem hade i så fall presterat bäst?

Anledningen till varför jag frågar är för att jag har hört (av diverse opålitliga forum) att Hyper Threading möjliggör snabbare RAM-minnesåtkomst, och att Hyper Threading-tekniken därmed slår fysiska kärnor, men jag hade uppskattat ett utförligt och konkret svar från någon som vet säkert

Permalänk
Medlem

Testa? Har du en processor är det bara att stänga av ht och köra några benchmarks..

Skickades från m.sweclockers.com

Visa signatur

Detta meddelande skrevs på en porrfylld dator, av en elak skitstövel. Det innehåller ingen praktisk eller användbar information, och skrevs faktiskt enbart för att förvilla och föra dej bakom ljuset.

Permalänk

Någonstans mellan 0-40% beroende på hur bra HT tas emot av mjukvaran. Cinebench är det väl 35%.

Visa signatur

Spelburk: R7 5700X | 5700 XT | 32GB RAM | MSI B350M PRO-VDH

Permalänk
Medlem

Det är häftigare med fysiska kärnor så långt är jag med iallafall.

Visa signatur

AMD Ryzen 1700 | Vega RX 56 | 32gb DDR4

Permalänk
Medlem
Skrivet av fizzdan:

Testa? Har du en processor är det bara att stänga av ht och köra några benchmarks..

Skickades från m.sweclockers.com

Det är inte frågeställningen riktigt. Frågan är om 8 fysiska kärnor är bättre än 4kärnor med 8 trådar.

Visa signatur

AMD Ryzen 1700 | Vega RX 56 | 32gb DDR4

Permalänk
Medlem
Skrivet av Tanso:

Det är inte frågeställningen riktigt. Frågan är om 8 fysiska kärnor är bättre än 4kärnor med 8 trådar.

Lite off topic här men, en P4 och 2 7970? o.O

Visa signatur

MSI RTX 3080 Gaming X | R7 3800X | 16 GB RAM @ 3600 MHz | Seasonic Prime Ultra 850W | Corsair MP510 960GB + Crucial MX 300 525GB

Permalänk
Medlem
Skrivet av Tanso:

Det är inte frågeställningen riktigt. Frågan är om 8 fysiska kärnor är bättre än 4kärnor med 8 trådar.

Och hur får man reda på det om man inte testar?

Ganska enkelt att testa faktiskt. Kör med 4 aktiva kärnor (ingen HT). Skriv ned resultatet.

Testa med 2 aktiva kärnor (HT på). skriv ned resultatet.

Jämför.

Svaret är nu i din hand (samma sak borde gälla för 8 mot 4+4)

Permalänk
Medlem
Skrivet av Tanso:

Det är inte frågeställningen riktigt. Frågan är om 8 fysiska kärnor är bättre än 4kärnor med 8 trådar.

Ja, och du fick en lösning? Kör några olika benchmarks med 2 kärnor aktiverade ht av, och samma benchmarks med en kärna + ht...

Skickades från m.sweclockers.com

Visa signatur

Detta meddelande skrevs på en porrfylld dator, av en elak skitstövel. Det innehåller ingen praktisk eller användbar information, och skrevs faktiskt enbart för att förvilla och föra dej bakom ljuset.

Permalänk
Medlem
Skrivet av PoopaScoopa:

Hej!

Jag har inte hittat något konkret svar på denna frågan på google än, så jag hoppas att någon här kan hjälpa mig. Min fråga är:

Hur bra presterar Hyper Threading-tekniken om man jämför den med riktiga fysiska kärnor?

Vill minnas att en hypertråd presterar 33% av en vanlig kärna.

Skrivet av PoopaScoopa:

Alltså, teoretiskt sett, om jag har en processor med 4 fysiska kärnor plus 4 hypertrådar,

Antar att du menar som en i7 3770 eller i7 2600

Skrivet av PoopaScoopa:

samt en annan processor med enbart 8 fysiska kärnor som båda kör på samma klockhastigheter, vilken av dem hade i så fall presterat bäst?

8:a riktiga. Bulldozer har egentligen inte heller 8:a riktiga kärnor då flera saker delas av två kärnor, men presterar bättre än Intels hyperthreading.

Skrivet av PoopaScoopa:

Anledningen till varför jag frågar är för att jag har hört (av diverse opålitliga forum) att Hyper Threading möjliggör snabbare RAM-minnesåtkomst, och att Hyper Threading-tekniken därmed slår fysiska kärnor, men jag hade uppskattat ett utförligt och konkret svar från någon som vet säkert

Fysiska kärnor är bäst

Permalänk

Boom!

Tack för de snabba svaren!
Riktigt sjukt hur snabbt det gick!

Och jag har inte möjlighet att testa Hyper Threading själv, då jag äger en processor som inte använder sig av denna teknik.

Permalänk
Avstängd
Skrivet av Carl Jonsson:

Lite off topic här men, en P4 och 2 7970? o.O

Dat flaskhals. Skulle förvåna mig om han ens får ut 40% av den potentiella prestandan han ev. kunde få ut. Observera att en C2D som är smått klockad till ungefär 3-3,5ghz skulle springa cirklar runt hans P4 som är singlecore.. tänk dig vad en 4670K skulle göra.

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Permalänk
Medlem
Skrivet av Tumnus:

Dat flaskhals. Skulle förvåna mig om han ens får ut 40% av den potentiella prestandan han ev. kunde få ut. Observera att en C2D som är smått klockad till ungefär 3-3,5ghz skulle springa cirklar runt hans P4 som är singlecore.. tänk dig vad en 4670K skulle göra.

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Visa signatur

AMD Ryzen 1700 | Vega RX 56 | 32gb DDR4

Permalänk
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Fast en i7 utför fler beräkningar per klockcykel...

Permalänk
Medlem
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Men du har ju minneshastighet att tänka på, din CPU är garanterat en stor propp i ditt system så du vet. Dock om det räcker för vad du gör med din dator så kör på.

Permalänk
Avstängd

Hyperthreading används som avlastning när en tråd beter sig konstigt och inte exekverar snabbt nog.

Så visst gör det skillnad, i alla applikationer.

Visa signatur

R7 3700X | X570 Aorus Master | 32GB | EVGA 1080 Ti FTW3 | Noctua NH-D15S | FD Meshify C Copper
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304
2 x HPE ProLiant Microserver Gen 8 | 1265L V2 | 16GB | 20TB

Permalänk
Medlem
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Frekvens =/= prestanda.

Prestanda = frekvens, insruktioner/klockcykel samt antal kärnor.

Alltså: i5 2500K @ 4.5 GHz < i5 3570K @ 4.5 GHz.

Skickades från m.sweclockers.com

Permalänk
Medlem

lika många ghz ja men en I7 jobbar ungefär 350% snabbare på den frekvensen per kärna också I7 har 4+HT vilket är 4 trådar extra
vad spelar du för spel på den där burken ?
ganska nyfiken om grafikkorten dina ens jobbar över 30% var...

Så trots att din P4 ligger på 4,6 ghz så är det mer än det som spelar roll idag i krävande spel än ghz för att den ska kunna skyffla data som grafikkorten kan jobba med i krävande spel...

tro inte den jobbar på bättre än en I7 eller lika bra som en bara för att den ligger på samma ghz.
den ligger liksom 4 generationer efter i dagens intel cpuer om du sitter på socket 775 moderkort
1150 haswell ,1155 (2 st till 1155 sandy och ivybridge) ,1156 nehalem

missade några siffror där uppe heh.
http://www.cpubenchmark.net/singleThread.html
sök upp dem där och jämnför så ser du hur mkt efter din P4 är heh

Visa signatur

Ryzen 5 5600, MSI B450 Tomahawk Max, 2x16 gb kingston reaper rgb 3600 mhz Gigabyte rtx 4060 ti Eagle OC och nätagg be quiet 700w SSD: 120 gb pny cs 900, Kingston Fury 1 tb, wd blue ssd 500gb

Permalänk
Avstängd
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

I smell troll.

Skrivet av mini-z1994:

lika många ghz ja men en I7 jobbar ungefär 350% snabbare på den frekvensen per kärna också I7 har 4+HT vilket är 4 trådar extra
vad spelar du för spel på den där burken ?
ganska nyfiken om grafikkorten dina ens jobbar över 30% var...

Så trots att din P4 ligger på 4,6 ghz så är det mer än det som spelar roll idag i krävande spel än ghz för att den ska kunna skyffla data som grafikkorten kan jobba med i krävande spel...

tro inte den jobbar på bättre än en I7 eller lika bra som en bara för att den ligger på samma ghz.
den ligger liksom 4 generationer efter i dagens intel cpuer om du sitter på socket 775 moderkort
1150 haswell ,1155 (2 st till 1155 sandy och ivybridge) ,1156 nehalem

missade några siffror där uppe heh.
http://www.cpubenchmark.net/singleThread.html
sök upp dem där och jämnför så ser du hur mkt efter din P4 är heh

Han ligger mer än fyra generationer tillbaka. Pentium D, Core2Duo/quad, i-core 1st, 2nd, 3rd, 4th generation. Han ligger alltså sex generationer bakom dagens generation I-core processorer. Förutsatt att han faktiskt har en Pentium av Northwood eller Prescott för annars ligger han ännu längre tillbaka.

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Permalänk
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Du lider av en fet flaskhals även om du inte vet om det. En P4 klarar inte att driva 2x 7970. Du måste åtminstånde ha två kärnor med hyperthreading.

Jag skulle gissa att du får ut CA 30% av korten med den processorn. ännu mindre då du kör CF :P. skaffa åtminstånde en I3a så kommer du få en rejääl förbättring.

Tänk såhär, En I7 med 4 kärnor + trådar i 1.5 GHZ, kommer fortfarande prestera mycket snabbare än din P4, tänk dig 1.5GHZ, + 1.5ghz. + 1.5ghz. + 1.5ghz. + 1.5ghz/3 x 4 vs 3,6 GHZ eller vad p4'n ligger på

GHZ är inte bundet till hela CPUn utan räknas per kärna, så med din retorik är I7an egentligen uppe i 4.8 från tådar + 14.4 från kärnor, på det sättet du räknar på blir det då 19.2 GHZ om vi säger att trådar = 30% av en kärna. gentemot en pentium på säg 4GHZ (väldigt generöst).

Då borde du se ungefär hur mycket prestanda du tappar,

Detta är otroligt fördummat dock, så mycket att om en swecare läser detta pissar han på sig för det är mycket mer komplicerat ändå, men lita på mig den processorn måste bort om du har 2x 7970's.

jag har till exempel skitit i det faktum att I7an kommer ha nästan 4 ggr så många fler instruktioner per cykel o plocka med sig hem än P4, och det är per kärna.

Permalänk
Datavetare

Det korta svaret är att det faktiskt inte går att svara på din fråga...

Långa svaret:
Hur effektivt HT, som korrekt bör benämnas SMT (Simultaneous MultiThreading) då HT bara är Intels marknadsnamn för deras SMT lösning, beror på en lång rad faktorer.

T.ex. så ger HT långt mycket mer effekt på Atom än det ger på Core-serien, på Atom ger HT i många fall runt 50% extra (ibland ännu mer) medan det ligger på 20-30%. Största anledningen till detta är att Atom är en väldigt enkel CPU-design och det finns många saker som gör att en CPU-tråd inte kommer vidare (stall:ar) och då får ju den andra CPU-tråden 100% av resurserna.

HT ger väldigt lite på Core-serien i de flesta "vanliga" applikationer då de nästan uteslutande kör ur CPU-cachen och sannolikheten för en en pipeline-stall är då väldigt liten. Om båda trådarna även kör en liknande last så kommer de även ofta konkurrera om samma ALU något som gör att prestanda för varje enskild tråd nära nog halveras (men inte riktigt halveras så summan av det båda utför är ändå mer än 100% av vad en tråd gör).

Cinebench nämndes och det är en arbetslast som trots att det nästan uteslutande kör ur CPU-cache ändå ser en ganska stor effekt av HT. Anledningen är att program som använder instruktioner med hög latens (de tar flera CPU-cykler att utföra), vilket är fallet när program använder SSE/AVX vilket Cinebench gör, så blir konkurrensen av ALU mindre. Kanske verkar lite skumt, borde inte trådarna ändå blocka varandra? Nej, då den trånga sektionen är att starta (dispatch) instruktioner. Flaskhalsen är att en viss instruktion kanske bara kan startas på en specifik exkiveringsport (finns 6 sådana i NHM->IVB och 8 på HSW) men det är typiskt möjligt att starta en instruktion per klockcykel även om det kanske många cykler att färdigställa en viss instruktion.

Den stora vinsten med HT hittar man på vissa server-laster som hanterar så stora datamängder att CPU-cachen väldigt sällan räcker till. SMT är då ett väldigt effektivt sätt att låta en CPU-kärna göra något vettigt med andra CPU-trådar medan andra trådar väntar på att få data från ett långsamt (hög latens) RAM. Server CPUer från IBM (POWER) har idag 4 trådar per kärna och de från Oracle (SPARC) har 8 trådar per kärna då dessa uteslutande fokuserar på servers. AMDs moduldesign är väldigt illa designad för servers då det kostar väldigt många fler transistorer per CPU-tråd jämfört med SMT men när flaskhalsen är latens mot RAM så kan SMT kommer väldigt nära CMT i effektivitet.

CMT är sin tur är en usel förkortning då AMD har Cluster Multithreading medan den äldre användningen av CMT är Chip-level Multithreading som är det vi i dagligt tal kallar CPUer med "riktiga" kärnor :/

Det finns faktiskt fall när SMT är snabbare än "riktiga" kärnor, om du skriver ett program som kommunicerar väldigt mycket mellan trådarna (ytterst sällan en bra idé) så kommer detta typiskt vara mycket snabbare mellan trådar i samma CPU-kärna jämfört mellan "riktiga" kärnor.

För att summera: "riktiga" kärnor är i praktiken alltid snabbare än HT, men HT (SMT) är ett väldigt effektivt (räknat i transistorer och ström) sätt att höja kapaciteten på en CPU på vissa specifika arbetslaster. På desktop-applikationer är det väldigt sällan som HT ger speciellt mycket, på servers är det mycket vanligare att HT kan ge bra effekt men även här ger normalt sätt "riktiga" kärnor mer.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Förutom att det är en av de sämsta cpu designerna som Intel har låtit lämna fabriken...

EDIT: Finns det ens moderkort för P4 som stödjer PCIe ?

Visa signatur

En del av mina bildlänkar hostas på egen maskin, är bildlänkarna trasiga, ha tålamod.

Permalänk
Master of Overkill
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

1 core CPU din CPU måste gå i 100 % i alla spel ^^

Visa signatur

CASE CaseLabs SMA8-A + CaseLabs Nova X2M CPU 9900k @5.3GHz (No AVX) 7950X3D @5.7GHz GPUs RTX 3090 FE + RTX 3080 FE RAM 2x32GB Corsair Dominator Platinum 3533MHz CL13 + 2x32GB 6000MHz CL30 Dominator Titanium PSU EVGA T2 1600W + Corsair SFF 750W SSD Corsair Force MP700 Pro M.2 NVMe 2.0 Gen 5 2TB, 2x Samsung 990 Pro 2TB M.2 Headphones Audeze Maxwell + Audeze LCD-2 + Moon Cable DAC/AMP Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard ASUS ROG Crosshair X670E Hero + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Medlem
Skrivet av Karaff:

Förutom att det är en av de sämsta cpu designerna som Intel har låtit lämna fabriken...

EDIT: Finns det ens moderkort för P4 som stödjer PCIe ?

Bara jag som reagerar på hans hastighet på minnena? Det måste ju vara DDR3 och P4 stödjer inte ens det

Permalänk
Master of Overkill
Skrivet av Karazhan:

Bara jag som reagerar på hans hastighet på minnena? Det måste ju vara DDR3 och P4 stödjer inte ens det

Overclocked to da max !

Visa signatur

CASE CaseLabs SMA8-A + CaseLabs Nova X2M CPU 9900k @5.3GHz (No AVX) 7950X3D @5.7GHz GPUs RTX 3090 FE + RTX 3080 FE RAM 2x32GB Corsair Dominator Platinum 3533MHz CL13 + 2x32GB 6000MHz CL30 Dominator Titanium PSU EVGA T2 1600W + Corsair SFF 750W SSD Corsair Force MP700 Pro M.2 NVMe 2.0 Gen 5 2TB, 2x Samsung 990 Pro 2TB M.2 Headphones Audeze Maxwell + Audeze LCD-2 + Moon Cable DAC/AMP Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard ASUS ROG Crosshair X670E Hero + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Skrivet av Tanso:

Jag har lika många ghz i min rigg som en i7. Behöver inte mer. Grafikkorten är riktigt snabba.

Om du verkligen befinner dig i den situationen och tror att din processor presterar tillräckligt så ber jag dig för din egen skull att kolla upp det en gång extra.

Du har två grafikkort som är riktigt bra, men tyvärr en processor som inte är så bra. Frekvens är inte det enda som räknas.

Just nu sitter du med en (dessa bilreferenser...) Ferrari med Fiatmotor.

Visa signatur

Dator: Corsair 800D med ek-pump/res, 2x360-radiatorer, Asus x570 crosshair hero wifi, Ryzen 2 2600 (3950x med EK-block soon), Radeon VII EK-block, 32GB corsair vengence.
Kamerautrustning: Sony A7RIII, Sony 16-35/2.8 GM, Zeiss 55/1.8 ,Zeiss 85/1.8, Sony 100-400 GM, Canon 5DMK3, 16-35/2.8, 50/1.8

Permalänk
Medlem
Skrivet av Karaff:

Förutom att det är en av de sämsta cpu designerna som Intel har låtit lämna fabriken...

EDIT: Finns det ens moderkort för P4 som stödjer PCIe ?

Klart det gör.... Iaf s775....

Skickades från m.sweclockers.com

Visa signatur

Detta meddelande skrevs på en porrfylld dator, av en elak skitstövel. Det innehåller ingen praktisk eller användbar information, och skrevs faktiskt enbart för att förvilla och föra dej bakom ljuset.

Permalänk
Medlem

Hyperthreading är som en säck potatis. Alla vill ha det, tror dom behöver det men i de flesta fall är det onödigt.

Visa signatur

Sex kärnigt på modermodemet och ett gäng 680s i hårddisken