En rad kod gav Meteor Lake 72 procent högre prestanda

Permalänk
Melding Plague

En rad kod gav Meteor Lake 72 procent högre prestanda

Intel har släppt en uppdaterad drivrutin för de nya Meteor Lake-systemkretsarna där en ändring av en enda rad kod har gett rejält utslag.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

https://lore.kernel.org/lkml/20240606181214.2456266-1-sriniva...

diff --git a/drivers/cpufreq/intel_pstate.c b/drivers/cpufreq/intel_pstate.c index dbbf299f4219..8b0032d6a519 100644 --- a/drivers/cpufreq/intel_pstate.c +++ b/drivers/cpufreq/intel_pstate.c @@ -3429,7 +3429,7 @@ static const struct x86_cpu_id intel_epp_default[] = { X86_MATCH_INTEL_FAM6_MODEL(ALDERLAKE_L, HWP_SET_DEF_BALANCE_PERF_EPP(102)), X86_MATCH_INTEL_FAM6_MODEL(SAPPHIRERAPIDS_X, HWP_SET_DEF_BALANCE_PERF_EPP(32)), X86_MATCH_INTEL_FAM6_MODEL(METEORLAKE_L, HWP_SET_EPP_VALUES(HWP_EPP_POWERSAVE, - HWP_EPP_BALANCE_POWERSAVE, 115, 16)), + 179, 64, 16)), {} };

Permalänk
Medlem
Skrivet av jaqob:

https://lore.kernel.org/lkml/20240606181214.2456266-1-sriniva...

diff --git a/drivers/cpufreq/intel_pstate.c b/drivers/cpufreq/intel_pstate.c index dbbf299f4219..8b0032d6a519 100644 --- a/drivers/cpufreq/intel_pstate.c +++ b/drivers/cpufreq/intel_pstate.c @@ -3429,7 +3429,7 @@ static const struct x86_cpu_id intel_epp_default[] = { X86_MATCH_INTEL_FAM6_MODEL(ALDERLAKE_L, HWP_SET_DEF_BALANCE_PERF_EPP(102)), X86_MATCH_INTEL_FAM6_MODEL(SAPPHIRERAPIDS_X, HWP_SET_DEF_BALANCE_PERF_EPP(32)), X86_MATCH_INTEL_FAM6_MODEL(METEORLAKE_L, HWP_SET_EPP_VALUES(HWP_EPP_POWERSAVE, - HWP_EPP_BALANCE_POWERSAVE, 115, 16)), + 179, 64, 16)), {} };

Holy magic numbers, batman.

Permalänk
Medlem
Visa signatur

Marantz NR1605, Rotel RB1090, Ino Audio piPs
SMSL SP200 THX Achromatic Audio Amplifier 888, SMSL M400, Audio-Gd NFB-11 (2015), Objective2+ODAC RevB, Audeze LCD-2 Rosewood, Monoprice M1060, ATH-M40x, Sennheiser HD660S, DROP X KOSS ESP/95X, Koss KPH30i, DROP X HiFiMan HE4XX

Permalänk
Medlem

"en enda rad kod", tekniskt korrekt, men det är ju defacto enbart en ändrad konfigurationsinställning för energibesparing i en mobil processor.
Inte jättemärkligt att det ger prestandaförbättingar, frågan är väl vad det gör för batterianvändnignen som torde vara viktigt på en mobil enhet. Synd bara de inte undersökte om det blev någon skillnad i batteritid.

Ditt inlägg dök upp när jag postat mitt redan @backspace

Permalänk
Medlem

Sådana här artiklar skrämmer mig lite, då jag funderar på hur mycket outnyttjad prestanda som finns att hämta i Intels äldre kretsar.

Intels egna Clear Linux OS visar ofta vart skåpet skall så (och Windows får skämskudden igen).

Men tänk en värld där faktiskt Windows varit bättre optimerat? Förhoppningsvis kommer övergången till ARM64 tvinga Microsoft att faktiskt göra något bra denna gången.

Edit:
I övrigt helt otrolig artikel som upptäckt att olika EPP-lägen kan påverka prestandan. Faktiskt lite besviken då det inte var mer magi bakom prestandaökningen.

Får flashbacks till när jag testade kärnor med olika governors för bästa prestanda.

Permalänk
Medlem
Skrivet av The-Architect:

"en enda rad kod", tekniskt korrekt, men det är ju defacto enbart en ändrad konfigurationsinställning för energibesparing i en mobil processor.
Inte jättemärkligt att det ger prestandaförbättingar, frågan är väl vad det gör för batterianvändnignen som torde vara viktigt på en mobil enhet. Synd bara de inte undersökte om det blev någon skillnad i batteritid.

Ditt inlägg dök upp när jag postat mitt redan @backspace

Om man tittar på Phoronix och deras graf så ser det ut som att den använder mer ström vid arbete, frågan är om det avhjälps av att beräkningarna går snabbare dock (kanske?).

Permalänk
Medlem
Skrivet av dlq84:

Om man tittar på Phoronix och deras graf så ser det ut som att den använder mer ström vid arbete, frågan är om det avhjälps av att beräkningarna går snabbare dock (kanske?).

Personligen "gillar" jag idén av att DATAN utför det som skall datas på kortast möjliga tid istället för att det skall dras ut på.

Visa signatur

Marantz NR1605, Rotel RB1090, Ino Audio piPs
SMSL SP200 THX Achromatic Audio Amplifier 888, SMSL M400, Audio-Gd NFB-11 (2015), Objective2+ODAC RevB, Audeze LCD-2 Rosewood, Monoprice M1060, ATH-M40x, Sennheiser HD660S, DROP X KOSS ESP/95X, Koss KPH30i, DROP X HiFiMan HE4XX

Permalänk
Hedersmedlem
Skrivet av walkir:

Men tänk en värld där faktiskt Windows varit bättre optimerat?

Många kör väl dessutom "Balanserat" som energischema?

Permalänk
Medlem

Vad tusan, varför la ni då inte in ännu fler rader!?

Visa signatur

Lead 3D Artist, Sweden
+ Xeon Gold 6246R, 2x Nvidia RTX A5000 24GB + NVLink, 191GB ECC RAM
+ HP Zbook Fury 16 G11 Workstation, i9-14900HX, RTX 5000 16GB Ada-Gen, 128GB RAM

Permalänk
Medlem
Skrivet av backspace:

Heller hur, "Toms Hardware skriver att Phoronix skriver att...."

Visa signatur

Intel i9-12900K | Asus STRIX Z690-I | 32 GB DDR5-6400 CL30 | AMD Radeon RX 7900 XTX | WD Black SN850 1 TB
Asus ROG Loki SFX-L 750W | SSUPD Meshlicious | Arctic Cooling Freezer II 280 | Alienware AW3423DWF

Permalänk
Medlem
Skrivet av Elgot:

Många kör väl dessutom "Balanserat" som energischema?

Jag trodde att alla körde med ThrottleStop?

Själv har jag aldrig blivit kompis med energischeman i Windows, då jag anser att samtliga är smått värdelösa. Intel Dynamic Platform and Thermal Framework (IDPTF) är dock skällsord nummer ett!

Permalänk
Medlem

BeAPieceOfShit = true false

Permalänk
Medlem
Skrivet av Elgot:

Många kör väl dessutom "Balanserat" som energischema?

Skrivet av walkir:

Jag trodde att alla körde med ThrottleStop?

Själv har jag aldrig blivit kompis med energischeman i Windows, då jag anser att samtliga är smått värdelösa. Intel Dynamic Platform and Thermal Framework (IDPTF) är dock skällsord nummer ett!

Jag kör Balanced i Windows för att när jag kör över till High performance så går aldrig GPU ned i låg frekvens. Dvs kör den i 200w även i idle.. Jag tror jag fick 1 hela FPS på att byta energischema så jag bytte tillbaka till balanced och har inte haft några problem alls sedan dess.

Visa signatur

I7 12700K, Asus RTX 3080 TI, Alienware AW3423DW och annat smått o gott.

Permalänk
Medlem
Skrivet av walkir:

Jag trodde att alla körde med ThrottleStop?

Själv har jag aldrig blivit kompis med energischeman i Windows, då jag anser att samtliga är smått värdelösa. Intel Dynamic Platform and Thermal Framework (IDPTF) är dock skällsord nummer ett!

Enda användningen för energischemat på Windows är att sätta max processor state till 99% istället för 100% för att laptopen inte ska låta som ett jetplan så fort man använder den till något.

Permalänk
Medlem
Skrivet av walkir:

Sådana här artiklar skrämmer mig lite, då jag funderar på hur mycket outnyttjad prestanda som finns att hämta i Intels äldre kretsar.

Intels egna Clear Linux OS visar ofta vart skåpet skall så (och Windows får skämskudden igen).

Men tänk en värld där faktiskt Windows varit bättre optimerat? Förhoppningsvis kommer övergången till ARM64 tvinga Microsoft att faktiskt göra något bra denna gången.

Edit:
I övrigt helt otrolig artikel som upptäckt att olika EPP-lägen kan påverka prestandan. Faktiskt lite besviken då det inte var mer magi bakom prestandaökningen.

Får flashbacks till när jag testade kärnor med olika governors för bästa prestanda.

Jo, man undrar hur det hade blivit om de släppte en "bleeding edge" kernel eller vad man ska kalla det som kan ta nytta utav alla nya tekniker och inte är begränsad så den ska kunna köra på upp till 10+ år gamla cpus... ("unsupported" men ändå).

nu nyligen började de kräva popcnt som slår ut core2due/quad (allt på socket 775?) men hur mycket mer finns det sedan den kom liksom.

Visa signatur

Xeon E5450@3.2ghz
9800GTX+

Permalänk
Medlem
Skrivet av Sh4d0wfi3nd:

Jag kör Balanced i Windows för att när jag kör över till High performance så går aldrig GPU ned i låg frekvens. Dvs kör den i 200w även i idle.. Jag tror jag fick 1 hela FPS på att byta energischema så jag bytte tillbaka till balanced och har inte haft några problem alls sedan dess.

Har också kört otaliga benchmarks med olika energisparlägen på min laptop och "balanced" ger oftast bäst resultat med längst och jämnast Turbo Boost. Tyckte mig också se att "high performance" främst får CPU:n att throttla mer.

Då jag kör en laptop, så fick jag största prestandaökningen av att undervolta CPU och iGPU (FIVR) med -100mV. Min gamla i7:a slår fortfarande flera generationer nyare CPU:er som inte är tweakade på samma sätt. Att även många nyare CPU:er är låsta gör att jag håller hårt i gamla Bettan

Edit:
Geekbench - https://browser.geekbench.com/v6/cpu/186256

Har glömt hur man sorterar i deras lista, men sist jag kollade så låg jag i topp bland alla i7-8565U resultat

Nooooo! Har ramlat ned till en 5:e plats
https://browser.geekbench.com/v6/cpu/search?dir=desc&page=1&q...

Permalänk
Datavetare

Ännu ett exempel på där "fine wine" är en direkt PR-katastrof...

Naturligtvis kommer vissa problem upptäckas först efter lansering. Meteor Lake verkar ju faktiskt ha blivit rätt mycket vad Intel initialt lovade, men det såg knappast ut så från start.

Inte bara detta exempel, ännu mer målande är nog MSI Claw som idag faktiskt är konkurrenskraftig med de handhållna enheterna utrustade med AMD Z1 / Z1 Extreme. Fast är ju inte precis det man läser om man kolla reviews..

Får se hur mycket detta upprepas med Lunar Lake. Den kretsen verkar närmare Meteor Lake sett till krav på schemaläggning och energispar-policy, men skiljer sig ändå på viktiga detaljer.

Positiva är ändå att Lunar Lake borde vara enklare att skapa en optimal policy för då man slipper hantera SMT i P-kärnorna samt att E-kärnorna blivit så kraftiga att de i praktiken bör hantera det mesta. Så svårigheten där blir att lura ut när P-kärnorna ska aktiveras, möjligen är det liknande problem som Meteor Lake har här.

Detta är ännu ett exempel på där "race-to-sleep" är värdefullt, framförallt på en plattform där peak-effekt är rätt hög. Phoronix skriver

"When looking at the CPU power consumption overall, for the wide variety of workloads tested it was just a slight uptick in power use and thus overall leading to slightly better power efficiency too."

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av backspace:

Personligen "gillar" jag idén av att DATAN utför det som skall datas på kortast möjliga tid istället för att det skall dras ut på.

Fast i det här fallet är det ju en mobil processor där hastighet (oftast) måste avvägas mot energianvändning för att också ha acceptabel batteritid.

Permalänk
Medlem

Detta påminner för övrigt om när nån moddare ändrade typ en rad i GTA V som kortade ner laddningstiderna nå jävulskt.

Permalänk
Medlem
Skrivet av Yoshman:

Ännu ett exempel på där "fine wine" är en direkt PR-katastrof...

Naturligtvis kommer vissa problem upptäckas först efter lansering. Meteor Lake verkar ju faktiskt ha blivit rätt mycket vad Intel initialt lovade, men det såg knappast ut så från start.

Inte bara detta exempel, ännu mer målande är nog MSI Claw som idag faktiskt är konkurrenskraftig med de handhållna enheterna utrustade med AMD Z1 / Z1 Extreme. Fast är ju inte precis det man läser om man kolla reviews..

Får se hur mycket detta upprepas med Lunar Lake. Den kretsen verkar närmare Meteor Lake sett till krav på schemaläggning och energispar-policy, men skiljer sig ändå på viktiga detaljer.

Positiva är ändå att Lunar Lake borde vara enklare att skapa en optimal policy för då man slipper hantera SMT i P-kärnorna samt att E-kärnorna blivit så kraftiga att de i praktiken bör hantera det mesta. Så svårigheten där blir att lura ut när P-kärnorna ska aktiveras, möjligen är det liknande problem som Meteor Lake har här.

Detta är ännu ett exempel på där "race-to-sleep" är värdefullt, framförallt på en plattform där peak-effekt är rätt hög. Phoronix skriver

"When looking at the CPU power consumption overall, for the wide variety of workloads tested it was just a slight uptick in power use and thus overall leading to slightly better power efficiency too."

För någon som siktar på en kraftfull CPU nästa år d.v.s. Q4 2025, skulle du säga att Lunar Lake är en bra nivå att lägga sig på? Jag behöver Intel-instruktkoner med Intel OneAPI ekosystemet så därav är jag beroende av deras CPU:er. Men jag är rädd för att Lunar Lake bara ett "mellanstopp" och inte det där jätteklivet som man önskar.

Permalänk
Datavetare
Skrivet av Alotiat:

För någon som siktar på en kraftfull CPU nästa år d.v.s. Q4 2025, skulle du säga att Lunar Lake är en bra nivå att lägga sig på? Jag behöver Intel-instruktkoner med Intel OneAPI ekosystemet så därav är jag beroende av deras CPU:er. Men jag är rädd för att Lunar Lake bara ett "mellanstopp" och inte det där jätteklivet som man önskar.

Personligen hoppas (och tror) jag att ARM64 är framtiden för bärbara. Men man får ändå ge Intel att de gjort ett väldigt bra jobb med OneAPI, tror det finns en rätt stark anledning till att den enda av konkurrenterna Jensen ens bemödat sig dissa är just Intel och deras OneAPI.

Svårt att säga något definitivt om Lunar Lake innan release. Men stämmer den information man presterat kommer iGPU-delen bli riktigt bra (för att vara en iGPU), framförallt ihop med OneAPI. Apple kommer fortfarande vara klar ledare i iGPU-racet med deras Max-serie, men Battlemage ser ut att kunna hamna ungefär mitt emellan "vanliga" M3 och M3-pro sett till GPU-prestanda.

Sen är knappast Lunar Lake en "kraftig" CPU, huvudpoängen är att försöka konkurrera med Qualcomms Snapdragon X och Apple M3/M4 i segmentet 15-25 W. Kommande H-serien är den "kraftiga" varianten som går upp mot AMD Strix Point (som ser ut att primärt vara H-nivå). Fast för Intels del blir det Arrow Lake, inte Lunar Lake.

Så Lunar Lake ser ut att bli ett "mellanstop" i bemärkelsen: "vi gör en specifik serie för 15-25 W". Efterföljaren Panter Lake ska täcka hela segmentet igen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

#pragma optimize("Speeeed!”)

Permalänk
Medlem

Clickbait-titel (det är upp till 72% ökning i en specifik last) och Tom's Hardware som källa istället för Phoronix, vad är det som händer egentligen?

Visa signatur

Mjölnir: Ryzen 9 3900X | X570-I | Ballistix Sport 32GB | Powercolor RX 5500XT 4GB ITX | Kolink Sattelite
Server: Ryzen 5 1400 | X470-F | Ballistix Sport 24GB | ASUS HD 7790 2GB | Sapphire RX 470 8GB ME | NZXT Switch 810

Permalänk
Medlem
Skrivet av Djhg2000:

Clickbait-titel (det är upp till 72% ökning i en specifik last) och Tom's Hardware som källa istället för Phoronix, vad är det som händer egentligen?

Tyvärr har det ju på sistone blivit så att om man redan läser Phoronix och Wccftech så är kommentarerna på nyheterna enda anledningen att också hålla koll på Sweclockers.

Permalänk
Medlem

72% högre prestanda? Genomsnittet var ju 7%. En clickbait på över 10 ggr sanningen alltså!

Permalänk
Medlem
Skrivet av walkir:

Men tänk en värld där faktiskt Windows varit bättre optimerat? Förhoppningsvis kommer övergången till ARM64 tvinga Microsoft att faktiskt göra något bra denna gången.

Det hade också varit intressant om Linux hade get ~ 70% bättre prestanda i nästan allt gällande spel och arbete än Windows.

Undrar hur många som skulle kunna tänka sig att byta till Linux då ?

Exempel
(Jag tog första bästa RTX 4090 recension jag hittade på Techpowerup)

(croppade bilden i botten för att få ner storleken.)

Säg RTX 4080 ~ 113 FPS, 70% av det är ca 79 FPS.
Så om att använda det i linux gett ca 79 extra FPS hade det blivit ca 193 FPS.

Undrar hur många som hellre hade köpt ett RTX 4080 och installerat Linux för att få runt 190 FPS istället för att köpa ett RTX 4090 och köra Windows för att få runt 150 FPS.

Jag vet att det inte var scenariot.

Men tror fler hade kunnat tänka sig Linux om det gav markanta prestandafördelar i det mesta istället för i enstaka nischscenarion som inte påverkar de flesta.

Permalänk
Medlem
Skrivet av Magnus303:

72% högre prestanda? Genomsnittet var ju 7%. En clickbait på över 10 ggr sanningen alltså!

Håller med! Helt galet. i helvete att de va några 72% högre prestanda!

Jag kan ta 72% i löneök istället för mina 7 menar 2% xD

Visa signatur

CPU:5800X
GPU: 3080OC
Jag är mindre sosse än dig #Folding #Sweclockers #AnvänderMinGPU
https://www.sweclockers.com/forum/trad/1348460-faq-kom-igang-...
https://folding.extremeoverclocking.com/team_summary.php?s=&t...

Permalänk
Medlem
Skrivet av Yoshman:

Personligen hoppas (och tror) jag att ARM64 är framtiden för bärbara. Men man får ändå ge Intel att de gjort ett väldigt bra jobb med OneAPI, tror det finns en rätt stark anledning till att den enda av konkurrenterna Jensen ens bemödat sig dissa är just Intel och deras OneAPI.

Jag tycker att det hade varit spännande om RISC-V växer med öppen ISA.

Har sett att vissa tror RISC-V kommer växa mycket inom AI och bli en stor del av framtida AI plattformar.

Men allt är ju inte AI. Så även om de blir en stor del av AI kluster betyder inte automatiskt att det blir en stor del av desktops och laptops.

Permalänk
Medlem
Skrivet av atego:

Håller med! Helt galet. i helvete att de va några 72% högre prestanda!

Jag kan ta 72% i löneök istället för mina 7 menar 2% xD

Du får hitta något enstaka arbetsmoment som du kan bli 72% effektivare i och sen ökar du din allmänna arbetsprestanda/resultat med 7% och tar 72% högre lön.