Stack Overflow-användare ilsknar till efter Open AI-affär

Permalänk
Melding Plague

Stack Overflow-användare ilsknar till efter Open AI-affär

Saboterar egna inlägg som AI-modellen ska träna på.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Så de som besökte sidan och kopierade kod för sitt arbete kan nu ta det direkt via chatgpt?

#framtiden

Permalänk
Medlem

Tyvärr ni kan inte hindra utvecklingen, även om den leder till våran undergång

Visa signatur

Ryzen 5900X @ Stock, MSI Suprim X 3080 @ game mode.

Permalänk
Medlem

I grunden är det väl framförallt sajtägarens "bait and switch" som kritiken gäller; antar att deras jurister kommit fram till att detta går att göra enligt villkoren de satt upp, och uppenbart är den här satsningen viktigare än förtroendet från användarna som faktiskt byggt sajtens framgång hittills.

Sedan finns det säkert AI-kritik inblandat i det också, men det känns inte som huvudfrågan här.

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk

Jag ser hur LLM:er är ett problem för såna här sidor: de resulterar sannolikt i att sidorna får färre besökare och därmed lägre reklamintäkter. Ett förbund med "fienden" är därmed åtminstone temporärt ett sätt att behålla näsan över vattenytan, så länge det fortsätter tillkomma nytt material på siten. LLM:ens ägare kan samtidigt peka på avtalet och undvika stämningar från site-ägaren.

Däremot har jag otroligt svårt att se hur sitens användare kan bli upprörda över detta. De har effektivt sett lämnat ifrån sig alla rättigheter till sina inlägg när de registrerade sig för ett konto. Vill du äga ditt innehåll, publicera det på din egen site under ditt eget namn. Jag har själv flera hundra inlägg på systersiten Serverfault och har periodvis legat på deras top-1%-lista, men det har ju aldrig varit en fråga om något annat än volontärarbete i hopp om att på något plan göra Internet lite bättre; om inte annat genom att några personer åtminstone undviker de värsta konfigurationsdumheterna när de sätter upp Internettillvända servrar. Folk som klipper-och-klistrar lösningar utan att tänka har alltid funnits, och nu har de hjälp av sina datorer. Inget att gnälla över, bara ditåt världen alltid varit på väg.

Permalänk
Medlem

Tänker att detta är väl generellt rätt positivt sett till utveckling men förstår att det är ett community som bygger på ge och ta där uppskattning och cred är en viktig del för användarna. Inte så konstigt. Handlar ju säkerligen om pengar och det hade ju inte varit helt fel om ägaren köpte ut användarnas kod men det lär ju inte hända. Forumet kommer antingen fortsätta som vanligt eller dö ut på grund av detta.

Visa signatur

Laptop Workstation PC Specialist || Intel 10875H - 250mv & Liquid Metal || Nvidia RTX 2070 883mv @ 1935MHz & Liquid Metal ||64GB Ram || Samsung 970 EVO 2TB + 512GB OEM || 1TB & 512GB External SSD + 2.5TB NAS
Lyssna gärna på mitt band The Mulak Mind
Citera gärna om du vill ha svar!

Permalänk

Det finns mycket man kan motverka i världen. Problemet med att motverka teknik är att även om man själv lyckas få den skara man tillhör att undvika det, så kommer man konkurrera emot resten av världen som använder tekniken.

När det gäller Stack Overflow så kan de säkert lyckas med att motverka de största västerländska LLM. Och många LLM i övriga världen kommer säkerligen skita i vad de tycker är fel och bara använda datan direkt utan ersättning.

Permalänk
Medlem

De kanske skulle kunna ha en inställning i användarprofilen eller när man publicerar något om man tillåter att inlägget får användas av AI. Sedan en regel som gör att AI endast scannar inlägg från användare som godkänt detta.

Permalänk
Medlem

Modus Operandi när konkurrenter käkar upp varandra i den globala kapitalismens tidevarv.
Jag antar att tiden är förbi där man kunde bokmärka ställen som på ett bra sätt förklarade kodsnuttar man kunde forma efter get behov är över och att man idag istället måste gå med mössan i hand till en AI för att få svaren man söker.
Problemet är väl att man allt som oftast måste veta vilket svar man vill ha innan man kan ställa sin fråga till en AI vilket gör hur man pratar med en AI till ytterligare ett abstraktionslager då alla AI jag provat kräver sin egen syntax.

Jag kunde inte ens efter många försök få en bildritar AI att förstå att jag ville ha en bild på spindelmannen som hade fastnat i en spinnrock.

Visa signatur

*5600|B350M-A|32GB|A750|GX750W|Core V21|280AIO|1TB+2TB.

AMD Ryzen 5(Zen3) @4891|Asus Prime|Corsair 2x16 RGB PRO 3200C16 @3800C18|Intel Arc LE @2740MHz|Seasonic Focus| Thermaltake mATX kub|Arctic freezer II| NVMe SSD PCIE 3.0x2 Kingston A1000 1500/1000 + 2,5" HDD Toshiba 1TB & Samsung 1TB i RAID 0.

Permalänk
Medlem

På samma sätt som traditionell media som för 10-15 år sedan fullt ut svalde FB och Googles affärsmodeller, idag kräver bidrag för att FB och Google har underminerat deras affärsmodell, så kommer väl SO om 3-4 år klaga på att Open AI gjort samma sak.

Permalänk
Medlem

Ofattbart smutsigt gjort av Stack Overflow. Jag hoppas det finns möjlighet att stämma dem.

Permalänk
Medlem
Skrivet av Det Otroliga Åbäket:

Jag ser hur LLM:er är ett problem för såna här sidor: de resulterar sannolikt i att sidorna får färre besökare och därmed lägre reklamintäkter. Ett förbund med "fienden" är därmed åtminstone temporärt ett sätt att behålla näsan över vattenytan, så länge det fortsätter tillkomma nytt material på siten. LLM:ens ägare kan samtidigt peka på avtalet och undvika stämningar från site-ägaren.

Däremot har jag otroligt svårt att se hur sitens användare kan bli upprörda över detta.

Det handlar väl i grunden mycket om skillnaden mellan vad användarna tycker känns som en okej kursändring för en sajt som är helt byggd kring användarskapat material jämfört vad användarna faktiskt skulle ha grund att vidta rättsliga åtgärder för.
Detta givet att bolagets jurister gjort en korrekt bedömning om att Creative Commons-licensen är kompatibel med implementationen av den tänkta AI-tjänsten, känns inte helt självklart men de har ju säkert tänkt över det hela och tror att de kommer få det att hända iaf.

Tycker det känns lite extremt att kräva ett helt tydligt juridiskt övertramp för att öht acceptera någon upprördhet när användarna tydligt blir trampade på tårna.

Skrivet av Det Otroliga Åbäket:

De har effektivt sett lämnat ifrån sig alla rättigheter till sina inlägg när de registrerade sig för ett konto.

Nej, sajten har enligt villkoren rätt till innehållet specifikt under "Creative Commons licensing terms (CC BY-SA 4.0)", så de här rättighet att använda materialet för alltid enligt de villkoren, men användaren har ju inte avsagt sig alla rättigheter utan har rätt till attribuering när innehållet används osv.
Och här ifrågasätts om och hur detta kommer lösas, men vi får väl helt enkelt se.

Klicka för mer information

Subscriber Content
You agree that any and all content, including without limitation any and all text, graphics, logos, tools, photographs, images, illustrations, software or source code, audio and video, animations, and product feedback (collectively, “Content”) that you provide to the public Network (collectively, “Subscriber Content”), is perpetually and irrevocably licensed to Stack Overflow on a worldwide, royalty-free, non-exclusive basis pursuant to Creative Commons licensing terms (CC BY-SA 4.0), and you grant Stack Overflow the perpetual and irrevocable right and license to access, use, process, copy, distribute, export, display and to commercially exploit such Subscriber Content, even if such Subscriber Content has been contributed and subsequently removed by you as reasonably necessary to, for example (without limitation):

Provide, maintain, and update the public Network
Process lawful requests from law enforcement agencies and government agencies
Prevent and address security incidents and data security features, support features, and to provide technical assistance as it may be required
Aggregate data to provide product optimization
This means that you cannot revoke permission for Stack Overflow to publish, distribute, store and use such content and to allow others to have derivative rights to publish, distribute, store and use such content. The CC BY-SA 4.0 license terms are explained in further detail by Creative Commons, and the license terms applicable to content are explained in further detail here. You should be aware that all Public Content you contribute is available for public copy and redistribution, and all such Public Content must have appropriate attribution.

As stated above, by agreeing to these Public Network Terms you also agree to be bound by the terms and conditions of the Acceptable Use Policy incorporated herein, and hereby acknowledge and agree that any and all Public Content you provide to the public Network is governed by the Acceptable Use Policy.

Visa mer

(Från https://stackoverflow.com/legal/terms-of-service/public#terms... )

Skrivet av Det Otroliga Åbäket:

Vill du äga ditt innehåll, publicera det på din egen site under ditt eget namn.

Ja, det är ju på många sätt bättre, men tror mer grundfrågan i det avseendet mer handlar om hur långt man kan dra användandet av innehåll licensierat under "CC BY-SA 4.0", oavsett om det publicerats på en egen sajt eller på en sajt i t.ex. Stackexchange.

Skrivet av Det Otroliga Åbäket:

Jag har själv flera hundra inlägg på systersiten Serverfault och har periodvis legat på deras top-1%-lista, men det har ju aldrig varit en fråga om något annat än volontärarbete i hopp om att på något plan göra Internet lite bättre; om inte annat genom att några personer åtminstone undviker de värsta konfigurationsdumheterna när de sätter upp Internettillvända servrar. Folk som klipper-och-klistrar lösningar utan att tänka har alltid funnits, och nu har de hjälp av sina datorer. Inget att gnälla över, bara ditåt världen alltid varit på väg.

Jag tycker det är bra när folk gör åtminstone lite motstånd när de känner att deras rättigheter trampas på.

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Skrivet av evil penguin:

Det handlar väl i grunden mycket om skillnaden mellan vad användarna tycker känns som en okej kursändring för en sajt som är helt byggd kring användarskapat material jämfört vad användarna faktiskt skulle ha grund att vidta rättsliga åtgärder för.
Detta givet att bolagets jurister gjort en korrekt bedömning om att Creative Commons-licensen är kompatibel med implementationen av den tänkta AI-tjänsten, känns inte helt självklart men de har ju säkert tänkt över det hela och tror att de kommer få det att hända iaf.

Tycker det känns lite extremt att kräva ett helt tydligt juridiskt övertramp för att öht acceptera någon upprördhet när användarna tydligt blir trampade på tårna.

Nej, sajten har enligt villkoren rätt till innehållet specifikt under "Creative Commons licensing terms (CC BY-SA 4.0)", så de här rättighet att använda materialet för alltid enligt de villkoren, men användaren har ju inte avsagt sig alla rättigheter utan har rätt till attribuering när innehållet används osv.
Och här ifrågasätts om och hur detta kommer lösas, men vi får väl helt enkelt se.

Klicka för mer information

Subscriber Content
You agree that any and all content, including without limitation any and all text, graphics, logos, tools, photographs, images, illustrations, software or source code, audio and video, animations, and product feedback (collectively, “Content”) that you provide to the public Network (collectively, “Subscriber Content”), is perpetually and irrevocably licensed to Stack Overflow on a worldwide, royalty-free, non-exclusive basis pursuant to Creative Commons licensing terms (CC BY-SA 4.0), and you grant Stack Overflow the perpetual and irrevocable right and license to access, use, process, copy, distribute, export, display and to commercially exploit such Subscriber Content, even if such Subscriber Content has been contributed and subsequently removed by you as reasonably necessary to, for example (without limitation):

Provide, maintain, and update the public Network
Process lawful requests from law enforcement agencies and government agencies
Prevent and address security incidents and data security features, support features, and to provide technical assistance as it may be required
Aggregate data to provide product optimization
This means that you cannot revoke permission for Stack Overflow to publish, distribute, store and use such content and to allow others to have derivative rights to publish, distribute, store and use such content. The CC BY-SA 4.0 license terms are explained in further detail by Creative Commons, and the license terms applicable to content are explained in further detail here. You should be aware that all Public Content you contribute is available for public copy and redistribution, and all such Public Content must have appropriate attribution.

As stated above, by agreeing to these Public Network Terms you also agree to be bound by the terms and conditions of the Acceptable Use Policy incorporated herein, and hereby acknowledge and agree that any and all Public Content you provide to the public Network is governed by the Acceptable Use Policy.

Visa mer

(Från https://stackoverflow.com/legal/terms-of-service/public#terms... )

Ja, det är ju på många sätt bättre, men tror mer grundfrågan i det avseendet mer handlar om hur långt man kan dra användandet av innehåll licensierat under "CC BY-SA 4.0", oavsett om det publicerats på en egen sajt eller på en sajt i t.ex. Stackexchange.

Jag tycker det är bra när folk gör åtminstone lite motstånd när de känner att deras rättigheter trampas på.

Jo, man bör göra motstånd, men ärligt talat är ju det enklaste sättet att faktiskt sluta posta där. Utan nytt innehåll från kompetenta människor dör siten, och det är vår bästa hämnd.

Permalänk
Medlem
Citat:

Andra har börjat sabotera eller plocka bort sina egna inlägg på Stack Overflow för att ställa till det för AI-modellen, vilket enligt Tom's Hardware har lett till att sajtens moderatorer haft fullt upp med att stänga av användare under den gångna veckan.

Det här har jag nog mest problem med. Användare som bidragit till sajten får inte ens en chans att ta bort sina inlägg. Måste ju nästan bryta mot GDPR?

Visa signatur

Intel i5 12600K | Asus TUF Gaming Z690-Plus D4 | Asus Geforce RTX 3060 Ti | 32 GB DDR4 | Fractal Design North | Corsair iCue Link H100i | Cooler Master V750 Gold i Multi

Permalänk
Medlem
Skrivet av Gender Bender:

Det här har jag nog mest problem med. Användare som bidragit till sajten får inte ens en chans att ta bort sina inlägg. Måste ju nästan bryta mot GDPR?

Om dom är verksamma i Europa kan man be om rätten att bli bortglömd ja. Men offentlig kod är jag lite osäker på om det hamnar under GDPR...finns inte några personuppgifter i hur man gör ett anrop till en SQL server

Visa signatur

5700x3D | RTX 2060 Super | 2 TB M.2 | 32 GB RAM | Gigabyte DS3H| 750 WATT

Permalänk
Medlem

Jag ser fram emot att alla frågor man ställer till chatgpt besvaras med:
- That is a stupid question
- Duplicate question, removed.

Permalänk
Medlem

Men stackoverflow kommer väl finnas kvar precis som tidigare? Med samma innehåll och funktion? Användarna kommer inte ens att märka något. Förutom färre nya användare då, men de har ändå stått lågt i kurs där...

Använder sidan ofta, men gillar den inte. Glad till alternativ.

Förresten, har inte de stora LLM:erna redan webscrapat allt och tränats på innehållet redan för flera år sedan? Så det här blir en officiell retroaktiv betalning?

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Medlem

Jag tycker att Stack Oveflow började sjunka när den moraliska kompassen Jeff Atwood lämnade bolaget. Han ville förstås också tjäna pengar men var uppenbart primärt intresserad av att skapa en bra grej i världen. Innan stack overflow hade man Yahoo answers och MSN som källa till svar på programmeringsfrågor, det var hemskt.

Efter att han lämnade blev det som med alla bolag som lämnas över till bönräknarna en själlös cash-grab som började värdera det som kan generera pengar framför vad som faktiskt är bra. (Se även alla traditionella tidningar, Apple, Boeing m fl för flera exempel på samma effekt)

Därför blev Stack Overflow sakta sämre. Numera behövs ironiskt nog en LLM för att filtrera irrelevant information från Stack Overflow, så att det integreras med ChatGPT och andra LLM'er är för mig helt OK.

Internet är 90% oanvändbar information, LLM'er hjälper mig hitta det jag behöver veta för att få jobbet gjort bättre än någon annan mekanism jag har tillgång till.

Frågan är förstås hur man skapar en mekanism som uppmuntrar att NY information skapas så att den kan införlivas i en LLM där andra kan hitta den. Jag har inget svar. :-/

Permalänk
Medlem
Skrivet av filbunke:

Så de som besökte sidan och kopierade kod för sitt arbete kan nu ta det direkt via chatgpt?

#framtiden

Ja, det är ju precis det chatgpt (och alla andra) redan gör. Kopierar från en liknande lösning och byter namn på variabler etc. Om de faktiskt förstod vad som händer i applikationen skulle aldrig hallucination finnas för detta..

Permalänk
Medlem

Känns som en sån här affär är första steget ner i graven för alla som tar det. Känns som de säljer ut sin information och det är väl ungefär den som håller de vid liv alls

Permalänk
Medlem

GDPR täcker bara personlig data, kod m.m. ingår inte i detta.
Allt på SO finns ju redan i LLM så enda skillnaden är att SE får betalt för det nu.
I Copilot får du länken till SE sidan som de har hämtat svaret från.
SE gör en dump varje kvartal som vem som helst kan tanka ned.

Visa signatur

Klient: AMD 7 5800X | ASUS X570-F | 32GB 3200MHz | Corsair RM850 | Gigabyte 3070 | Phanteks P500A | Samsung 980 PRO
HTPC: Intel I7 4770T | 16 GB 1600 | FC8 EVO | Gigabyte GA-H87N-WIFI | Samsung 840 250GB
Server: Intel XEON E5620 x 2| ASUS Z8PE-D18 | 96GB 1333MHz | Corsair AX 1200W | HAF 932 | WD Black 2TB
Nätverk: Telia F@st| Unifi AC Lite/Pro/LR/Nano/Mesh/U6-LR/U6+/U6-Lite | Nighthawk M1 | pfSense | TP-Link TL-WPA8630KIT | Ubiquiti NanoStation M5 | UniFi Switch 8-150W

Permalänk
Medlem
Skrivet av Det Otroliga Åbäket:

Jag ser hur LLM:er är ett problem för såna här sidor: de resulterar sannolikt i att sidorna får färre besökare och därmed lägre reklamintäkter. Ett förbund med "fienden" är därmed åtminstone temporärt ett sätt att behålla näsan över vattenytan, så länge det fortsätter tillkomma nytt material på siten. LLM:ens ägare kan samtidigt peka på avtalet och undvika stämningar från site-ägaren.

Däremot har jag otroligt svårt att se hur sitens användare kan bli upprörda över detta. De har effektivt sett lämnat ifrån sig alla rättigheter till sina inlägg när de registrerade sig för ett konto. Vill du äga ditt innehåll, publicera det på din egen site under ditt eget namn. Jag har själv flera hundra inlägg på systersiten Serverfault och har periodvis legat på deras top-1%-lista, men det har ju aldrig varit en fråga om något annat än volontärarbete i hopp om att på något plan göra Internet lite bättre; om inte annat genom att några personer åtminstone undviker de värsta konfigurationsdumheterna när de sätter upp Internettillvända servrar. Folk som klipper-och-klistrar lösningar utan att tänka har alltid funnits, och nu har de hjälp av sina datorer. Inget att gnälla över, bara ditåt världen alltid varit på väg.

Vill bara säga: Bra analys. Och hedervärt slitet på Serverfault.

Visa signatur

Gammal och gnällig

Permalänk
Medlem
Skrivet av Prelatur:

GDPR täcker bara personlig data, kod m.m. ingår inte i detta.

Precis, GDPR i sig täcker inte frågorna/svaren (åtminstone normalt sett, men om vi nu förutsätter att man inte skriver personuppgifter i sina frågor/svar så).

Frågan blir väl snarast hur det fungerar sett till situationen i sin helhet, bortom enbart GDPR.

Licensen de valt kräver trots allt attribuering; så jag antar att de måste lyckas få användaren att avsäga sig sina rättigheter enligt licensvillkoren för att lösa att kunna fortsätta använda innehållet efter att personuppgifterna tagits bort...?

Vet inte om GDPR ger dem någon vidare position att förhandla om eftergifter från användarens sida.

Jag vet inte vad svaret blir, men vill bara belysa att det känns som att en sådan GDPR-baserat förfrågan aktiverar ett minfält för sajten att navigera.

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

Ser inte varför man skulle använda ChatGPT för att lösa ett problem som redan är löst sedan länge!
https://github.com/drathier/stack-overflow-import

Permalänk
Skrivet av Ziron:

Ser inte varför man skulle använda ChatGPT för att lösa ett problem som redan är löst sedan länge!
https://github.com/drathier/stack-overflow-import

Bästa jag sett den här veckan, tror jag! 😂

Permalänk
Quizmaster Malmö 22

Pengarna styr 😐

Visa signatur

[Gigabyte EP35-DS4][Intel Core 2 Duo E8400 3.0 Ghz][2x2GB Corsair XMS 2][Gainward GTX 570][Sandisk Extreme II 480GB][Corsair HX 620W][Fractal Design Define XL R4][Acer GD245HQBID]