Trening gjør AI-mester - men vi må skynde oss

13.11.2024

Generativ AI som ChatGPT og DALL-E har imponert oss med sin evne til å behandle tekst og bilder – men den store suksessen har også en mørkere side. Etterspørselen etter AI-modeller krever enorm datakraft, og teknologigiganter som Google og Microsoft må nå revurdere sine klimamål. Spørsmålet er om vi kan produsere nok energi på en bærekraftig måte til å dekke behovet for datakraft. Kan AI selv bidra til løsningen på energikrisen den har vært med på å skape, eller må vi vende oss til nye energikilder som atomkraft? (Denne ingressen er AI-generert, med artikkelen under som input).

AI imponerer

Det er fascinerende hva generativ AI kan gjøre, og de fleste av oss har forlengst prøvd hvordan søk og behandling av tekst og bilder håndteres på en imponerende måte av f.eks Chat GPT og Dall-E. 

Det er imponerende nok hva hver enkelt av oss forbrukere kan få ut av AI, men kunstig intelligens integrert i algoritmer i programvare innen sivil industri, forskning og våpenindustri har selvsagt ennå større innvirkning på vår hverdag. Diskusjonen går derfor høyt både politisk, etisk og teknologisk om hvordan AI bør og kan benyttes. 

Men hvordan det er mulig å få "dumme" datamaskiner til å fremstå som intelligente hjelpere? Svaret er ikke så overraskende: Datamaskinene må trene for å bli gode. Det ligger allerede i begrepet Machine Learning. 

AI er problemet

For å trene opp AI-modellene må svært store datamaskinklynger, tunge algoritmer og enorme datasett kjøres om igjen og om igjen i en prøve, feile, justere-syklus inntil resultatet blir som ønsket. I tillegg til treningen kommer bruk av modellen etter at den er rullet ut til brukere som deg og meg, og til forskning og industri.

Resultatet er et enormt behov for datakraft. Så stort at de største leverandørene, som f.eks Google Microsoft og Meta, ikke lenger er så åpne om datakilder, datakraft, trening og energiforbruk. De må faktisk revurdere sine egne klimamål pga AI.

Datakraften kommer enten fra allerede etablerte datasentre, hvorav 30% befinner seg i USA, eller skal komme fra datasentre under utbygging. 

ChatGPT tok verden med storm i november 2022. Brått var datasenterindustrien stilt overfor et nærmest umettelig behov for enda mer datakraft for å kunne trene opp enda mer intelligente datamaskiner. 

Kort oppsummert øker nå behovet for (eller ønsket om) energi til datasentrene så mye og så raskt at det ikke finnes et godt svar på hvordan både forbrukere, eksisterende industri og nye datasentre skal kunne få levert den energien de trenger! 

AI er Løsningen

Kanskje løsningen kan finnes ved hjelp av kunstig intelligens? Kanskje er det nettopp ML og AI som kan løse dilemmaet de selv har skapt? Det som er helt sikkert er at det trengs et gjennombrudd når det gjelder energieffektivitet. Energien må både produseres mer effektivt og måten vi forbruker den på må bli mer effektiv.

Det er utopisk å tro at utviklingen av kunstig intelligens skal kunne begrenses eller stoppes på noen som helst måte. Til det er AI og ML for tett knyttet til økonomisk, politisk, militært og sikkerhetsmessig lederskap i verden. 

Både Bill Gates og Sam Altman mener det må satses mer på atomkraft for å løse energiutfordringen. At to personer som står så tett på utviklingen av kunstig intelligens mener at kjernekraft er løsningen er neppe tilfeldig.

Uansett om løsningen er kjernekraft, kvantedatamaskiner eller en kombinasjon av flere ting - vi må fortsette å trene opp datamaskinene så vi kan finne svaret - fort! 

Hva tenker ChatGPT om dette?

Hva er da mer naturlig enn å spørre en AI-tjeneste om løsning på problemet? Nedenfor har jeg rett og slett stilt et kort generisk spørsmål til OpenAI sin standard ChatGPT-4o. Den greier fint ut om hvilke områder som bør adresseres. Men herfra er det et stykke igjen til de industrialiserte løsningene som både fikser energiutfordringen og er lønnsomme for produsentene. Forventningene til effekten av kunstig intelligens er store innen forskning og innovasjon. Der er det andre anvendelser av AI enn den vi ser i "generative pre-trained transformers" som vil bli avgjørende. Som sagt - vi håper det skjer raskt.

Les også:
Er skytjenestene grønne?
Bærekraft og digitalisering.


Det ChatGPT svarte:

***

Hei (ChatGPT Classic). "Hva kan være en game changer for å løse utfordringen med nok strøm til alle datasentrene som skal kjøre maskinlæring?"
Hei (Inge)!
Det er et veldig aktuelt tema. Maskinlæringsmodeller krever enormt med strøm, og etterspørselen etter kraft til datasentre stiger raskt. For å løse utfordringen med nok strøm til alle datasentrene som skal kjøre maskinlæring, kan flere mulige "game changers" vurderes. Her er noen av de mest lovende løsningene:
1. Forbedret Energieffektiv Maskinvare
Effektiv maskinvare: Spesialdesignet maskinvare, som TPUs (Tensor Processing Units) og andre akseleratorer, kan være mye mer energieffektive enn tradisjonelle CPU-er og GPU-er for maskinlæringsoppgaver. Dette reduserer energibehovet per operasjon og kan gjøre det mer skalerbart å kjøre avanserte modeller.
Optiske prosessorer: Forskning på optiske (lysbølgebaserte) prosessorer, som bruker lys i stedet for elektroner for å behandle informasjon, har potensial til å drastisk redusere energikravene til tunge beregninger. Disse teknologiene er fortsatt i tidlig fase, men kan gi store gevinster på sikt.
2. AI-Effektive Algoritmer og Modelloptimalisering
Modellkomprimering og kvantisering: Gjennom teknikker som pruning (beskjæring) og kvantisering, kan man redusere modellstørrelsen og kompleksiteten uten å ofre nøyaktigheten for mye. Mindre modeller krever mindre beregningskraft og dermed mindre energi.
Smartere algoritmer: I stedet for å trene modeller fra bunnen av, kan teknikker som transfer learning (overføring av læring) og knowledge distillation gjøre det mulig å gjenbruke kunnskap fra eksisterende modeller og dermed redusere treningskostnader.
3. Bruk av Fornybar Energi og Lokal Energiproduksjon
Sol- og vindkraft for datasentre: Ved å bygge datasentre i nærheten av fornybare energikilder, som sol- og vindkraftanlegg, kan man redusere avhengigheten av det tradisjonelle strømnettet. Noen datasentre i områder som har mye sol eller vind, har begynt å operere på nesten 100 % fornybar energi.
Kombinasjon med batterilagring: Datasentre som kombinerer fornybar energi med batterilagring kan lagre overskuddsenergi fra sol- og vindkraft for bruk når det er lite produksjon (som om natten eller på vindstille dager). Dette vil stabilisere energitilgangen og redusere belastningen på strømnettet.
4. Flytting til Kaldere Klima og Strømsterke Områder
Nordiske land som vertskap for datasentre: Norge, Sverige, og Finland er attraktive steder for datasentre på grunn av den lave temperaturen (som reduserer behovet for kjøling) og tilgang til billig og ren vannkraft. Ved å legge datasentrene til slike områder, kan de operere mer energieffektivt.
"Edge computing" for desentralisert databehandling: Ved å distribuere beregningsoppgaver mer desentralisert, i stedet for å ha alt på store datasentre, kan man utnytte lokale ressurser bedre og unngå å bygge flere store energikrevende datasentre.
5. Varmt gjenbruk
Bruk av spillvarme til fjernvarme: Datasentre genererer mye varme som i stedet for å kjøles bort kan brukes til oppvarming. I flere europeiske byer har man begynt å integrere datasentre i fjernvarmenett, slik at overskuddsvarmen fra serverne kan brukes til å varme opp bygninger. Dette bidrar til energioptimalisering og reduserer behovet for tradisjonell oppvarming.
6. Innovasjon i Strømforsyningsarkitektur og Strømstyring
AI-styrt strømstyring: Ved å bruke kunstig intelligens til å optimalisere energibruken i datasentre kan man tilpasse strømforbruket etter behovet. For eksempel kan noen servere være i "dvale" når de ikke er i bruk, og automatisk skrus på når trafikken øker.
Direkte likestrøm (DC): De fleste datasentre bruker vekselstrøm (AC) som må konverteres til likestrøm (DC) for serverne. Dette innebærer energitap. Datasentre som bygges med DC-arkitektur kan redusere energitap og dermed redusere det totale energiforbruket.
7. Nye Energitilnærminger – F.eks. Kjernereaktorer og Hydrogen
Minikjernereaktorer: Små modulære reaktorer (SMRs) er en form for kjerneenergi som er mye mindre enn tradisjonelle kjernekraftverk og kan plasseres i nærheten av datasentre. Dette kan være en løsning der kjernekraft er sosialt akseptert og kan gi kontinuerlig kraft uten karbonutslipp.
Grønn hydrogen: Ved å bruke elektrolyse til å produsere hydrogen fra fornybar energi, kan man lage en form for energi som er lagringsdyktig og fleksibel. Hydrogen kan brukes i brenselceller for å drive datasentre når det ikke er tilgang til nok fornybar energi.
8. Programvareoptimalisering og "Green AI"
Green AI-initiativer: Dette innebærer å utvikle maskinlæringsmodeller med bærekraft som mål, slik at modellene trenes og kjøres på en energibesparende måte. Flere forskningsmiljøer fokuserer nå på dette og prøver å designe algoritmer med minst mulig karbonavtrykk.
Automatisk optimalisering av treningsprosesser: Flere nye AI-verktøy kan overvåke og justere treningsprosessen for å redusere unødvendige beregninger. For eksempel kan man stoppe trening tidligere hvis modellen allerede har oppnådd god nok nøyaktighet.
Oppsummert
Den mest effektive løsningen vil sannsynligvis være en kombinasjon av flere av disse tiltakene. Bruk av fornybar energi og avansert maskinvare er kritisk for å håndtere den enorme energimengden som maskinlæring krever, men langsiktig kreves det også innovasjon på både programvare- og infrastrukturfronten. Med de riktige insentivene og videre forskning kan flere av disse teknologiene bli "game changers" for bærekraftig AI-drift.
Dall-E har generert dette bildet
Dall-E har generert dette bildet