Fra emojis til AI: Hvordan data former dine AI-modeller
Vidste du, at alle datatyper - selv emojis - kan forme AI-modeller? Data er AI's råstof, og de forskellige typer kan skabe helt nye muligheder for din virksomhed.
I sin 1964 bestseller; Understanding Media: The Extensions of Man, skrev professor, filosof og førende kommunikationsteoretiker, Marshall McLuhan at "the medium is the message", altså at medievalget, er en del af budskabet. Det er, hvad chefen i virkeligheden referer til, når han snakker om emojis.
Forskning viser, at emojis hjælper os med at forstå budskaber hurtigere. Det er fordi, en emoji indeholder meget mere data end et enkelt ord, og det er vigtigt. I en nutid fyldt med AI-indhold, er det et betydningsfuldt emne for virksomheder: hvordan forskellige datatyper former AI-modeller og forretningsstrategier.
Den skjulte værdi i data
I vores professionelle arbejde er mange af os vant til at tænke på data i form af tekst, eksempelvis Word-dokumenter og Excel-ark. Men i AI-æraen er al kommunikation potentiel træningsdata for modellerne, og har derfor stor betydning for de AI-løsninger, vi benytter. Lad os dykke ned i, hvad de forskellige datatyper er, og deres betydning for AI:
Vi kan inddele data i tre overordnede kategorier:
1. Tekst
- Mest almindelig i forretningskommunikation
- Relativt let at behandle og analysere
- Indeholder ca. 1 'token' (informationsenhed) pr. ord
- Komprimeringsforhold: 2:1 til 10:1 med algoritmer som gzip
2. Billeder og emojis
- Indeholder væsentligt mere information pr. enhed
- En enkelt emoji kan formidle en hel følelse eller koncept
- Billeder kan indeholde tusindvis af tokens
3. Video og lyd
- Ekstremt informationsrige
- Moderne videokomprimering, som H.265, kan nå forhold på 1000:1 eller mere
Standard komprimeringsværktøjer kan altså opnå komprimeringsforhold på op til 10:1 for tekst, og 1000:1 eller mere for video. Den markante forskel demonstrerer indirekte den meget højere informationstæthed i video sammenlignet med tekst.
At sammenligne bithastigheder for tekst versus videostreaming viser også forskellen:
- 4K videostreaming kræver 15-25 Mbps sammenlignet med 1-5 Kbps for tekstbeskeder (sms, messaging, mv.)
Informationstætheden er altså markant forskellig for de forskellige datatyper. "Et billede siger tusind ord", som man siger, og det samme gælder for andre visuelle eller auditive medier.
Hvorfor er dette vigtigt for virksomheder?
Når I vurderer hvilken type data, I skal benytte i jeres AI-løsning - enten som baggrundsmateriale til når I chatter med jeres AI, eller som træningsdata i modellerne - bør I overveje følgende:
AI-træning: Modeller trænet på forskellige datatyper har forskellige styrker. En model trænet primært på tekst vil være god til fx tekstanalyse. Video kombinerer visuel med lyd og nogle gange tekster. Derfor kan modeller trænet på video være bedre til at forstå komplekse scenarier eller emotionelle nuancer.
Ressourceforbrug: At træne modeller på videodata kræver væsentligt mere computerkraft og lagerplads end tekstbaserede modeller. Dette påvirker både omkostninger og skalerbarhed.
Kundeindsigt: Tekstdata er en traditionel kommunikationsform i mellem virksomheder og deres kunder, og giver et vist indsigt i kundens behov og sindstilstand. Videodata kan give dybere indsigt i kundeadfærd og præferencer, men er også mere komplekst at opsamle og analysere.
Produktudvikling: Forståelse af forskellige datatypers styrker kan guide produktudvikling. For eksempel kan integration af video- eller billedbaserede funktioner give konkurrencefordele ud fra hvordan ens kunder foretrækker at kommunikere. Tekst, video og lydoptagelser kan også give forskellige niveauer af kundeforståelse og derved informere ens produktudvikling.
Kommunikationsstrategi: Virksomheder bør overveje, hvilke kommunikationsformer der giver mest værdi. Er det lange artikler, LinkedIn opslag med emojis, eller måske video? Ud fra det, kan man vælge AI-løsninger, der er målrettet de behov.
Hvad AI-giganterne gør som bør inspirere din virksomhed
AI-giganter som OpenAI, Google og andre investerer kraftigt i at træne modeller på multimodale data, dvs. kombinationer af tekst, billeder, lyd og video. Dette peger på at træningsdata, der indeholder forskellige kommunikationsformer, er vigtigt for at modellen kan forstå og generere bedre indhold på tværs af alle medietyper.
For virksomheder betyder det, at man med fordel kan tage følgende actions:
Datadiversificering: Overvej at indsamle og lagre data i forskellige formater. Selv hvis du ikke kan udnytte videodata fuldt ud i dag, kan det blive uvurderligt i fremtiden. Teknologien udvikler sig konstant.
Investeringer i infrastruktur: Forbered din IT-infrastruktur på at håndtere større og mere diverse datasæt.
Datakvalitet: Uanset om dataen kommer fra tekst, video eller lyd, har kvaliteten en betydning for hvor nyttig den er i AI-løsninger og modeller. F.eks måtte denne danske virksomhed omskrive en lang række supportartikler pga af deres ringe tilstand. Det hjalp både deres AI-løsning, men også deres kunder. Læs mere om hvad virksomheden gjorde hér.
Kompetenceudvikling: Opbyg et team med AI-kompetencer, heurnder forståelse af forskellige datatyper. Hent inspiration, fra hvordan andre virksomheder har grebet det an, i vores samling af AI use cases.
Etiske og regulatoriske overvejelser: Med rigere datasæt følger også større ansvar. Vær opmærksom på lovmæssige, privatlivs- og etiske implikationer af at indsamle og analysere multimodale data. Du kan blive klogere på samspillet i mellem data, AI Act og GPDR i vores juridiske AI værktøjskasse.
Konklusion
Vurderingen af forskellige kommunikationsformer, for eksempel emojis, er en påmindelse om den bredere diskussion om data og kommunikation i AI-æraen.
Som medarbejdere og virksomhedsledere står vi over for en spændende fremtid, hvor forståelsen af forskellige datatyper og deres indvirkning på AI-modeller kan være forskellen på succes og fiasko.
Så næste gang du ser en emoji i en forretningssammenhæng, tænk på den som et lille, men kraftfuldt datapunkt i den store AI-revolution. 😉