Den Generelle Databeskyttelsesforordning (GDPR) er en lovgivning, der er vedtaget af EU med det formål at beskytte borgernes personlige data og privatliv. GDPR har væsentlige implikationer for kunstig intelligens, da KI-systemer ofte trænes på og behandler store mængder af persondata. Under GDPR er det obligatorisk for organisationer at indsamle informeret samtykke fra individer, inden deres data anvendes. Dette gælder også for indsamling af data til træning og drift af KI-systemer. Udfordringen ved denne type af informeret samtykke er dog, at det ofte gemmer sig langt nede i en juridisk tekst, som stort set ingen mennesker læser, men blot accepterer ved en evt. brugeroprettelse.
Retningslinjerne for input til KI-systemer under GDPR bør derfor ikke blot overholde de generelle databeskyttelsesprincipper, men også tage højde for de specifikke etiske og tekniske udfordringer, der er forbundet med KI. Det inkluderer spørgsmål om datas kvalitet, integritet, og repræsentativitet, som alle har indflydelse på systemets endelige præstation og anvendelse.
Baseret på de eksisterende love og regler anses ChatGPT og lign. teknologier ikke for ulovlige i Danmark. Det er dog afgørende at følge GDPR-retningslinjerne også når man bruger chatbots. Det er generelt usikkert i hvilket omfang, at de enkelte udgivere efterlever/understøtter databeskyttelsesforordningen, og hvordan de “prompts” man lægger ind, og de svar man modtager indgår i den videre behandling.
KI trænes med input fra brugere af systemerne. Derfor er du fx med til at træne Googles billedgenkendelsessoftware, når du markerer alle lyskryds på et billede for at dokumentere, at du ikke er en robot, som mange har mødt i forbindelse med oprettelse el. login på diverse online tjenester. På samme måde har producenter af generative KI-tjenester ofte lov til at bruge din input/interaktion med sprogmodeller til træning og forbedring af deres teknologi – særligt når den stilles gratis til rådighed.
Som medarbejder og studerende skal man således være varsom med, hvilke data man indtaster i KI-teknologier som ChatGPT. Mange af de gratis tjenester logger og opbevarer nemlig brugernes interaktioner. Det er problematisk fordi de data kan bruges til at træne fremtidige chatbots, som potentielt vil kunne reproducere de personoplysninger under fremtidige brugerinteraktioner. Data lagres desuden ofte i datacentre uden for EU, hvilket potentielt kan være i strid med GDPR. Brug derfor aldrig personoplysninger som input i generativ KI – og så kan du læse mere om UC SYDs principper og retningslinjer for brug af KI her.
På Europæisk plan er der en EU AI-forordning på vej, der, sammen med GDPR-regulativet, kan få betydning for, hvordan den danske uddannelsesverden kan inkorporere teknologierne. Forordningen er lavet som et risikobaseret system med fire niveauer fra uacceptabel til minimal risiko, illustreret herunder. På VIDEN.AI, kan du læse mere om sagen.
Det er endnu uklart om værktøjer som ChatGPT og lignende vil kunne overholde de krav, som AI-forordningen vil udstikke.
Samtidig er det tankevækkende, at det ikke er officielle statslige forskningsinstitutioner, der er førende inden for dette forskningsfelt, men teknologimastodonter som Meta (Facebook), Alphabet (Google), Microsoft, IBM, OpenAI m.m., der besidder en guldgrube af data om alle deres brugere. Teknologigiganterne har det ”råstof”, som er grundlaget for udvikling af nye typer kunstige intelligenser, idet særligt fire faktorer angives som værende afgørende:
- Datalagerkapacitet
- Datatilgængelighed
- Regnekraft
- Forbedrede algoritmer og udvikling indenfor AI.
For uddannelsesinstitutioner kan det potentielt være problematisk ikke at have øje for disse virksomheders kommercielle perspektiver, når teknologien integreres og anvendes (se bl.a. dette indlæg af Mikala Hansbøl) og samtidig angives ChatGPT at promovere stereotype amerikanske normer og værdier.
