ChatGPT blijft een veelbesproken onderwerp in de wereld van AI. Er zijn steeds meer organisaties die de chatbot omarmen en het lijkt erop dat het vele voordelen heeft. Maar de groei in populariteit brengt ook meer vragen over Data Privacy met zich mee.
Statista heeft onderzoek gedaan naar de zorgen over ChatGPT in vier Zuidoost-Aziatische landen. Volgens deze studie had ongeveer de helft van de deelnemers zorgen over chatbots, zoals ChatGPT, omdat het persoonlijke data verzamelt. Daarnaast had 42% van de deelnemers ethische zorgen gerelateerd aan data privacy en intellectueel eigendom.
ChatGPT is nog steeds relatief nieuw. Veel mensen hebben vragen over privacy en de veiligheid van hun data. Deze vragen spelen misschien ook bij jou? Het is in ieder geval zeer verstandig om na te denken over privacy en veiligheid. In dit blog vind je antwoorden op al jouw vragen omtrent Data Privacy en ChatGPT.
Wat is ChatGPT?
ChatGPT is een Large Language Model (LLM) ontwikkeld door OpenAI. Het genereert teksten op basis van jouw input. Een LLM moet getraind worden om beter te presteren. Het leert van de input die je het geeft en van de output die het zelf genereert. Met andere woorden, het leert van de vragen én de antwoorden. Het huidige LLM van ChatGPT is GPT4.
Slaat ChatGPT mijn data op, zo ja, waarom?
Hier kunnen we kort over zijn, het antwoord is ja. Jouw vragen, chatgesprekken en account details worden opgeslagen. Onder account details valt informatie zoals jouw naam, email, IP-adres en locatie. Het is niet ongebruikelijk voor online platformen om deze data op te slaan, de meeste websites doen dit voor statistieken. Maar voor ChatGPT gaat het niet alleen om statistieken, er is meer.
AI training
De primaire reden voor het opslaan van jouw data is niet voor analyse, maar voor het trainen van het taalmodel (LLM). ChatGPT is een AI model, dit betekent dat het leert van eerdere ervaringen. Het gebruikt gesprekken uit het verleden om zichzelf te verbeteren en de taken nog beter uit te voeren.
Met 100 miljoen wekelijkse gebruikers ontvangt ChatGPT een heleboel data. Al die data gebruikt ChatGPT weer om meer kennis toe te voegen aan zijn omvangrijke basis van kennis.
Vóór de lancering van ChatGPT, en het verzamelen van data, was de kennisbasis al zeer uitgebreid. ChatGPT was toen voornamelijk getraind op publiek beschikbare informatie van platforms zoals forums, blogs en social media. En nu gebruiken ze dus ook jouw data om het model te trainen.
Hallucinaties
OpenAI verzamelt jouw data ook om hallucinaties te voorkomen. Sommige AI-modellen kunnen soms hallucineren. Dit betekent dat het model geen antwoord heeft op jouw vraag maar toch een antwoord geeft. Zo laat het jou geloven dat het antwoord waarheid is. Dit zorgt voor desinformatie, omdat het zelf het juiste antwoord niet weet. Door het model te trainen probeert OpenAI het risico op hallucinaties te verkleinen.
Preventie
Een andere reden voor het opslaan van jouw data is om toezicht te houden. OpenAI doet dit om misbruik en creatie van schadelijke content te voorkomen. Door de data te controleren en fouten te analyseren wordt de chatbot een stuk gebruiksvriendelijker.
Waarom is Data Privacy een zorg bij het gebruik van ChatGPT?
Zorgen over data privacy zijn een alledaags onderwerp. Vooral met de steeds groeiende ontwikkeling van nieuwe technologieën. Het is verstandig om je vraagtekens te zetten bij bedrijven die jouw data gebruiken. En het feit dat ChatGPT jouw data opslaat kan nog meer vragen opleveren.
Simpel gezegd wordt de informatie die jij in ChatGPT zet gebruikt om het model te trainen. Dit betekent dat het gebruikt kan worden voor antwoord op een vraag van iemand anders. Als jij hier zorgen over hebt, dan kan je het trainen met jouw data uitzetten. Later in dit blog lees je hoe je dit doet.
Het uitzetten van deze training kan je zorgen wegnemen, maar er zijn nog steeds bepaalde regels in de privacywereld. Denk aan de AVG, en de vraag is: leeft ChatGPT deze regels na?
AVG in Europa
De belangrijkste regelgeving omtrent privacy is de AVG, de Algemene Verordening Gegevensbescherming van de EU. Door deze wet houden natuurlijke personen controle over hun eigen data. Daarnaast beschermt het jouw data ook tegen misbruik door kwaadwillende organisaties.
Een essentieel onderdeel van de AVG is het ‘recht op vergetelheid’, dit betekent dat je een organisatie kan vragen om jouw persoonlijke informatie te verwijderen. En hier lijkt ChatGPT tekort te schieten.
Het is een aanzienlijke opgave om iemands persoonlijke informatie te verwijderen. Vooral als je model erop getraind is, zoals bij ChatGPT. Het is heel moeilijk om te achterhalen welke data je moet verwijderen en waar je het kan vinden.
Belangrijk om te weten is dat een AI-systeem niet kan ‘vergeten’ zoals mensen. Het kan wel het ‘gewicht’ van de data veranderen. In het kort betekent dit dat het niet je data kan verwijderen, maar wel kan kiezen om het niet te gebruiken.
OpenAI heeft moeite om zich aan de AVG te houden. Het bedrijf werd al een keer beschuldigd van datalekken door een man uit Polen. Daarnaast had Italië de chatbot voor een maand verbannen vanwege de data kwestie. Er is dus werk aan de winkel voor OpenAI.
Veiligheid van data bij OpenAI
Naast privacy is het ook verstandig om je af te vragen wat er met jouw gevoelige informatie gebeurt omtrent beveiliging. Gelukkig heeft OpenAI enkele maatregelen om jouw data te beschermen.
- Beperkt delen van data; Jouw data kan alleen bekeken worden door geautoriseerd personeel of vertrouwde externe dienstverleners voor controle doeleinden. OpenAI verklaart dat de dienstverleners zich moeten houden aan ‘strenge geheimhoudings- en beveiligingsverplichtingen’. Jouw data zal niet gedeeld worden met derden voor marketingdoeleinden.
- Veilige opslag van data; Jouw data wordt opgeslagen op de systemen van OpenAI en, waar nodig, op de servers van de dienstverleners.
- Bug Bounty Programma; OpenAI nodigt iedereen uit om zwakheden, bugs of andere beveiligingsgebreken in het systeem te rapporteren. Als jij een defect in de beveiliging vindt dan kun je een beloning krijgen via het Bug Bountry Programma van OpenAI.
- End-to-end encryption; Alle gesprekken met ChatGPT zijn end-to-end versleuteld. Dit verzekert OpenAI dat jouw berichten beschermd zijn tegen onderscheppingen van derden én dat ze alleen zichtbaar zijn voor de bedoelde ontvanger.
ChatGPT doet zijn best om jouw zorgen te verkleinen. Maar als jij nog een stap verder wil gaan dan kun je ook zelf de regie in handen nemen.
Hoe maak je ChatGPT meer privacyvriendelijk?
OpenAI weet zelf ook wel dat mensen twijfels hebben over de data privacy van ChatGPT. Om die twijfels weg te nemen, heeft OpenAI het mogelijk gemaakt om je eigen maatregelen te nemen.
Zet Data Training in ChatGPT uit met Data Controls
Jouw data wordt gebruikt om het model achter ChatGPT te trainen. Wil je dit niet, dan kun je je hiervoor afmelden. Elke gebruiker kan zich uitschrijven met de volgende stappen:
- Log in op ChatGPT
- Klik op je naam linksonderin.
- Klik op ‘Settings & Beta’.
- Klik op ‘Data Controls’.
- Zet ‘Chat history & training’ uit.
- ChatGPT zal automatisch een nieuwe chat starten
- Je kan nu chatten zonder het model te trainen en jouw vragen (prompts) worden niet meer opgeslagen in de ChatGPT geschiedenis aan de linkerkant.
Opmerking: OpenAI zal nog steeds jouw data opslaan, bekijken en controleren om misbruik te detecteren (maximaal 30 dagen).
Dien een Privacy Aanvraag in bij OpenAI om je organisatie af te melden
Naast het uitzetten van data training voor jouw eigen account kun je hier ook een privacy aanvraag indienen voor jouw hele organisatie. Als je een aanvraag hebt over data training of data verwijderen, klik dan op ‘Make a Privacy Request’ rechtsboven. De rest van de aanvraag is vanzelfsprekend.
Als je een andere privacy aanvraag hebt dan kan je een mail sturen naar het emailadres op de pagina.
Switch naar ChatGPT Enterprise
Een andere optie is het switchen van ChatGPT (Plus) naar het ChatGPT Enterprise abonnement. Met dit abonnement heb je zelf controle over jouw zakelijke data.
Dit abonnement heeft een aantal voordelen:
- Jij bezit en beheert je eigen data
- Je data wordt niet gebruikt om ChatGPT te trainen
- Jij beheert je inputs én outputs
- Jij bepaalt hoe lang je data wordt opgeslagen
- Jij bepaalt wie er toegang heeft
- Jij krijgt authenticatie voor ondernemingen met SAML SSO
- Jij hebt controle over toegang en beschikbare functies
- Jouw op maat gemaakte modellen worden niet gedeeld en zijn alleen beschikbaar voor jou
- OpenAI doet grondige inspanningen omtrent databeveiliging
- OpenAI is geauditeerd voor SOC 2 Compliance
- OpenAI verzekert data versleuteling met AES-256 en TLS 1.2+
- OpenAI heeft een Trust Portal waar je meer informatie kan vinden over de maatregelen omtrent beveiliging.
Opmerking: OpenAI zal nog steeds jouw data opslaan, bekijken en controleren om misbruik te detecteren (maximaal 30 dagen).
Gebruik de OpenAI API
De voordelen van het ChatGPT Enterprise abonnement gelden ook voor het OpenAI API platform. Maar in het kort, jouw data wordt niet gebruikt om het model te trainen en je data is uitgebreid beschermd.
Je kan de OpenAI API gebruiken om jouw applicatie te verbinden met het model achter ChatGPT. Je zou de API bijvoorbeeld kunnen gebruiken voor het maken of vertalen van teksten in je eigen omgeving.
Opmerking: OpenAI zal nog steeds jouw data opslaan, bekijken en controleren om misbruik te detecteren (maximaal 30 dagen).
Azure OpenAI Service
Microsoft biedt ook een service aan waar je je eigen AI applicaties kan maken met gebruik van de taalmodellen van OpenAI. Met de Azure OpenAI Service bouw je eenvoudig je eigen chatbot, content creator en meer.
Ook bij Azure zal de data niet gebruikt worden om ChatGPT te trainen. Microsoft beheert de service, dit betekent dat OpenAI geen toegang heeft tot de in- en outputs.
Maar, wel Azure heeft wel toegang tot jouw data. Microsoft beheert jouw data om misbruik en schadelijke content te voorkomen. Het slaat jouw prompts en gegenereerde output veilig op voor maximaal 30 dagen. Daarna zal Microsoft jouw data verwijderen van de servers.
Je kan ook een uitzondering aanvragen voor het toezicht op data. Je kan een aanvraag indienen waar je Microsoft vraagt om jouw data niet te gebruiken voor het detecteren van misbruik. Dit kan handig zijn voor organisaties die werken met gevoelige, vertrouwelijke of juridische gegevens, maar wel de Azure OpenAI Service willen gebruiken.
Een aantal extra tips
Het gebruiken van ChatGPT kun je vergelijken met het gebruik van een hamer. Het is een erg handig hulpmiddel, maar je moet er wel voorzichtig mee omgaan. Als je niet voorzichtig bent zal je jezelf of een ander benadelen.
ChatGPT heeft data nodig om beter te presteren en OpenAI doet zijn best om jouw data ten alle tijde te beschermen. Toch moet je voorzichtig zijn met het invoeren van gevoelige data in ChatGPT. Zelfs met strikte beveiligingsmaatregelen is ChatGPT, net als elke andere online dienst, niet immuun tegen potentiële data lekken.
Wanneer je werkt met gevoelige data houdt dan het volgende in gedachten:
- Gebruik een beveiligd WiFi-netwerk of een (bedrijfs) VPN. Dit zorgt ervoor dat jouw connectie altijd versleuteld is en dit beschermt jouw internetverkeer tegen onbevoegde partijen die stiekem meekijken.
- Denk twee keer na voordat je jouw data invoert. Vraag jezelf altijd af of het nodig is om de naam, organisatie of dat adres mee te geven. Stel je voor dat alles wat je invoert, kan eindigen in het publieke domein. Is dat het waard?
Wees extra voorzichtig bij het gebruik van ChatGPT plugins ontwikkeld door derden
ChatGPT plugins zijn erg handige hulpmiddelen die het gebruik van ChatGPT naar een hoger niveau kunnen tillen. Een plugin voegt mogelijkheden toe aan de beperkingen van ChatGPT.
Het is belangrijk om te weten dat de meeste plugins gemaakt zijn door derden. Dit betekent dat OpenAI niet alle ingevoerde data kan beschermen. Daarom moet je dus extra voorzichtig zijn bij het gebruik van plugins in ChatGPT.
Hulp nodig bij het gebruik van ChatGPT omtrent Data Privacy?
ChatGPT en Data Privacy zullen altijd een relevant onderwerp blijven voor organisaties. Dit blog bevat soms informatie wat lastig te begrijpen kan zijn. Dus mocht je nog vragen hebben over ChatGPT, dan kun je contact opnemen met DataNorth.
DataNorth biedt ChatGPT workshops aan om al jouw vragen over ChatGPT te beantwoorden. En als je graag wil weten waar je ChatGPT veilig kunt toepassen in jouw organisatie, dan kan DataNorth je helpen om de kansen te vinden met het ChatGPT Assessment.
Ben jij er klaar voor om jouw organisatie te verbeteren met ChatGPT? Neem contact met ons op!