Big data: verschil tussen versies

1.671 bytes toegevoegd ,  2 maanden geleden
voor- en nadelen
(voor- en nadelen)
Onder '''bigBig data''' wordenzijn [[Dataset|gegevensverzamelingen (datasets)]] verstaan die te groot en te weinig gestructureerd zijn om met reguliere [[Databasemanagementsysteem|databasemanagementsystemen]] onderhouden te worden onderhouden. De gegevens hebben een direct of indirect verband met [[Privacy|privégegevens]] van personen.
 
Big data spelen een steeds grotere rol. De hoeveelheid data die opgeslagen wordt, [[Exponentiële groei|groeit exponentieel]]. Dit komt doordat consumenten bij [[sociale media]] zelfin steedstoenemende meermate data opslaan in de vorm van bestanden, foto's en films (bijvoorbeeld op [[Facebook]] of [[YouTube]], waar Facebook ook de door de gebruikers gewiste data toch bewaart) en organisaties, overheden en bedrijven steeds meer data over burgers produceren en opslaan, maar ooken doordat steeds meer apparaten zelf data verzamelen, opslaan en uitwisselen (het zogenaamde [[internet der dingen]]). Hierdoor is er steeds meer [[sensor]]data beschikbaar. Niet alleen de opslag van deze hoeveelheden is een uitdaging., Ookmaar ook het analyseren van deze data speelt een steeds grotere rolervan. Deze data bevatten immers een schat aannamelijk informatie voor verschillende doeleinden, zoals [[marketing]], [[wetenschappelijk onderzoek]], of [[preventief onderhoud]].
 
== Definitie ==
De definitie van ''big data'' is niet altijd duidelijk en de term big data wordt vaaksoms ten onrechte gebruikt. Volgens [[Gartner]] gaat het om drie factoren:<ref>{{Citeer web|url=http://www.gartner.com/it-glossary/big-data/|titel=What Is Big Data? - Gartner IT Glossary - Big Data|bezochtdatum=2016-12-27|datum=2012-05-25|werk=Gartner IT Glossary|taal=en}}</ref>
* de ''hoeveelheid'' data;
* de ''snelheid'' waarmee de data binnenkomen en/of opgevraagd worden;
* de ''complexiteit'' van de data: de mate waarin ongestructureerde data van verschillende bronnen met elkaar te combineren zijn.
 
In het Engels worden deze eigenschappen vaak aangeduid als 'de v's', ''volume'', ''velocity'' en ''variety'' voor de eerste drie kenmerken en ''variability'' en ''veracity'' voor variatie en kwaliteit.<ref>{{Citeer web|url=https://www.impactradius.com/blog/7-vs-big-data/|titel=The 7 V’s of Big Data {{!}} Impact Radius|bezochtdatum=2017-01-12|datum=2016-04-07|werk=Impact Radius|taal=en}}</ref>
 
== Soorten gegevens ==
 
=== Primaire bronnen ===
Conform de [[Wet van Moore]] verdubbelt ongeveer elke twee jaar de rekencapaciteit en het opslagvermogen van microchips[[microchip]]s. Door deze exponentiële groei en het inzakken van de kosten, raakt technologie steeds verder verspreid en ingebed in onzede [[samenleving]]. In toenemende mate is de technologie uitgerust met sensoren die data vastleggen en/of doorgeven. Grote hoeveelheden gegevens worden gegenereerd door onder meer sensoren (zoals camera's en microfoons), trackers (zoals [[Radio-frequency identification|RFID]]-tags en [[Cookie (internet)|cookies]] op internet) en apparaten die we bij ons dragen of in huis hebben en op het [[Internet der dingen|internet of things]] zijn aangesloten (zoals mobiele telefoons, horloges, brillen, gehoorapparaten, pacemakers). Daarnaast leggen veel mensen gegevens over zichzelf vast op sociale media.
 
=== Secundaire bronnen ===
 
== Wettelijke kaders persoonsgegevens ==
De [[Algemene verordening gegevensbescherming]] (AVG) regelt de omgang met persoonsgegevens, en definieert de rechten van individuen en de plichten voor partijen die persoonsgegevens verwerken. De werking van de AVG is breed: zij is van toepassing op alle tot een persoon herleidbare gegevens en vormt een belangrijk uitgangspunt voor de verantwoorde omgang met persoonsgegevens.
 
onbekendheid met en onzekerheid over de toepassing en implicaties van wettelijke eisen hun parten speelt. Daarnaast worden sommige eisen als lastig en zelfs als onuitvoerbaar ervaren. Een verantwoorde verwerking van gegevens biedt alle partijen echter voordelen. Consumenten zullen eerder bereid zijn om gegevens te delen in het vertrouwen dat bedrijven zorgvuldig met hun gegevens omgaan en er mogelijkheden zijn tot controle en verantwoording. Bedrijven profiteren van het vertrouwen dat consumenten in hen stellen en kunnen daardoor datagedreven producten en diensten blijven ontwikkelen. Het maakt bovendien de bedrijfsvoering rond gegevens inzichtelijk en controleerbaar en ondervangt daarmee bepaalde risico’s zoals [[Datalek#Nederland|datalekken]]. De wetgeving, die soms wordt ervaren als een last, kan als een prikkel fungeren om op verantwoorde wijze met persoonsgegevens om te gaan en daarin nationaal en internationaal zelfs onderscheidend te zijn.<ref>[https://www.rijksoverheid.nl/documenten/rapporten/2016/10/04/licht-op-de-digitale-schaduw-verantwoord-innoveren-met-big-data Verantwoord innoveren met big data op rijksoverheid.nl]</ref>
 
Het gebruik van big data, het internet of things en [[kunstmatige intelligentie]] tast (mogelijk) de grondrechten in Nederland aan.<ref>[https://www.rijksoverheid.nl/documenten/rapporten/2018/03/01/algoritmes-en-grondrechten Algoritmes en grondrechten op rijksoverheid.nl]</ref>
 
== Voor- en nadelen ==
Het analyseren van big data wordt ingezet voor het bestrijden van criminaliteit (waaronder fraude), het reconstrueren van aanslagen en in kaart brengen van criminele netwerken om daders gemakkelijker op te sporen, het controleren van crisissituaties, en voor ''crowd control'' bij evenementen. Als voordeel geldt dat hierbij tijdwinst en efficiëntie wordt behaald en dat de gegevens in real time kunnen worden verwerkt. Politiemensen en veiligheidsfunctionarissen kunnen bijvoorbeeld snel een beeld krijgen van een situatie ter plaatse.
 
Als nadeel geldt de grootschalige inmenging in de persoonlijke levenssfeer - ook van niet-criminele burgers - waarbij privacy en vrije meningsuiting in gevaar zijn. Dit kan tot gevolg hebben dat de samenleving haar gedrag daarop aanpast. Verder worden burgers steeds transparanter terwijl de persoons- en organisatie-profielen, algoritmen en methoden die overheidsorganisaties gebruiken dit niet zijn. Big data-toepassingen kunnen leiden tot toename in [[sociale stratificatie]] waardoor er (grotere) ongelijke verhoudingen tussen maatschappelijke groepen ontstaan.
 
Big data-toepassingen kunnen andere doelen hebben dan waarvoor de data in beginsel voor waren verzameld (zogeheten ''function greep''), aangezien secundair gebruik van big data-toepassingen een meerwaarde zijn op van de verzamelde data.<ref>[https://www.wrr.nl/binaries/wrr/documenten/rapporten/2016/04/28/big-data-in-een-vrije-en-veilige-samenleving/Synopsis-R095-Big-Data-vrije-veilige-samenleving.pdf Synopsis WRR-rapport 95 ‘Big Data in een vrije en veilige samenleving’] (pdf), [[Wetenschappelijke raad voor het regeringsbeleid|WRR]], Den Haag, 2016, pag. 8. Geraadpleegd 17 november 2020.</ref>
 
== Zie ook ==
9.340

bewerkingen