Hoofdmenu openen

Datareductie of gegevensvermindering is de aanpassing van cijfers of teksten en andere digitale informatie naar een gecorrigeerde, geordende en vereenvoudigde vorm. Het basisconcept is het reduceren van grote hoeveelheden data tot de betekenisvolle delen.

Wanneer informatie wordt afgeleid van instrumentaflezingen, kan er ook een transformatie van analoge naar digitale vorm zijn. Wanneer de gegevens al in digitale vorm zijn, heeft de 'reductie' van de gegevens meestal betrekking op het bewerken, schalen, coderen, sorteren, vergelijken en produceren van samenvattingen in tabelvorm. Wanneer de waarnemingen discreet zijn maar het onderliggende fenomeen continu is, zijn afvlakking en interpolatie vaak nodig. Vaak wordt de gegevensvermindering uitgevoerd in de aanwezigheid van lees- of meetfouten. Er is een idee van de aard van deze fouten nodig voordat de meest waarschijnlijke waarde kan worden bepaald.

Een voorbeeld in de astronomie is de datareductie in de Kepler-satelliet. Deze satelliet maakt eens in de zes seconden een 95-megapixel foto en genereert tientallen megabytes aan gegevens per seconde, wat een orde van grootte is die hoger is dan de downlink-bandbreedte van 4400 kbit/s. De ingebouwde datareductie omvat de mede-toevoeging van de onbewerkte frames gedurende dertig minuten, waardoor de bandbreedte met een factor 300 wordt verminderd. Bovendien worden interessante doelen vooraf geselecteerd en worden alleen de relevante pixels verwerkt, wat 6% van het totaal is. Deze gereduceerde gegevens worden vervolgens naar de aarde verzonden waar ze verder worden verwerkt.

Er is ook onderzoek gedaan naar het gebruik van datareductie in draagbare (draadloze) apparaten voor gezondheidsmonitoring en diagnosetoepassingen. In de context van de diagnose van epilepsie bijvoorbeeld, is de gegevensreductie gebruikt om de levensduur van de batterij van een draagbaar EEG-apparaat te verhogen door EEG-gegevens te selecteren die alleen relevant zijn voor de diagnose en de achtergrondactiviteit te negeren.[1]

Beste werkwijzenBewerken

Dit zijn veelgebruikte technieken om gegevens te reduceren.

  • Rangschik op een bepaald aspect van grootte.
  • Tabeldiagonalisatie, waarbij rijen en kolommen met tabellen opnieuw worden gerangschikt om patronen gemakkelijker zichtbaar te maken.
  • Rond drastisch af op één, of maximaal twee, effectieve cijfers.
  • Gebruik gemiddelde waarden om een visuele focus te geven, evenals een samenvatting.
  • Gebruik lay-out en etikettering om het oog te begeleiden.
  • Verwijder kaartvervuiling, zoals afbeeldingen en lijnen.
  • Geef een korte verbale samenvatting.[2]

Zie ookBewerken