Skip to Main Content
It looks like you're using Internet Explorer 11 or older. This website works best with modern browsers such as the latest versions of Chrome, Firefox, Safari, and Edge. If you continue with this browser, you may see unexpected results.

Datamanagement voor studenten: Do's en Don'ts van onderzoeksdata

Research Data Management (RDM) voor studenten van de Radboud Universiteit

Inhoudsopgave

Op deze pagina kan je informatie vinden over de volgende onderwerpen die gerelateerd zijn aan de DO'S en DON'TS van onderzoeksdata:

Wat is onderzoeksdata?

De definitie van onderzoeksdata is erg breed. Alle digitale en niet-digitale informatie die wordt gegenereerd als onderdeel van het wetenschappelijke proces en waarop wetenschappelijke conclusies zijn gebaseerd, geld als onderzoeksgegevens. Denk hierbij aan metingen, spraak- en video-opnames, vragenlijsten, Excelsheets met observaties, SPSS-bestanden, maar ook grafieken en aantekeningen die je maakt.

Werken met persoonsgegevens

Persoonsgegevens moeten worden beschermd, veilig worden opgeslagen en mogen niet openbaar worden gedeeld.[1]

Persoonsgegevens zijn alle gegevens die betrekking hebben op een geïdentificeerd of identificeerbaar levend persoon. Persoonsgegevens zijn dus:

  • alle informatie die een persoon direct identificeert (bijvoorbeeld iemands naam)
  • alle informatie die tot een persoon te herleiden is wanneer dit gecombineerd wordt met andere gegevens

Dus wanneer de identiteit van een persoon bekend is of wanneer de identiteit kan worden afgeleid, wordt alle informatie die je over deze persoon hebt als persoonsgegevens beschouwd. Om het botter te zeggen: als een persoon identificeerbaar is, wordt het geslacht van deze persoon net zo goed als persoonsgegevens beschouwd als de informatie over hun favoriete soort pizza.

Zoals hierboven vermeld, zijn er bepaalde soorten data die een persoon direct kunnen identificeren en dus altijd als persoonsgegevens worden beschouwd, bijvoorbeeld: namen, verjaardagen, adressen, postcodes, telefoonnummers, e-mailadressen en IP-adressen. Dit soort data worden vaak verzameld voor administratieve doeleinden. Andere soorten van dergelijke directe identificatiegegevens zijn foto's, video-opnamen en audio-opnamen; deze worden dus ook beschouwd als persoonsgegevens.

Data die niet direct een persoon identificeren, maar in combinatie met andere informatie tot een persoon herleidbaar zijn, worden ook beschouwd als persoonsgegevens. Wanneer je weet dat iemand een vrouw is, is dat bijvoorbeeld niet voldoende om de ​​persoon te identificeren. Echter, wanneer je weet dat iemand een vrouw is met daarbij de informatie dat deze persoon de kanselier van Duitsland was, kom je al snel uit bij Angela Merkel. Dus wanneer een combinatie van informatie in je dataset kan worden gebruikt om een ​​persoon (indirect) te identificeren, dan wordt je hele dataset als persoonsgegevens beschouwd en moet daarnaar worden gehandeld.

Je moet bijzonder voorzichtig zijn bij het verzamelen van zogenaamde bijzondere categorieën persoonsgegevens, zoals gezondheidsgegevens, politieke opvattingen, religieuze overtuigingen, iemands seksuele geaardheid enz.[2] Deze gegevens kunnen worden gebruikt om personen te discrimineren en mogen daarom alleen worden verzameld wanneer dit absoluut noodzakelijk is. Vraag de ethische commissie binnen je faculteit om goedkeuring wanneer je speciale categorieën persoonsgegevens wilt verzamelen.

Samenvattend, wanneer een persoon kan worden geïdentificeerd, wordt alle informatie die betrekking heeft op deze persoon als persoonsgegevens beschouwd. Identificatie kan gebeuren door middel van direct identificeerbare data of indirect door een combinatie van gegevens. Persoonsgegevens moeten zorgvuldig worden behandeld door ze goed te beschermen, veilig op te slaan en niet met anderen te delen. Bij het verzamelen van bijzondere categorieën persoonsgegevens gelden nog strengere regels.

DO'S

  • Verwijder persoonsgegevens zo snel mogelijk wanneer deze alleen voor administratieve doeleinden worden verzameld en niet nodig zijn om je onderzoeksvraag te beantwoorden (bijvoorbeeld e-mailadressen).
  • Anonimiseer data waar mogelijk door mogelijk identificerende informatie te verwijderen. Data anonimiseren betekent dat het voor niemand (ook niet voor jezelf) mogelijk is om de data te herleiden tot een individu. Anonieme data worden niet meer als persoonsgegevens beschouwd en kunnen doorgaans eenvoudiger worden gedeeld.
  • Je kan je data ook pseudonimiseren wanneer anonimiseren niet mogelijk is (bijvoorbeeld bij het uitvoeren van een longitudinaal onderzoek). Pseudonimiseren van gegevens houdt in dat identificerende variabelen worden vervangen door pseudoniemen. In je databestand worden deelnemers dan bijvoorbeeld pp01, pp02 etc. genoemd en daarnaast heb je een sleutelbestand waarin staat dat pp01 Jaap Smit is. Gepseudonimiseerde data worden nog steeds als persoonsgegevens beschouwd.
  • Bewaar persoonsgegevens veilig. Zie Veilige opslag hieronder voor meer informatie.

DON’TS

  • Verzamel niet meer persoonsgegevens dan strikt noodzakelijk. Als het bijvoorbeeld voldoende is om de leeftijd van je deelnemers te kennen om je onderzoeksvraag te beantwoorden, vraag dan niet naar hun geboortedatum.
  • Deel persoonsgegevens met niemand tenzij dit absoluut noodzakelijk is (bijvoorbeeld met je begeleider).

Voor meer informatie over privacy en security klik hier

[1] Het delen van persoonsgegevens is alleen mogelijk wanneer deelnemers hiervoor expliciet geïnformeerde toestemming hebben gegeven (informed consent). Dit mag alleen wanneer het absoluut noodzakelijk is en moet worden goedgekeurd door de ethische commissie van je faculteit.

[2] Zie hier voor meer informatie.

Veilige opslag

Veilige opslag is belangrijk, of je nu met persoonsgegevens werkt of niet, want het voorkomt dataverlies en datalekken.

DO'S

  • Je kunt je begeleider vragen om een ​​werkgroepmap voor je aan te maken. [3]  Een werkgroepmap is een map op het universitaire netwerk. Dit betekent dat de inhoud van de map is beveiligd. Bovendien wordt er dagelijks een back-up gemaakt van deze mappen. Deze dagelijkse back-ups worden 60 dagen bewaard. Daarnaast worden er elk uur back-ups gemaakt die zeven dagen worden bewaard. Deze back-ups kan je zelf terughalen wanneer je een bestand kwijtraakt (meer informatie vindt je hier). Je hebt toegang tot je werkgroepmap als je inlogt op universiteitscomputers. Je begeleider heeft ook toegang tot deze map.
  • Installeer eduVPN en RU connect op je eigen computer. Hiermee kun je de werkgroepmap openen en erin werken als je buiten de campus werkt en je eigen computer gebruikt.
  • Gebruik SURFfilesender om grote bestanden op een veilige manier te versturen. Als het absoluut noodzakelijk is om persoonsgegevens te delen via SURFfilesender, schakel dan bestandsversleuteling (File Encryption) in. (Ook hier geldt dat het delen van persoonsgegevens in het algemeen moet worden vermeden. Indien nodig, hebben werkgroepmappen de voorkeur om persoonsgegevens te delen (met bijvoorbeeld begeleiders). Gebruik SURFfilesender alleen voor persoonsgegevens als de werkgroepmappen zeker geen optie zijn.).

Graphical user interface, text, application

Description automatically generated

  • Als je niet in de werkgroepmap kunt werken (je verzamelt bijvoorbeeld data in het veld en hebt mogelijk geen internetverbinding), gebruik dan een versleuteld apparaat. Verplaats de data zo snel mogelijk naar een werkgroepmap en verwijder de data op het versleutelde apparaat. Je kunt je computer of USB-stick zelf versleutelen of je kan dit voor je laten doen bij de ICT Helpdesk in de Universiteitsbibliotheek. Je kunt hier meer informatie vinden.
  • Beperk de tijd dat data buiten een werkgroepmap worden opgeslagen zoveel mogelijk.

DON’TS

  • Gebruik Google Drive, WeTransfer, Dropbox enz. nooit om persoonsgegevens op te slaan of te verzenden.
  • Vermijd ook het gebruik van Google Drive, WeTransfer, Dropbox enz. voor niet-persoonlijke gegevens, omdat deze  plaatsen als minder veilig worden beschouwd.

Voor meer informatie over veilige opslag klik hier (ICT)

[3] Dit kan worden gedaan in het account portal. Je begeleider moet dan de volgende optie kiezen “Workgroup folder (with students): folder request” (“Aanvraag Werkgroepmap met studenten”)

Data archiveren voor wetenschappelijke integriteit

Na afronding van je onderzoeksproject is het belangrijk om je data te archiveren in het kader van de wetenschappelijke integriteit. Door je data te archiveren, zijn ze controleerbaar voor anderen (bijvoorbeeld voor je begeleider of tijdens audits). Deze datasets worden niet openbaar gemaakt of gedeeld met andere onderzoekers, maar zijn alleen toegankelijk voor mensen zoals je begeleider.

Wat moet je archiveren?

Archiveer alle data die relevant en noodzakelijk zijn voor een buitenstaander om je analyse en conclusies te kunnen reproduceren. Als je twijfelt over wat je moet archiveren, bespreek dit dan met je begeleider.

Het is een goede gewoonte om documentatie toe te voegen aan je data. Deze documentatie beschrijft je data en zorgt ervoor dat je dataset over een paar jaar nog steeds begrijpelijk is. De bestanden die idealiter in een dataset moeten worden opgenomen, zijn:

  • Een leesmij-bestand (readme): dit is een bestand dat enige context biedt voor de dataset. Het vermeldt ook de bestanden die je hebt geüpload bij naam en beschrijft kort de inhoud van elk bestand. Een voorbeeld van een leesmij-bestand vindt je in de appendix onderaan deze pagina.
  • Alle relevante bestanden: dit kunnen onbewerkte bestanden zijn (inclusief spraak- en video-opnamen), transcripties, annotaties, vragenlijsten, bestanden om het experiment uit te voeren, een Qualtrics-export (bijv. qsf), stimuli, bewerkte data (bijv. opgeschoonde gegevens), geanalyseerde data (bijv. SPSS- of R-bestanden), ethische goedkeuring enz.
  • Een codeboek waarin je de variabelen in je onderzoek beschrijft en een methodologiebestand kunnen ook nuttige toevoegingen zijn.

Zoals hierboven beschreven, moeten persoonsgegevens die je niet nodig had voor je conclusies zo snel mogelijk worden verwijderd en niet worden gearchiveerd om de privacy van je deelnemers te beschermen

Archiveren in RIS for students

NB: Archiveren in RIS for students is nog niet voor alle studenten mogelijk. Van studenten Communicatie- en Informatiewetenschappen en International Business Communication van de Faculteit der Letteren wordt verwacht dat zij hun datasets archiveren in RIS for students. Op deze website vind je hier een handleiding voor. Andere studenten wordt aangeraden hun data te archiveren in een werkgroepmap.

Archiveren in een werkgroepmap

Het is ook mogelijk om je data te archiveren in een werkgroepmap waar je begeleider ook toegang tot heeft.

Data delen voor openbaar hergebruik

Het is ook mogelijk om je data openbaar te delen, bijvoorbeeld in het DANS EASY archief. Hierdoor kunnen andere onderzoekers je data hergebruiken voor hun eigen doeleinden. Houd er rekening mee dat het openbaar delen van data geen standaardprocedure is voor studentenprojecten en meestal niet vereist is. Als je onderzoek echter wordt gepubliceerd en/of je begeleider en jij denken dat je data waardevol kunnen zijn voor hergebruik, dan zijn er verschillende opties die je kunt verkennen. Praat met je begeleider over je mogelijkheden.

DO'S

  • Vraag je begeleider of hij/zij het een goed idee vindt om je data openbaar te delen.
  • Vraag je begeleider welke data je kan delen.
  • Vraag je begeleider naar een geschikt archief in jouw vakgebied.

DON’TS

  • Deel persoonsgegevens niet openbaar. Een dataset die je deelt voor hergebruik mag geen persoonsgegevens bevatten (tenzij dit vereist is voor een tijdschriftpublicatie en je specifieke toestemming hebt gekregen van deelnemers om dit te doen en als je lokale ethische commissie dit heeft goedgekeurd). Dus een dataset die je openbaar deelt zal vaak anders zijn dan een dataset die je voor wetenschappelijke integriteit hebt gearchiveerd. Voor wetenschappelijke integriteit moet je bijvoorbeeld meestal ruwe data archiveren. Vaak mag je deze gegevens echter niet openbaar delen. Bij het verzamelen van bijvoorbeeld geluidsopnamen van deelnemers archiveer je deze voor de wetenschappelijke integriteit. Dat kan omdat buitenstaanders geen toegang hebben tot deze gegevens. Als je je gegevens echter openbaar wilt delen voor hergebruik, dan mag je deze audio-opnamen meestal niet delen, omdat dit persoonsgegevens zijn.

Appendix: Voorbeeld leesmij bestand (readme)

Dataset title: Good arguments or a charming narrator? Exploring a text’s persuasiveness through eye-tracking

Student:                            Sanne Huisman (s123456)
First supervisor:               dr. Lisa Begeleider

Second reader:                dr. Ton Lezer

Short summary

This dataset contains all relevant data files for the thesis Good arguments or a charming narrator? Exploring a text’s persuasiveness through eye-tracking, written by Sanne Huisman to obtain the degree of Bachelor of Arts and conclude the bachelor’s programme International Business Communication at Radboud University. This research was conducted at the CLS Lab in the spring of 2019 and supervised by dr. Lisa Begeleider and dr. Ton Lezer.

The goal of this thesis was to explore the persuasiveness of a text as a function of the quality of the presented arguments as well as the likability of the person making these arguments. While persuasiveness is often measured with questionnaires, we explored whether persuasiveness is also reflected in eye movements. A total of 78 participants took part in this study.

Dataset structure

This dataset contains a total of 8 files as well as two zip folders:

  • README.txt:
    That is this very readme file.
  • Rawdata_eyetracking.zip:
    This zip folder contains the raw eye-tracking data of 78 participants. The data was collected using an EyeLink 1000+ eye-tracker. The folder structure of the raw output is unchanged.
  • Experiment.zip:
    This zip folder contains all files necessary to run the experiment using the experiment software Experiment Builder as installed in the CLS Lab.
  • Participant_overview.xlxs:
    This Excel file contains a pseudonymized overview of all participants. It includes the participant id (001, 002 etc), gender and age of each participant.
  • Persuasiveness_questionnaire_empty.doc:
    This file contains an empty version of the questionnaire by McCroskey and Teven (1999) which was used to measure the persuasiveness.
  • Persuasiveness_results.xlsx:
    This file contains the results of all 78 participants on McCroskey and Teven’s (1999) questionnaire.
  • Eyedata_clean.txt:
    This text file contains all the pre-processed and cleaned up eye-tracking data. The variable names are chosen in such a way that they are self-explanatory.
  • data_analysis_anova.sav:
    This file contains all the eye-tracking and questionnaire data as it was analysed in SPSS
  • analysis_anova.sps:
    This SPSS syntax file contains the full analysis.
  • Thesis_HuismanS_2019.pdf:
    This is the thesis which was written based on these data. It includes a detailed methodology section.

References

McCroskey, J. C., & Teven, J. J. (1999). Goodwill: A reexamination of the construct and its measurement. Communications Monographs, 66(1), 90-103. doi: https://doi.org/10.1080/03637759909376464