Skip to Main Content

Datamanagement voor studenten: Opslag en archiveren

Research Data Management (RDM) voor studenten van de Radboud Universiteit

Opslag en archiveren

Het opslaan van data gaat over het veilig opstaan van onderzoeksdata terwijl je ermee werkt. Het archiveren van data gaat over het opslaan van data nadat je onderzoeksproject afgerond is vanwege wetenschappelijke integriteit. In sommige gevallen zal je de data willen delen om deze te kunnen hergebruiken nadat je project is afgerond. Dit laatste is niet gebruikelijk voor studenten, Wanneer dit wel van toepassing is op je data dan moet je dit in detail overleggen met je begeleider.

Veilige opslag en delen

Veilige opslag is belangrijk, of je nu met persoonsgegevens werkt of niet. Het voorkomt namelijk dataverlies en datalekken. Het delen van persoonsgegevens moet sowieso worden vermeden. Wanneer je opslaglocatie geen functionaliteit heeft voor het delen van data kan je SURFfilesender gebruiken. Als het absoluut noodzakelijk is om persoonsgegevens te delen via SURFfilesender, schakel dan bestandsversleuteling (file encryption) in.

Voorkeur: 

  • Radboud Universiteit Microsoft 365 Teams: Je kunt je begeleider vragen om een Team voor je aan te maken. Het kan zijn dat ze toestemming moeten vragen om een Team aan te kunnen maken, waarna ze een Team met een privékanaal voor jou kunnen aanmaken en de synchronisatiefunctie kunnen uitschakelen. Gebruik hiervoor het Microsoft 365 account dat jij en je begeleider van de Radboud Universiteit hebben gekregen, gebruik geen privé Microsoft 365 account!
    Eigenschappen: automatische back-up, ontworpen voor delen, overal toegankelijk
  • Werkgroepmap: Je kunt je begeleider vragen om een werkgroepmap voor je aan te maken via de account portal. Je begeleider moet de optie “Aanvraag Werkgroepmap met studenten” (“Request Workgroup folder with students”) selecteren.
    Eigenschappen: automatische back-up, beperkt delen, toegankelijk met 
    eduVPN en RU-Connect

Alternatieven: 

  • Radboud Universiteit Microsoft 365 TeamsJe kunt zelf een Team aanmaken waaraan je je begeleider(s) toevoegt. Gebruik het Microsoft 365-account dat gekoppeld is aan je account van de Radboud Universiteit, vraag toestemming aan via het accountportaal, maak een Team waar je je begeleider(s) toevoegt, en schakel de synchronisatiefunctie uit.
    Eigenschappen: automatische back-up, ontworpen voor delen, overal toegankelijk
  • Lokale drive op een persoonlijke pc/laptop: Je kan een lokale schijf op je persoonlijke pc of laptop gebruiken als deze beschermd is met een wachtwoord en (wanneer je persoonsgegevens hebt) encryptie. Aangezien er in dit geval geen automatische back-ups zijn, is deze optie minder geschikt - als je je computer verliest of als deze crasht, dan kun je al je data kwijtraken.
    Eigenschappen: geen automatische back-up, geen optie voor delen

Gebruik GEEN:

  • Commerciële cloudopslag: Vermijd cloud opslag, zoals Google Drive en Dropbox. Met name voor persoonsgegevens! Vermijd het ook als back-up.
  • Draagbare apparaten: Probeer draagbare apparaten, zoals USB-sticks en externe harde schijven te vermijden voor opslag en back-up van je data, omdat je deze gemakkelijk kunt kwijtraken.

Voor meer informatie over veilige opslag klik hier (ICT)

Archiveren van data voor wetenschappelijke integriteit

Waarom moet je data archiveren?

Na afronding van je onderzoeksproject is het belangrijk om je data te archiveren in het kader van wetenschappelijke integriteit. Door je data te archiveren, zijn ze controleerbaar voor anderen (bijvoorbeeld voor je begeleider of tijdens audits). Deze datasets worden niet openbaar gemaakt of gedeeld met andere onderzoekers, maar zijn alleen toegankelijk voor mensen zoals je begeleider.

Zorg er na archivering voor dat je alle versies van je data die zich nog ergens anders bevinden verwijderd, bijvoorbeeld op een lokale drive van je laptop.

Welke data moet je archiveren?

Archiveer alle data die relevant en noodzakelijk zijn voor een buitenstaander om je analyse en conclusies te kunnen reproduceren. Als je twijfelt over welke data je moet archiveren, bespreek dit dan met je begeleider.

Het is een goede gewoonte om documentatie toe te voegen aan je data. Deze documentatie beschrijft je data en zorgt ervoor dat je dataset over een paar jaar nog steeds begrijpelijk is. De bestanden die idealiter in een dataset moeten worden opgenomen, zijn:

  • Bestanden met onderzoeksdata: Dit kan het volgende omvatten: materialen van dataverzameling (experiment, stimuli, vragenlijsten), de ruwe data (Qualtrics export, antwoorden van interviews in de vorm van audiobestanden, output van een experiment), bewerkte data (opgeschoonde data die gebruikt worden voor analyses) en geanalyseerde data bestaande uit de resultaten (tabellen, grafieken, statistiek output) en scripts van analyses (SPSS, R-bestanden).
  • Documentatie: Het doel hiervan is om informatie over de context, inhoud en structuur van de dataset te verstrekken.
    • Een leesmij-bestand (readme) biedt enige context voor de dataset. Het vermeldt ook de bestanden die je hebt geüpload bij naam en beschrijft kort de inhoud van elk bestand. Een voorbeeld van een leesmij-bestand vindt je in de appendix onderaan deze pagina.
    • Een codeboek waarin je de variabelen in je onderzoek beschrijft en een methodologiebestand kunnen ook nuttige toevoegingen zijn.
  • Aanvullende bestanden: Je kan aanvullend je ingevulde data management plan toevoegen als je deze hebt. Wanneer je met participanten hebt gewerkt, kan je ook ethische toestemming, een leeg informed consentformulier, informatiedocumenten en debriefingbestanden toevoegen.

NB: Zoals hierboven beschreven, moeten persoonsgegevens die je niet nodig had voor je conclusies zo snel mogelijk worden verwijderd (zoals e-mailadressen van participanten)  en niet worden gearchiveerd om de privacy van je participanten te beschermen.

Waar moet ik data archiveren?

Bespreek met je begeleider of docent waar je je data moet archiveren

  • RIS for students: Sommige studieprogramma's gebruiken RIS for Students om onderzoeksdata van studenten te archiveren. Op deze website vind je hier een handleiding voor.
  • Een werkgroepmap: Je begeleider zal een werkgroepmap aan moeten maken en jou hiertoe toegang verlenen. Een werkgroepmap kan hier worden aangevraagd.

NB: Data van het RadboudUMC kan niet in RIS for Students of in een werkgroepmap gearchiveerd worden.

Data delen voor openbaar hergebruik

Het openbaar delen van data is geen standaardprocedure voor onderzoeksprojecten van studenten. Als je onderzoek echter wordt gepubliceerd en/of je begeleider en jij denken dat je data waardevol kunnen zijn voor hergebruik, dan zijn er verschillende opties die je kunt verkennen. Praat met je begeleider over je mogelijkheden.

DO'S

  • Vraag je begeleider of hij/zij het een goed idee vindt om je data openbaar te delen.
  • Vraag je begeleider welke data je kan delen.
  • Vraag je begeleider wat een geschikte licentie en toegangsniveau is voor je dataset.
  • Vraag je begeleider naar een geschikt archief in jouw vakgebied. Anders zijn DANS EASY en DANS Data Stations goede keuzes.

DON’TS

  • Deel persoonsgegevens niet openbaar.

Een dataset die je deelt voor hergebruik mag geen persoonsgegevens bevatten (tenzij dit vereist is voor een tijdschriftpublicatie en je specifieke toestemming hebt gekregen van participanten om dit te doen en als je facultaire ethische commissie dit heeft goedgekeurd). Een dataset die je openbaar deelt zal daardoor vaak anders zijn dan een dataset die je voor wetenschappelijke integriteit hebt gearchiveerd. Voor wetenschappelijke integriteit moet je bijvoorbeeld meestal ruwe data archiveren. Vaak mag je deze gegevens echter niet openbaar delen. Bij het verzamelen van bijvoorbeeld geluidsopnamen van deelnemers archiveer je deze voor de wetenschappelijke integriteit. Wanneer je echter je data openbaar wil delen voor hergebruik dan kan je hoogstwaarschijnlijk alleen anonieme transcripten delen en niet de audiobestanden zelf.

Appendix: Voorbeeld leesmij bestand (readme)

Dataset title: Good arguments or a charming narrator? Exploring a text’s persuasiveness through eye-tracking

Student:                            Sanne Huisman (s123456)
First supervisor:               dr. Lisa Begeleider

Second reader:                dr. Ton Lezer

Short summary

This dataset contains all relevant data files for the thesis Good arguments or a charming narrator? Exploring a text’s persuasiveness through eye-tracking, written by Sanne Huisman to obtain the degree of Bachelor of Arts and conclude the bachelor’s programme International Business Communication at Radboud University. This research was conducted at the CLS Lab in the spring of 2019 and supervised by dr. Lisa Begeleider and dr. Ton Lezer.

The goal of this thesis was to explore the persuasiveness of a text as a function of the quality of the presented arguments as well as the likability of the person making these arguments. While persuasiveness is often measured with questionnaires, we explored whether persuasiveness is also reflected in eye movements. A total of 78 participants took part in this study.

Dataset structure

This dataset contains a total of 8 files as well as two zip folders:

  • README.txt:
    That is this very readme file.
  • Rawdata_eyetracking.zip:
    This zip folder contains the raw eye-tracking data of 78 participants. The data was collected using an EyeLink 1000+ eye-tracker. The folder structure of the raw output is unchanged.
  • Experiment.zip:
    This zip folder contains all files necessary to run the experiment using the experiment software Experiment Builder as installed in the CLS Lab.
  • Participant_overview.xlxs:
    This Excel file contains a pseudonymized overview of all participants. It includes the participant id (001, 002 etc), gender and age of each participant.
  • Persuasiveness_questionnaire_empty.doc:
    This file contains an empty version of the questionnaire by McCroskey and Teven (1999) which was used to measure the persuasiveness.
  • Persuasiveness_results.xlsx:
    This file contains the results of all 78 participants on McCroskey and Teven’s (1999) questionnaire.
  • Eyedata_clean.txt:
    This text file contains all the pre-processed and cleaned up eye-tracking data. The variable names are chosen in such a way that they are self-explanatory.
  • data_analysis_anova.sav:
    This file contains all the eye-tracking and questionnaire data as it was analysed in SPSS
  • analysis_anova.sps:
    This SPSS syntax file contains the full analysis.
  • Methodolofy_HuismanS_2019.pdf:
    This is the methodology section of the thesis which was written based on these data.

References

McCroskey, J. C., & Teven, J. J. (1999). Goodwill: A reexamination of the construct and its measurement. Communications Monographs, 66(1), 90-103. doi: https://doi.org/10.1080/03637759909376464