Skip to Main Content

Datamanagement voor studenten: Je data organiseren

Research Data Management (RDM) voor studenten van de Radboud Universiteit

Waarom is het organiseren van je data belangrijk?

Je zou je databestanden moeten organiseren gedurende je onderzoek door gebruik te maken van goede mappenstructuren en bestandsnamen. Door middel van goede mappen-en bestandsnamen en bestands- en mappenstructuren zul je gemakkelijk je data kunnen vinden en bijhouden. Dit zal je tijd besparen doordat je niet steeds op zoek hoeft naar de laatste versie van een bestand of waar een bestand opgeslagen is. Ook kan dit voorkomen dat data verloren gaat doordat bestanden per ongeluk verwijderd of overschreven worden.

Mappenstructuur

Een duidelijke mappenstructuur is belangrijk om alle bestanden en documenten die tijdens je onderzoek worden aangemaakt snel en efficiënt terug te vinden (zie ook “Bestandsnamen”).

  • Bedenk welke mappen nodig zijn om je bestanden op te slaan en te organiseren. Dit verschilt per onderzoeker en mogelijk ook per onderzoeksproject. Eén manier om je mappen te organiseren is om deze aan te laten sluiten op de onderzoekscyclus. Het voordeel van deze manier is dat lopende werkzaamheden gescheiden worden van voltooide werkzaamheden in verschillende mappen. Je zou mappen kunnen creëren, zoals ‘Administratie’, ‘Experiment’ en ‘Scriptie’.
  • Zorg voor een duidelijke onderverdeling van bestanden en mappen. Door mappen relevante namen te geven, kun je namen van bestanden inkorten. De bestandsnaam ‘InterviewbedrijfA_audio_20190320’ wordt dan ‘BedrijfA_audio_20190320’ in de map ‘Interviews.
    • Over het algemeen is de vuistregel om van generieke naar specifieke mappen te gaan.
    • Beperk het aantal niveaus van de submappen tot drie of vier, zodat de structuur niet te ingewikkeld wordt. Hoe meer submappen je hebt, hoe groter de kans op dupliceren. Hierbij worden bestanden opgeslagen op meerdere locaties, omdat je de vorige locatie bent vergeten. Bovendien zijn er technische beperkingen met een maximale lengte voor het bestandspad en de bestandsnaam.

 

Bestandsnamen

Met de volgende tips kun je bestandsnamen maken die makkelijk te onderscheiden zijn en die informatie bevatten over zowel de inhoud als de versie van het bestand. Bestandsnamen zijn heel persoonlijk, dus je moet zelf bepalen wat voor jou het beste werkt. Hieronder hebben wij een aantal zaken opgesomd waar je rekening mee kan houden. Bij het creëren van een bestandsnaam is het handig om van algemeen naar specifieker te gaan. Het belangrijkste aspect van de naamgeving van bestanden is dat je consistent bent. NB: Je ruwe data moeten te allen tijde bewaard blijven. Daarom moeten alle bestanden die ruwe data bevatten duidelijk herkenbaar zijn aan de hand van hun bestandsnaam.

  • Kort: Houd bestandsnamen kort door maximaal 32 karakters te gebruiken. Het gebruik van bekende en makkelijke afkortingen kan je hierbij helpen.
  • Vanzelfsprekend: Je moet kunnen begrijpen wat de inhoud is van een bestand met behulp van de bestandsnaam. Je kan altijd de inhoud gedetailleerder beschrijven in het bestand zelf of in een apart bestand. Bijvoorbeeld ‘Dataset1.xls’ is geen goede bestandsnaam, omdat deze te algemeen is. De bestandsnaam ‘MRI_experiment_3_data_20181125.xls’ geeft daarentegen voldoende informatie.
  • Speciale karakters: Vermijd speciale karakters en karakters met accenten, omdat deze soms voor problemen kunnen zorgen, zoals *%&/:”?<>~!@#$^{}éöû.
  • Bestandsextensies: Houd de bestandsextensies (bijvoorbeeld .doc, .csv, .jpeg), omdat veel systemen problemen ervaren wanneer deze informatie ontbreekt.
  • Versiebeheer: Een voorbeeld van en bestandsnaam die versiebeheer bevat, is Chapter03_20210620_v05_KM.docx waarbij de datum, versienummer en auteur zijn inbegrepen. Deze onderdelen worden hieronder verder uitgelegd
    • Datum: Gebruik het format YYYYMMDD, omdat het je in staat stelt bestanden in chronologische volgorde te ordenen.
    • Versienummer: Je kan grote aanpassingen aanwijzen door “v01” of “v02” te gebruiken. Bij kleine aanpassingen kan je dit aanwijzen door een extra nummer toe te voegen “v01_03” of “v01_04”. Door met “0” te beginnen, worden de bestanden opeenvolgend gesorteerd.
    • Auteur: De initialen van de auteur en de editor kan ook worden toegevoegd aan de bestandsnaam. Dit is zeker handig wanneer je begeleider of iemand anders informatie of opmerkingen toevoegt.