DATA CATALOGUS

Inhoud databank en bio-informatisch proces

De databank van Hartwig Medical Foundation is ’s werelds grootste databank met data van uitgezaaide tumoren, verkregen door whole genome sequencing (WGS), in combinatie met klinische data.

De tumortypes die in de databank zijn opgenomen, en het percentage, representeren de incidentie van die solide tumortypes in Nederland. Naast de moleculaire data worden ook eigenschappen van de tumor in de databank verzameld, evenaals de behandelgegevens en en behandeluitkomsten. De data in de databank is van hoge kwaliteit door een volledig uniform proces voor alle samples van biopt tot bioinformatische analyse. 

Totstandkoming data

Van iedere patiënt wordt het DNA uit een biopt van de tumor en uit een buisje bloed geanalyseerd door middel van whole genome sequencing (WGS). Voor het bloedmonster worden kiembaanvarianten bepaald en door bloed met biopt te vergelijken ontstaat er inzicht in de tumor-specifieke varianten. De tumor-specifieke varianten omvatten single nucleotide variants (SNVs), inserties en deleties (INDELs), structurele varianten (SVs) en copy number alterations (CNAs) die met state-of-the-art open source bioinformatische tools zijn geidentificeerd. DNA van het bloed wordt gemiddeld 30 tot 40 keer afgelezen, en DNA van het biopt gemiddeld 90 tot 120 keer.

Biopten worden standaard vlak voor de behandeling afgenomen, voor een beperkt aantal patiënten is echter ook een tweede biopt aanwezig van na de initiële behandeling.

Validatie

Meer informatie over de technische details en specificatie van de WGS-analyse, de biopt- en weefselcriteria en een overzicht van alle validatie experimenten zijn beschikbaar in het Hartwig Medical OncoAct Technical Information document (pdf).

Bioinformatische analyses

Alle code die Hartwig Medical Foundation gebruikt voor haar IT-pipeline (bio-informatische analyses) zijn te vinden op Github:
# Code repository met pipeline code
# Code repository met in-house ontwikkelde tools.

Distributie van tumor types in de Hartwig Medical Database.

Tumor types in Hartwig Medical Foundation database

 

Hartwig Medical Databank

Onderstaande figuur geeft de distributie weer van de tumor types in de Hartwig Medical Databank.

Hartwig Medical Portal

De Hartwig Medical Databank omvat op dit moment WGS data van ongeveer 4.000 samples van gemetastaseerde tumoren, gedistribueerd over een brede selectie van kanker types. Naast WGS data bevat de Hartwig Medical Databank ook een grote hoeveelheid klinische data. Toegang tot data uit de Hartwig Medical Databank kan door onderzoekers worden aangevraagd via een formele data aanvraag.

Een subset van data (somatische varianten van 2.399 samples) uit de Hartwig Medical Databank is benaderbaar in een grafische interface (portal). Deze subset is gecreëerd voor het Priestley et al. pan-cancer paper in Nature (pre-print beschikbaar). In deze portal kan de data op verschillende manieren doorzocht worden (zie voorbeeld queries aan de rechterzijde van de webpagina van de portal).

Bekijk video: Landelijke DNA-databank kankerpatiënten