Data deduplicatie (ook bekend als dedup) optimaliseert vrije ruimte op een volume door te zoeken naar gedupliceerde data op een volume. Dubbele/gedupliceerde data wordt éénmaal opgeslagen (en meestal ook gecomprimeerd). Dit bespaart opslagruimte zonder dat het een merkbare impact heeft op redundantie of integriteit (er zijn uitzonderingen te bedenken maar de kans daarop is uitzonderlijk klein).
Data deduplicatie bespaart schijfruimte, wat lagere kosten en een lagere ecologische impact met zich meebrengt. NetApp maakt bijvoorbeeld gebruik van deze techniek. Data die gededupliceerd kunnen worden zijn bijvoorbeeld:
- Dagelijkse backups of snapshots waarin maar weinig verandert van dag tot dag.
- Als virtuele servers hetzelfde besturingssysteem gebruiken, komen die grotendeels met dezelfde bestanden. In theorie kunnen die ook gededupliceerd worden.
- Bestanden van gebruikers binnen een besturingssysteem die kopieën zijn van elkaar, bijvoorbeeld als twee gebruikers dezelfde Word-file of installatiefile hebben gedownload.