Przejdź do treści
Powrót do Centrum Pomocy
Windows Server
Aplikacje Microsoft

Windows Server Deduplication i Storage Spaces — jak odzyskać nawet 95% przestrzeni dyskowej na serwerze

Deduplikacja danych w Windows Server to rola (FS-Data-Deduplication), która analizuje zawartość plików na wolumenie, dzieli je na zmienne fragmenty (chunki), id

10 min czytania·Zaktualizowano dzisiaj
Faktura VAT 23% + KSeFDostawa 1-3 min e-mailemGwarancja działania klucza5,0 / 5,0(KluczeSoft)

Deduplikacja danych w Windows Server (Data Deduplication) to wbudowana rola serwerowa, która eliminuje zduplikowane fragmenty plików na wolumenie — bez wpływu na integralność danych i całkowicie transparentnie dla użytkowników. W połączeniu z Storage Spaces (wirtualizacją pamięci masowej łączącą fizyczne dyski w elastyczne pule) można zbudować odporny na awarie, tani magazyn, który przechowuje nawet 20 razy więcej danych, niż wynosi fizyczna pojemność dysków.

W skrócie

  • Data Deduplication działa post-processingowo — najpierw zapisuje dane normalnie, potem w tle szuka duplikatów i zastępuje je wskaźnikami (reparse points)
  • Oszczędności: 30-50% na udziałach plikowych, 70-80% na repozytoriach software'u, 80-95% na bibliotekach wirtualizacji (VDI, Hyper-V)
  • Storage Spaces łączy fizyczne dyski SATA/SAS/NVMe/SSD w jedną pulę, na której tworzysz wirtualne wolumeny z wybraną odpornością (mirror/parity/simple)
  • Obie technologie są dostępne we wszystkich edycjach Windows Server od wersji 2016 (z ulepszeniami w 2019, 2022 i 2025)
  • Maksymalny rozmiar wolumenu z deduplikacją: 64 TB (od Windows Server 2016)
  • Wsparcie dla ReFS (oprócz NTFS) — od Windows Server 2019
  • W pełni kompatybilne z Failover Clustering i Storage Spaces Direct

Pełna definicja — czym są obie technologie

Data Deduplication (deduplikacja danych)

Deduplikacja danych w Windows Server to rola (FS-Data-Deduplication), która analizuje zawartość plików na wolumenie, dzieli je na zmienne fragmenty (chunki), identyfikuje unikalne chunki i przechowuje tylko jedną ich kopię w chunk store — ukrytym magazynie w katalogu System Volume Information. Zduplikowane fragmenty są zastępowane wskaźnikami (reparse points), które przy odczycie są przezroczyste przekierowywane przez filtr systemu plików (Dedup.sys) do odpowiednich chunków.

Deduplikacja działa w modelu post-processingowym: pliki są najpierw zapisywane na dysk w oryginalnej, nieoptymalizowanej postaci, a dopiero później (domyślnie co godzinę) uruchamia się zadanie optymalizacyjne. Ten model gwarantuje, że deduplikacja nigdy nie spowalnia zapisu — co jest kluczowe dla serwerów produkcyjnych.

Trzy główne zadania utrzymaniowe działające w tle:

ZadanieDziałanieDomyślny harmonogram
OptimizationDzieli pliki na chunki, kompresuje, usuwa duplikatyCo godzinę
Garbage CollectionUsuwa nieużywane chunki (po modyfikacji/usunięciu plików)Sobota, 2:35
Integrity ScrubbingWykrywa uszkodzenia chunk store i automatycznie naprawia (jeśli Storage Spaces ma mirror/parity)Sobota, 3:35

Do wyboru są trzy predefiniowane profile obciążenia (Usage Type): Default (udziały plikowe, udziały domowe), Hyper-V (VDI, serwery wirtualizacji) oraz Backup (DPM, Veeam) — każdy z różnymi ustawieniami minimalnego wieku pliku i priorytetu optymalizacji.

Storage Spaces (przestrzenie magazynowe)

Storage Spaces to technologia wirtualizacji pamięci masowej, która abstrahuje fizyczne dyski w logiczne pule magazynowe, a następnie pozwala tworzyć na nich wirtualne dyski (Storage Spaces) z niezależnie konfigurowaną odpornością. Działa koncepcyjnie podobnie do RAID-u programowego — ale jest znacznie bardziej elastyczne, bo nie wymaga identycznych dysków.

Trzy typy odporności:

TypJak działaTolerancja awariiEfektywność pojemnościOptymalne dla
SimpleStriping bez redundancji0 dysków100%Dane tymczasowe, scratch
Mirror (2-way)Każdy blok zapisany na 2 dyskach1 dysk50%Maszyny wirtualne, bazy danych
Mirror (3-way)Każdy blok zapisany na 3 dyskach2 dyski~33%Dane krytyczne
Single ParityStriping + bloki parzystości1 dysk~80-90% (zależnie od liczby dysków)Archiwa, backupy
Dual ParityStriping + podwójna parzystość2 dyski~70-80%Archiwa długoterminowe

Storage Spaces ≠ Storage Spaces Direct. Storage Spaces działa na pojedynczym serwerze (lub klastrze z zewnętrzną macierzą JBOD). Storage Spaces Direct (S2D) to hiperkonwergentna odmiana dla klastrów z wewnętrznymi dyskami połączonymi przez RDMA/Ethernet — przeznaczona do dużych wdrożeń z wyższą wydajnością.

Jak Deduplication i Storage Spaces współpracują ze sobą

Połączenie obu technologii to jeden z najskuteczniejszych sposobów na budowę taniego, odpornego i pojemnego magazynu na Windows Server:

  1. Tworzysz Storage Pool z fizycznych dysków (np. 4 × 4 TB HDD + 2 × 512 GB SSD jako cache Storage Bus Cache).
  2. Tworzysz Storage Space — np. wirtualny dysk z odpornością Mirror (2-way) lub Parity.
  3. Formatujesz go jako NTFS (lub ReFS, od Server 2019).
  4. Włączasz Data Deduplication na wolumenie (Enable-DedupVolume -Volume X: -UsageType Hyper-V).
  5. Deduplikacja działa na warstwie logicznej systemu plików, a Storage Spaces zapewnia redundancję na warstwie fizycznej.

Kluczowy szczegół: Integrity Scrubbing w Data Deduplication potrafi automatycznie wykorzystać redundancję Storage Spaces — jeśli wykryje uszkodzony chunk, odtwarza go z kopii lustrzanej lub danych parzystości. To dodatkowa warstwa bezpieczeństwa.

Scenariusz praktyczny — serwer VDI

Wyobraź sobie serwer z 10 maszynami wirtualnymi Windows 11, każda po 40 GB — w sumie 400 GB danych. Ponieważ obrazy systemów są niemal identyczne (te same pliki systemowe, sterowniki, biblioteki), deduplikacja na wolumenie Hyper-V może zredukować zużycie do zaledwie 20-40 GB. Do tego Storage Spaces Mirror chroni przed awarią fizycznego dysku. Rezultat: z 4 dysków 4 TB uzyskujesz ~8 TB logicznej przestrzeni, która realnie pomieści nawet 100-150 maszyn wirtualnych.

Porównanie — NTFS vs ReFS z deduplikacją

CechaNTFS + DeduplicationReFS + Deduplication
Wsparcie od wersjiWindows Server 2012Windows Server 2019
Maks. rozmiar wolumenu64 TB64 TB (praktycznie znacznie więcej przez ReFS)
Odporność na uszkodzenia (bit rot)❌ Brak✅ Automatyczna korekcja (checksumy metadanych i danych)
Wydajność przy dużych wolumenachDobraLepsza (wolumen skalowalny do PB)
Naprawa wolumenu po awariiCHKDSK (długotrwały)ReFS Salvage (szybszy, operuje na metadanych)
Kompatybilność z Failover Clustering✅ Tak✅ Tak (CSV)
Obsługa quota✅ Tak (soft quota)✅ Tak
Windows Server Backup✅ Tak✅ Tak
Zalecany dlaUniwersalnyWolumeny >64 TB, dane krytyczne, VDI na dużą skalę

Wybór w pigułce: NTFS jest bezpieczniejszym wyborem ogólnego przeznaczenia. ReFS wybierz, gdy wolumen ma przechowywać bardzo dużo danych (>64 TB logicznie) lub gdy ochrona przed cichym uszkodzeniem danych (bit rot) jest priorytetem — np. na serwerze backupów.

Na co uważać — ograniczenia i pułapki

  1. Brak wsparcia na Windows 10/11 (klient) — deduplikacja to wyłącznie funkcja serwerowa. Nie próbuj kopiować binarek z Servera na desktop — Microsoft tego nie wspiera.

  2. Windows Search nie indeksuje zdeduplikowanych plików — Search pomija pliki z reparse points. Jeśli użytkownicy polegają na wyszukiwarce Windows na udziałach sieciowych, wyniki będą niekompletne.

  3. Robocopy może uszkodzić chunk store — standardowe kopiowanie zdeduplikowanych plików narzędziem Robocopy (bez deduplikacji na celu) tworzy uszkodzone wskaźniki reparse. Lepiej używać Windows Server Backup.

  4. Hard quota na katalogu głównym wolumenu — nie jest wspierana na wolumenach z deduplikacją (soft quota działa normalnie).

  5. Pamięć RAM — minimum 300 MB + 50 MB na każdy TB danych logicznych; optymalnie 1 GB RAM na 1 TB danych. Dla 10 TB wolumenu rekomendowane jest 10 GB RAM.

  6. Wydajność zapisu na Parity Spaces — przestrzenie parzystościowe mają niższą wydajność zapisu ze względu na kalkulację sum kontrolnych. Jeśli na takim wolumenie włączysz deduplikację, zadania optymalizacyjne będą również wolniejsze — warto rozważyć dodanie SSD jako Storage Bus Cache.

  7. Deduplikacja nie działa na wolumenach z wieloma warstwami (tiered storage) — jeśli używasz Storage Spaces z warstwami (tiering), deduplikacja nie jest wspierana na takim wolumenie.

Instalacja i konfiguracja — szybki start

Krok 1 — Instalacja roli (PowerShell, jako Administrator):

Install-WindowsFeature -Name FS-Data-Deduplication

Alternatywnie przez Server Manager: Add Roles and Features → Server Roles → zaznacz Data Deduplication.

Krok 2 — Włączenie na wolumenie (np. dysk E: dla udziałów plikowych):

Enable-DedupVolume -Volume E: -UsageType Default

Krok 3 — Monitorowanie oszczędności (po kilku godzinach/gdy zadanie optymalizacji się wykona):

Get-DedupStatus -Volume E:
# Wyświetla: SavedSpace, OptimizedFilesCount, InPolicyFilesCount, itd.

Krok 4 — Ręczne uruchomienie optymalizacji (opcjonalnie):

Start-DedupJob -Volume E: -Type Optimization -Full

Krok 5 — Ocena potencjału przed włączeniem (narzędzie DDPEval):

DDPEval.exe E:\Dane
# Pokaże szacowane oszczędności przed podjęciem decyzji

Częste pytania

Czy deduplikacja spowalnia zapis na serwerze?

Nie. Deduplikacja w Windows Server używa modelu post-processingowego — dane są najpierw zapisywane normalnie na dysk, a dopiero potem (domyślnie co godzinę) zadanie optymalizacyjne analizuje je w tle. Zapis jest zawsze z pełną prędkością dysku. Jedyne, co może być wolniejsze, to odczyt bardzo rozproszonych (sfragmentaryzowanych) plików na dyskach HDD — na SSD różnica jest niezauważalna.

Czy mogę używać deduplikacji na serwerze plików firmowych bez ryzyka utraty danych?

Tak, pod warunkiem że masz włączoną redundancję na poziomie Storage Spaces (mirror lub parity). Deduplikacja sama w sobie nie chroni przed awarią dysku — jeśli chunk store zostanie uszkodzony, wszystkie pliki z niego korzystające ulegną uszkodzeniu. Dlatego zawsze łącz deduplikację z mirror/parity Storage Spaces lub sprzętowym RAID-em.

Co się stanie, gdy zabraknie miejsca na chunk store?

Data Deduplication monitoruje wolne miejsce i wstrzymuje optymalizację, gdy wolumen jest zbyt zapełniony. Nie powoduje to utraty danych — pliki pozostają w swojej ostatniej postaci (część zoptymalizowana, część nie). Garbage Collection ma priorytet przy niskim stanie wolnego miejsca, aby jak najszybciej zwolnić nieużywane chunki.

Czy deduplikacja działa z Windows Server 2025?

Tak, Windows Server 2025 w pełni wspiera Data Deduplication — zarówno na NTFS, jak i ReFS, wraz z integracją z Failover Clustering, Storage Spaces Direct i Storage Replica. To dojrzała technologia, rozwijana nieprzerwanie od Windows Server 2012.

Jaka jest różnica między deduplikacją a kompresją NTFS?

Kompresja NTFS działa na poziomie pojedynczego pliku: każdy plik jest osobno kompresowany w locie przy zapisie. Deduplikacja analizuje wszystkie pliki na wolumenie i znajduje identyczne fragmenty między różnymi plikami (np. dziesięć kopii tego samego pliku ISO w różnych folderach). Kompresja NTFS nie wykryje duplikacji między plikami — deduplikacja tak. Co więcej, deduplikacja dodatkowo opcjonalnie kompresuje chunki w chunk store, uzyskując łączny efekt obu technik.

Czy mogę przenieść zdeduplikowany wolumen na inny serwer?

Tak, jeśli oba serwery mają zainstalowaną rolę Data Deduplication. Przy przenoszeniu przez Failover Clustering (CSV) dzieje się to automatycznie. Przy ręcznym przenoszeniu dysków (np. przez odpięcie macierzy JBOD i podpięcie do innego serwera) system rozpozna istniejący chunk store i wznowi zarządzanie nim po zainstalowaniu roli. Nie próbuj jednak kopiować plików z chunk store zwykłym eksploratorem — użyj Windows Server Backup.

Ile mogę zaoszczędzić na licencji Windows Server przy takim rozwiązaniu?

Wdrożenie Storage Spaces + Data Deduplication nie wymaga dodatkowych licencji — obie funkcje są wbudowane w każdą edycję Windows Server (Standard i Datacenter). Oznacza to, że kupując jedną licencję Windows Server, zyskujesz kompletne narzędzie do budowy zoptymalizowanego, redundantnego magazynu bez dopłat za storage.

Jeśli planujesz wdrożenie Windows Server i szukasz legalnej licencji w korzystnej cenie — w KluczeSoft.pl znajdziesz licencje Windows Server Standard i Datacenter z natychmiastową dostawą i fakturą VAT, w pełni zgodne z unijną zasadą swobodnego obrotu licencjami (wyrok TSUE C-128/11, Dyrektywa 2009/24/WE). To niezależny sklep — nie jesteśmy afiliowani z Microsoft — ale dostarczamy w 100% legalne klucze do aktywacji.

Najczęściej zadawane pytania

Nie. Deduplikacja w Windows Server używa modelu post-processingowego — dane są najpierw zapisywane normalnie na dysk, a dopiero potem (domyślnie co godzinę) zadanie optymalizacyjne analizuje je w tle. Zapis jest zawsze z pełną prędkością dysku. Jedyne, co może być wolniejsze, to odczyt bardzo rozproszonych (sfragmentaryzowanych) plików na dyskach HDD — na SSD różnica jest niezauważalna.
Tak, pod warunkiem że masz włączoną redundancję na poziomie Storage Spaces (mirror lub parity). Deduplikacja sama w sobie nie chroni przed awarią dysku — jeśli chunk store zostanie uszkodzony, wszystkie pliki z niego korzystające ulegną uszkodzeniu. Dlatego zawsze łącz deduplikację z mirror/parity Storage Spaces lub sprzętowym RAID-em.
Data Deduplication monitoruje wolne miejsce i wstrzymuje optymalizację, gdy wolumen jest zbyt zapełniony. Nie powoduje to utraty danych — pliki pozostają w swojej ostatniej postaci (część zoptymalizowana, część nie). Garbage Collection ma priorytet przy niskim stanie wolnego miejsca, aby jak najszybciej zwolnić nieużywane chunki.
Tak, Windows Server 2025 w pełni wspiera Data Deduplication — zarówno na NTFS, jak i ReFS, wraz z integracją z Failover Clustering, Storage Spaces Direct i Storage Replica. To dojrzała technologia, rozwijana nieprzerwanie od Windows Server 2012.
Kompresja NTFS działa na poziomie pojedynczego pliku: każdy plik jest osobno kompresowany w locie przy zapisie. Deduplikacja analizuje wszystkie pliki na wolumenie i znajduje identyczne fragmenty między różnymi plikami (np. dziesięć kopii tego samego pliku ISO w różnych folderach). Kompresja NTFS nie wykryje duplikacji między plikami — deduplikacja tak. Co więcej, deduplikacja dodatkowo opcjonalnie kompresuje chunki w chunk store, uzyskując łączny efekt obu technik.
Tak, jeśli oba serwery mają zainstalowaną rolę Data Deduplication. Przy przenoszeniu przez Failover Clustering (CSV) dzieje się to automatycznie. Przy ręcznym przenoszeniu dysków (np. przez odpięcie macierzy JBOD i podpięcie do innego serwera) system rozpozna istniejący chunk store i wznowi zarządzanie nim po zainstalowaniu roli. Nie próbuj jednak kopiować plików z chunk store zwykłym eksploratorem — użyj Windows Server Backup.
Wdrożenie Storage Spaces + Data Deduplication nie wymaga dodatkowych licencji — obie funkcje są wbudowane w **każdą edycję Windows Server** (Standard i Datacenter). Oznacza to, że kupując jedną licencję Windows Server, zyskujesz kompletne narzędzie do budowy zoptymalizowanego, redundantnego magazynu bez dopłat za storage. Jeśli planujesz wdrożenie Windows Server i szukasz legalnej licencji w korzystnej cenie — w [KluczeSoft.pl](https://kluczesoft.pl/licencje-server) znajdziesz licencje Windows Server Standard i Datacenter z natychmiastową dostawą i fakturą VAT, w pełni zgodne z unijną zasadą swobodnego obrotu licencjami (wyrok TSUE C-128/11, Dyrektywa 2009/24/WE). To niezależny sklep — nie j

Czy ten artykuł był pomocny?