NTFS “重复数据删除”的操作原理
Windows“重复数据删除”的基本构造是一个范围在32 KB和128 KB之间不等的变量块。块的副本被复制到一个块存储空间。该块存储空间是由Windows管理,并存放在系统卷的磁盘信息区间,这意味着我们不能看到的“重复数据删除”机制的内部运作。下图显示了Windows Server 8 的“重复数据删除”机制被应用到两个文件时的操作原理。
在上图,数据块A、B和C是“重复数据删除”的候选对象。“重复数据删除”机制运行时,符合“重复数据删除”的文件块被复制到块存储空间。从那里开始,其数据文件被分为两个层面:一个“Parse”(分析)和一个“Reparse”(重新分析)地带。重新分析的地带通过援引块存储空间来访问共同块或重复数据删除的数据。
“重复数据删除”过程是通过Windows计划任务运行,或可以通过PowerShell交互运行。Get-DedupStatus命令将很快地显示一个单独卷上的“重复数据删除”百分比。这些计划任务将对磁盘卷进行“重复数据删除”候选对象的筛选,然后协调运动到块存储空间。但Windows Server 8 的“重复数据删除”是不允许运行在C:\系统盘上的。当问及为什么会有此限制的原因时,微软产品经理介绍到,对系统盘的整理需要有较高的操作经验,而且任何的“重复数据删除”机制都需要有个上限。
如果一个文件属于完全的“重复数据删除”型,那么最终在磁盘上它只会消耗4.00 KB的存储空间。这个大小仅是该文件的元数据节,而它的所有重新分析和没有分析的部分都将在块存储空间中。
在Windows Server 8 中,包括那些没有选择“重复数据删除”功能的卷,当你单击Windows资源管理器里的一个文件时,文件的大小和在磁盘上该文件大小的值,可能会有一些新的变化了。这两个值将显示该文件的实际大小和经过“重复数据删除”后的大小(在块存储空间之外)。
页:
[1]