Знаете ли вы процесс инициализации RAID?
Mar 10, 2023Система RAID является эффективным средством защиты хранимых данных. При создании RAID инициализация системы занимает много времени. Почему такая операция существует во время инициализации RAID? Какое влияние это оказывает на SSD?
Все диски, добавляемые в группу RAID, делятся на серию слайсов на основе их адресов LBA. Эти слайсы называются Stripe Units. Единицы чередования, соответствующие одному и тому же адресу LBA на разных дисках, организованы в чередование. Кодирование всех данных в одной полосе, например RAID6, создающее два закодированных блока данных P и Q, позволяет одновременно повредить оба диска данных.
Следовательно, в системе RAID все данные в полосе должны соответствовать правилам алгоритма кодека. То есть все данные в полосе могут генерировать закодированные данные в соответствии с определенными правилами, и закодированные данные такие же, как и хранящиеся в полосе. Говорят, что это тот случай, когда данные на полосе непротиворечивы. Когда диск выходит из строя, потерянный блок данных можно восстановить, используя закодированные данные, хранящиеся на полосе.
Если данные в полосе несовместимы, то есть закодированные данные в полосе отличаются от закодированных данных, хранящихся в полосе. Если диск выходит из строя, закодированные данные, хранящиеся на полосе, нельзя использовать для восстановления потерянных блоков данных. Следовательно, полоса с несогласованными данными вызовет проблемы с правильностью данных при возникновении ошибки.
При создании системы RAID диски в группе RAID могут быть новыми дисками или бывшими в употреблении дисками данных. Данные на этих дисках не могут содержать все нули. В этом случае полосы данных, построенные этими дисками, не могут удовлетворять требованиям согласованности данных. То есть закодированные данные, вычисленные в соответствии с определенными правилами в каждой полосе, не согласуются с закодированными данными в полосе.Несогласованное чередование данных создает большие риски для правильности данных RAID.
По этой причине при создании массива RAID инициализируйте все полосы в системе, чтобы обеспечить согласованность данных. Инициализацию полосы обычно можно выполнить двумя способами:
1. Инициализируйте все планки в системе RAID, записав все нули. Данные четности полосы со всеми нулевыми данными также равны нулю. Следовательно, все нулевые данные могут обеспечить согласованность полосы.
2. Выполните расчет четности для всех полос и обновите данные о четности в полосах, чтобы обеспечить согласованность данных.
Инициализация системы RAID — очень долгий процесс. Основная причина в том, что все полосы в системе должны быть инициализированы. Вам также необходимо учитывать баланс производительности с пользовательским вводом-выводом переднего плана. Поэтому инициализация системы RAID обычно является фоновым процессом, который длится долго и влияет на производительность интерфейсных приложений.
Для SSD процесс инициализации системы RAID также создает другие проблемы. Во время инициализации системы данные должны быть записаны на SSDS, независимо от режима записи с нулевой записью или обновления данных с контролем четности. Этот процесс приводит к ненужному увеличению записи данных. Перед записью пользовательских данных таблица отображения данных создается внутри SSD путем инициализации. Срок службы и производительность SSDS сокращаются. Следовательно, система RAID для SSD должна быть оптимизирована для процесса инициализации системы, что является особой функцией, которую традиционный RAID не принимает во внимание. Поэтому традиционные RAID-массивы нельзя напрямую развернуть на SSD, что влияет на срок службы и производительность SSD.
Системы RAID используют чередование для защиты данных, но в процессе защиты данных с чередованием возникает ряд проблем. Инициализация системы — типичная проблема согласованности полос. Хорошая система защиты данных RAID решит эту проблему в процессе проектирования. Например, EMC Data Domain RAID не имеет процесса инициализации системы, конечно, он должен взаимодействовать с файловой системой, и была проведена большая оптимизация распределения данных полосы RAID.