Процесс инициализации Raid
Jan 28, 2022Система RAID является эффективным средством защиты данных от хранимых данных. В процессе создания RAID часто происходит очень длительный процесс инициализации системы. Почему в процессе инициализации RAID есть такая операция? Какие аспекты эта операция будет иметь на SSD? Проанализируем и изучим процесс инициализации RAID с точки зрения развития технологий.
Базовая организационная структура традиционного массива RAID состоит в том, что все диски, добавляемые в группу RAID, делятся на серию слайсов на основе их адресов LBA. Эти слайсы называются Stripe Units. Единицы чередования, соответствующие одним и тем же адресам LBA на разных дисках, объединяются в чередование. Кодирование всех данных в одной полосе, например RAID6, создающее два закодированных блока данных P и Q, позволяет одновременно повредить оба диска данных.
Следовательно, в системе RAID все данные в полосе должны соответствовать правилам кодирования и алгоритму декодирования, то есть все данные в полосе могут генерировать данные кодирования в соответствии с определенными правилами, а данные кодирования такие же, как и данные кодирования, хранящиеся на полосе. Эта ситуация называется данными в этой полосе. Когда диск выходит из строя, потерянные блоки данных могут быть восстановлены с помощью закодированных данных, хранящихся на полосе.
Если данные в полосе несовместимы, то есть результат кодирования, полученный данными в полосе, не одинаков, то после отказа диска отсутствующий блок данных не может быть должным образом восстановлен закодированными данными, хранящимися в полосе. Следовательно, полоса несогласованности данных, которая вызовет проблемы с правильностью данных при возникновении ошибки.
При создании системы RAID диск в группе RAID может быть либо новым диском, либо уже использованным диском данных, где все данные не будут нулевыми. В этом случае полосы данных, созданные с помощью этих дисков, не должны удовлетворять требованиям согласованности данных. То есть данные кодирования в каждой полосе частот, вычисленные в соответствии с определенными правилами, не согласуются с данными кодирования в полосе частот. Такие полосы, несовместимые с данными, создают большой риск для корректности данных RAID.
По этой причине при создании RAID необходимо предусмотреть инициализацию всех полос в системе, чтобы обеспечить непротиворечивость данных в полосах. Инициализация полосы обычно может быть решена двумя способами:
1. Инициализирует все полосы в системе RAID, записывая общий ноль. Все данные нулевой полосы, ее контрольные данные также равны нулю. Таким образом, полностью нулевые данные могут гарантировать согласованность полос.
2. Проверьте все полосы и обновите контрольные данные в полосах, чтобы добиться согласованности данных полос.
При инициализации системы RAID данные во всех диапазонах становятся согласованными. Процесс инициализации системы RAID — очень длительный процесс, в основном из-за необходимости инициализировать все диапазоны в системе. Баланс производительности между внешним пользовательским вводом-выводом, поэтому инициализация системы RAID часто является фоновым процессом выполнения, который будет длиться долгое время и влиять на производительность интерфейсных приложений.
Для SSD процесс инициализации системы RAID также создает другие проблемы. Во время инициализации системы данные должны быть записаны на SSDS, независимо от режима записи с нулевой записью или обновления данных с контролем четности. Этот процесс приводит к ненужному увеличению записи данных. Перед записью пользовательских данных таблица отображения данных создается внутри SSD путем инициализации. Срок службы и производительность SSDS сокращаются. Следовательно, система RAID для SSD должна быть оптимизирована для процесса инициализации системы, что является особой функцией, которую традиционный RAID не принимает во внимание. Поэтому традиционные RAID-массивы нельзя напрямую развернуть на SSD, что влияет на срок службы и производительность SSD.
Системы RAID используют чередование для защиты данных, но в процессе защиты данных с чередованием возникает ряд проблем. Инициализация системы — типичная проблема согласованности полос. Хорошая система защиты данных RAID решит эту проблему в процессе проектирования. Например, EMC Data Domain RAID не имеет процесса инициализации системы, конечно, он должен взаимодействовать с файловой системой, и была проведена большая оптимизация распределения данных полосы RAID.