Рівні RAID: 0, 1, 2, 3, 4, 5, 6, 7… Що вони означають?
Зберігання даних вимагає наявності безпечного та захищеного сховища, який має значний доступний внутрішній дисковий простір та здатний уберегти будь-яку інформацію від пошкодження, або випадкової втрати. Масив RAID повною мірою відповідає заявленим вимогам, і далі ми докладніше зупинимося на його описі, принципах роботи, доступних варіантах кінцевого конструктивного виконання, перевагах та окремих недоліках.
- Вступ
- Як працює «RAID»?
- «RAID-контролер»
- Рівні «RAID»
- Переваги «RAID»
- Недоліки використання «RAID»
- Історія «RAID»
- Майбутнє «RAID»
- Висновок
- Питання та відповіді
- Коментарі
Вступ
Однією з затребуваних технологій, доступною на даний момент, безумовно є RAID (надлишковий масив незалежних дисків) – це спосіб зберігання одних і тих же даних у різних місцях, на декількох жорстких дисках або твердотільних накопичувачах, що запобігає можливій втраті даних у разі непередбаченого збою одного із дискових носіїв. Незважаючи на те, що основною метою технології віртуалізації дисків RAID є забезпечення надійного способу зберігання інформації, не всі моделі масивів налаштовані на забезпечення надмірності, що дозволяє повертати втрачені компоненти. І далі ми докладніше розглянемо принципи функціонування та доступні варіанти «RAID».
Як працює «RAID»?
Головний принцип роботи «RAID», полягає в розміщенні даних користувача на декількох дисках. Даний підхід дозволяє операціям введення-виводу («I/O»), безпосередньо пов’язаними з передачею даних на комп’ютер або з комп’ютера, збалансованим чином перекривати один одного, суттєво покращуючи підсумкову продуктивність. Оскільки використання декількох дисків це технологічна умова, яка закладена в системі «RAID» за промовчанням, вона збільшує середній час між відмовами «MTBF» («Mean Time Between Failures») – це показник надійності апаратного продукту або компонента, значення якого для більшості елементів зазвичай становить тисячі або навіть десятки тисяч годин між відмовами. Наприклад, для жорстких дисків середній час напрацювання на відмову може варіюватися в межах 300000 годин), надмірне зберігання даних, як наслідок, підвищує відмовостійкість. Цей критерій надійності має величезне значення, оскільки відповідає за здатність системи забезпечувати безперебійне обслуговування «RAID» та запобігати збою, незважаючи на відмову одного або декількох компонентів.
«RAID-масиви» відображаються в операційній системі у вигляді єдиного логічного диска і, залежно від обраної специфікації, використовують методи дзеркалювання або чергування дисків. Функція дзеркалювання копіює ідентичні дані більш ніж на один диск доступного масиву, що дозволяє повернути втрачені дані, при виходу з ладу окремого накопичувача. Чергування розділів допомагає розподіляти інформаційні матеріали кількома дисками. Дисковий простір кожного диска, безпосередньо призначений для зберігання, розділений на блоки відповідно до єдиного розміру від сектора («512 байт») до кількох мегабайт. І заповнення інформацією блоків відбувається адресно та по черзі, внаслідок чого значно підвищується загальна швидкість та продуктивність. Варіанти дзеркалювання та чергування можуть виступати як окремими рівнями RAID, так і бути об’єднаними в єдиний загальний масив з різними внутрішніми параметрами.
В однокористувацькій системі, де зберігаються великі записи, блоки зазвичай встановлюються невеликих розмірів (можливо, «512 байт»), щоб один запис був розташований на всіх доступних дисках і до нього можна було швидко отримати доступ, здійснюючи операцію читання одночасно з усіх дисків.
У розрахованій на багато користувачів системі, для підвищення продуктивності потрібен досить великий одиничний блок, що дозволяє розміщувати записи типового або максимального розміру, а також, здійснювати дискові операції введення-виведення даних, що перекриваються між задіяними накопичувачами.
«RAID-контролер»
Контролер «RAID» є спеціалізованим пристроєм, який застосовується для керування жорсткими дисками у відтвореному масиві зберігання. Він може використовуватися як інструмент взаємодії між операційною системою та фізичними дисками, представляючи групи задіяних накопичувачів як логічні одиниці. Використання контролера «RAID» може підвищити продуктивність та допомогти захистити дані у разі збою або виходу з ладу окремого носія.
«RAID-контролер» може бути представлений як у вигляді апаратного засобу, так і реалізований програмно за допомогою відповідних сервісних системних програм. В апаратному варіанті виконання «RAID», фізичний контролер безпосередньо керує масивом, підтримує різноманітні стандарти фізичного підключення та передачі даних, такі як «SATA» та інтерфейс SCSI.
У програмному RAID-масиві контролер використовує ресурси апаратної системи, як центральний процесор та оперативна пам’ять. Незважаючи на те, що він виконує ті ж функції, що і апаратний RAID-контролер, програмний RAID-контролер» не завжди здатний забезпечити значне підвищення продуктивності, що може впливати на продуктивність інших програм на сервері.
Оскільки програмний «RAID» обробляється за рахунок внутрішніх можливостей пристрою, він повільніший за апаратний «RAID». Однак, оскільки апаратний варіант вимагає придбання додаткового обладнання, програмний RAID коштує дешевше.
Якщо програмна реалізація дискового простору «RAID» несумісна з завантажувальним процесом системи, а апаратні «RAID-контролери» занадто дорогі, то як прийнятний варіант можна розглянути організацію «RAID»-масиву на основі драйверів або мікропрошивки.
У мікропрограмному варіанті «RAID-контролер» вбудований в материнську плату сервера, а всі операції виконуються центральним процесором (аналогічно програмному «RAID»), і після завантаження операційної системи драйвер контролера переходить на забезпечення функцій RAID. Вбудований RAID-контролер не такий дорогий, як його апаратний аналог, винесений в окремий пристрій, але він збільшує навантаження на процесор комп’ютера, що може позначитися на загальній продуктивності.
Рівні «RAID»
«RAID» пристрої, відповідно до встановленої специфікації, будуть використовувати різні версії організації спільного дискового простору, які називаються рівнями. В оригінальній класифікації, яка описує безпосередньо термін «RAID» та концепцію його встановлення, визначено шість рівнів «RAID» – від «0» до «5». Подібна проста пронумерована система дозволила комп’ютерним фахівцям розрізняти між собою версії побудови масивів RAID. Однак, кількість існуючих рівнів з того часу збільшилася і, для зручності, варіанти рівнів «RAID» були розділені на три основні категорії: «базові», «комбіновані» та «нестандартні». Далі ми розглянемо кожну категорію докладніше та ознайомимося з її основними представниками.
Базові рівні «RAID»
Базові рівні RAID | Характеристики |
---|---|
RAID 0 | Дані розподіляються між дисками без відмовостійкості; висока швидкість, але відсутність резервування. Якщо один диск виходить з ладу, дані втрачаються. |
RAID 1 | Дублювання даних на двох дисках; висока відмовостійкість. Якщо один диск виходить з ладу, дані залишаються доступними на іншому. |
RAID 2 | Використовує бітове чергування з кодами Хеммінга для виправлення помилок; рідко використовується через високу вартість та складність. |
RAID 3 | Дані розподіляються по дисках з використанням одного диска для зберігання контрольних сум; підходить для великих файлів, але не підтримує паралельний доступ. |
RAID 4 | Схожий на RAID 3, але використовує блокове чергування; також має один диск для контрольних сум, але може підтримувати паралельний доступ до даних. |
RAID 5 | Дані та контрольні суми чергуються між усіма дисками; висока швидкість та відмовостійкість. Може витримувати один диск, що вийшов з ладу. |
RAID 6 | Схожий на RAID 5, але з двома наборами контрольних сум; забезпечує ще вищу відмовостійкість і може витримувати вихід з ладу двох дисків одночасно. |
«RAID 0»
«RAID 0» (чергування дисків) – цей рівень задіює процес поділу масиву даних на одиничні блоки, з подальшим їх розподілом по кількох пристроях зберігання, таким як жорсткі диски («HDD») або твердотільні накопичувачі («SSD»), об’єднаних у групу. Блоки розподіляються послідовно та містять кожну свою частину даних на окремому диску.
Оскільки чергування розподіляє дані по великій кількості фізичних дисків, декілька дисків можуть отримати доступ до вмісту файлу, що дозволяє швидше виконувати операції запису та читання відповідно. Однак, на відміну від інших рівнів, RAID 0 не має парності. Чергування дисків без даних парності, в свою чергу, немає надмірності чи відмовостійкості. Це означає, що у разі збою диска всі дані на ньому будуть втрачені.
Системи зберігання виконують чергування дисків по-різному. Система може чергувати дані на рівні байтів, блоків або розділів, чи чергувати дані на всіх або деяких дисках кластера. Наприклад, система зберігання з десятьма жорсткими дисками може розділити блок розміром «64 кілобайти» («КБ») на першому, другому, третьому, четвертому та п’ятому дисках, а потім почати знову з першого диска. Інша система може видалити «1 мегабайт» («МБ») даних на кожному з десяти дисків, перш ніж повернутися на перший диск, щоб повторити процес.
«RAID 0» найкраще використовувати для сховища, наявність захисту від втрати даних у якому не є критичною, але потрібна підтримка високошвидкісного режиму читання та запису. Кешування потокового відео в реальному часі та редагування відео композицій – основні сфери застосування рівня побудови масиву RAID 0, через затребуваність у підвищених показниках швидкості та продуктивності. Чергування дисків без надмірності даних також може бути використане для тимчасових даних або в ситуаціях, коли основна копія даних легко відновлюється з іншого пристрою для зберігання.
«RAID 1»
Дзеркальне відображення дисків, також відоме як «RAID 1», є обов’язковим розміщенням даних на два або більше дисків, що становлять єдиний масив, з подальшою синхронізацією вмісту копій. Однак, функція чергування в даному варіанті побудови масиву пристроїв відсутня. Дзеркальне відображення диска – хороший вибір для програм, що вимагають високих значень продуктивності та доступності. Наприклад, відповідальних за фінансові операції, надсилання та отримання електронної пошти, функціонування операційної системи. Дзеркальне відображення успішно працює як з жорсткими дисками, так і з твердотілими накопичувачами.
Оскільки кожен диск, що входять до масиву, знаходиться в робочому стані, дані можуть зчитуватися з них одночасно, що значно збільшує швидкість читання. Масив RAID 1 буде повноцінно функціонувати навіть якщо залишиться працездатним тільки один диск. Проте операції запису будуть повільнішими, тому що кожна операція запису виконується окремо для кожного диска (у разі наявності масиву з двох дисків запис буде виконано двічі).
Дзеркальне копіювання дисків особливо корисне для сценаріїв аварійного відновлення, оскільки забезпечує миттєве відновлення необхідних для критично важливих програм даних, відразу після відмови диска. Якщо первинні диски в масиві пошкоджені або не можуть бути використані, відбудеться перемикання на вторинні або дзеркальні резервні диски, які мають працездатні копії, і функціонування додатків, що звертаються до затребуваних даних, не буде порушено.
«RAID 2»
Ця конфігурація сховища даних використовує чергування дисків, додатково до якого виділено деякі окремі диски, які зберігають інформацію про перевірку та виправлення помилок (ECC). Цей код виправлення помилок дозволяє проводити аналіз даних які зчитуються або пересилаються, і, при необхідності, виправляти їх безпосередньо під час передачі. «RAID 2» також використовує виділену парність коду Хеммінгу для виявлення та корекції помилок. Але, оскільки сучасні жорсткі диски також використовують контрольований код Хеммінга, то рівень «RAID 2» тепер вважається застарілим. Додатково варто зазначити, що RAID 2 не має переваг перед наступним варіантом організації дискового масиву RAID 3, і тому більше не використовується.
«RAID 3»
Цей єдиний формат організації дискового масиву, який використовує чергування та виділяє один диск, з доступного об’єднання накопичувачів, для зберігання інформації про парність, яка відповідальна за перевірку цілісності за допомогою визначення, чи були дані втрачені або перезаписані при безпосередньому переміщенні з одного місця сховища до іншого, або під час передачі між комп’ютерами. Вбудована інформація ECC використовується для виявлення помилок, а відновлення даних здійснюється шляхом розрахунку ексклюзивної інформації, записаної на інших дисках.
Оскільки інформація про парність знаходиться на окремому диску, а операція вводу-виводу звертається до всіх дисків одночасно, то при виконанні численних невеликих запитів даних RAID 3 не працює належним чином. З цієї причини цей масив найкраще підходить для однокористувацьких систем з тривалою послідовною передачею даних, таких як: обробка та передача потокових мультимедійних ресурсів, графічних матеріалів або виконання операцій з редагування відео композицій, тощо.
«RAID 4»
Ця конфігурація масиву «RAID» використовує виділений диск парності та чергування на рівні блоків між кількома дисками, що дозволяє користувачам здійснювати операції читання/запису з будь-якого окремого диска. Однак, оскільки всі записи повинні йти на виділений диск парності, продуктивність цього процесу суттєво знижена. Варіанти RAID 4, а також представлені раніше RAID 3 та RAID 2, в сучасних системах зазвичай не використовуються.
«RAID 5»
Надлишковий масив конфігурації незалежних дисків подібного формату, заснований відповідно до принципу чергування на рівні блоків парності. Дані та інформація про парність розподіляються рівномірно по всіх дисках, що тягне за собою зниження критичної вразливості окремого накопичувача з організованого об’єднання, і дозволяє масиву «RAID 5» функціонувати навіть у разі збою якогось одного диска, а також відновити втрачені з проблемного пристрою дані за рахунок чергування. У «RAID 5» інформація про парність зберігається по діагоналі на всіх дисках масиву. У разі відмови одного з дисків, вихідні дані розраховуються на основі інформації про парність, що залишилася на решті діючих пристроїв набору.
Переваги «RAID 5», в першу чергу, полягають у його спільному використанні чергування дисків та парності, що дозволяє досягти суттєвого підвищення пропускної спроможності та продуктивності спільно з високим рівнем надійності.
Архітектура масиву «RAID 5» дозволяє рівномірно і збалансовано виконувати операції читання та запису на кількох дисках, і на даний час, даний вид масиву є одним із начастіше використовуваних типів «RAID». Він має більш корисне сховище, ніж конфігурації RAID 1 та RAID 10, і забезпечує рівень працездатності, який еквівалентний параметрам масиву «RAID 0». Групи RAID 5 мають мінімум три жорсткі диски (HDD), але часто, з міркувань ефективності, рекомендується використовувати як мінімум п’ять дисків. Оскільки дані про парність розподілені по всіх дисках, «RAID 5» вважається однією з найбезпечніших конфігурацій «RAID».
Масиви RAID 5 зазвичай вважаються поганим вибором для використання в системах з інтенсивним записом, через вплив на продуктивність, що пов’язано із записом даних парності. Коли диск виходить з ладу, відновлення масиву «RAID 5» може тривати багато часу.
«RAID 6»
Цей формат організаційної побудови об’єднаного дискового простору, також відомий як «RAID з подвійним контролем парності», дуже схожий на попередній рівень – «RAID 5», але додатково включає в себе другу схему парності, діагонально розподілену дисками в масиві. Архітектурна побудова «RAID 6» є однією з кількох схем «RAID», яка функціонує, розміщуючи дані на декількох дисках і дозволяючи операціям вводу/виводу («I/O») перекриватися збалансованим чином. Використання додаткової парності дозволяє масиву продовжувати своє функціонування, навіть якщо два диски виходять з ладу одночасно. Однак, підвищений рівень захищеності впливає у бік зниження на продуктивність масиву, яка нижча ніж у «RAID 5».
Надлишковий масив дисків «RAID 6» забезпечує дуже високу стійкість до відмов і може використовуватися в середовищах, де потрібен тривалий період зберігання даних, таких як архівування.
Комбіновані рівні «RAID»
Деякі рівні «RAID» належать до категорії комбінованих. Дані зразки побудови являють собою варіативне поєднання вже існуючих базових рівнів RAID. І далі ми розглянемо декілька прикладів найпоширеніших та найпопулярніших комбінованих масивів.
Комбіновані рівні RAID | Характеристики |
---|---|
RAID 10 (RAID 1 + 0) | Комбінація RAID 1 і RAID 0; забезпечує високу швидкість і відмовостійкість. Дані дублюються (RAID 1) і розподіляються (RAID 0) між декількома дисками. |
RAID 01 (RAID 0 + 1) | Дані спочатку розподіляються (RAID 0) і потім дублюються (RAID 1); менш відмовостійкий, оскільки втрата одного з дисків в наборі RAID 0 може призвести до втрати всього масиву. |
RAID 03 (RAID 0 + 3, RAID 53 або RAID 5 + 3) | Поєднує RAID 0 для швидкості та RAID 3 для контролю помилок; дані чергуються з використанням одного диска для контрольних сум. Підходить для великих файлів, але має обмежений паралельний доступ. |
RAID 50 (RAID 5 + 0) | Поєднує RAID 5 для відмовостійкості та RAID 0 для швидкості; дані чергуються та мають контрольні суми, забезпечуючи баланс між продуктивністю та надійністю. |
«RAID 10» («RAID 1 + 0»)
«RAID 10», також відомий як «RAID 1 + 0», є конфігурацією «RAID», яка об’єднує для захисту даних дзеркалювання диска та чергування дисків. Потрібно щонайменше чотири диски, в яких дані чергуються на дзеркальних парах. Поки один диск у кожній дзеркальній парі функціонує, дані можуть бути вилучені. У разі збою двох дисків в одній дзеркальній парі – всі дані будуть втрачені через відсутність парності.
Конфігурація RAID 1 забезпечує лише захист даних шляхом копіювання всієї інформації з одного диска на інший. Дані повністю захищені, оскільки дзеркальна копія доступна, якщо вихідний диск вимкнено або пошкоджено. Оскільки дані повністю дублюються, масив RAID 1 вимагає вдвічі більше ємності, ніж необхідно для вихідних даних. «RAID 0» не забезпечує жодного захисту даних, і його основна мета полягає у підвищенні продуктивності. Це досягається шляхом розподілу даних по двох або більше дисках, щоб кілька головок читання/запису на дисках могли одночасно записувати або отримувати доступ до частин даних, що прискорює їх обробку.
«RAID 10» забезпечує надмірність даних та підвищує продуктивність, і безумовно є хорошим варіантом для додатків з інтенсивним введенням-виведенням даних, включаючи електронну пошту, віддалені сховища та бази даних, та операцій, що потребують високої продуктивності диска та організацій, простої у функціонуванні яких виключені.
Висока ефективність «RAID 10» та її здатність прискорювати як операції запису, так і читання, роблять його придатним для часто використовуваних, критично важливих, серверів баз даних. Однак, мінімальні вимоги щодо комплектації в кількості чотирьох дисків, роблять «RAID 10» дорогим вибором для невеликих обчислювальних середовищ, оскільки це спричиняє стовідсоткове навантаження на сховище, що може бути надто витратним для малого бізнесу або для особистого використання.
«RAID 01» («RAID 0 + 1»)
Комбінований формат конструкційної побудови дискового простору «RAID 0 + 1» – аналогічний до «RAID 1 + 0», за одним винятком. Замість чергування дзеркальних масивів, сукупний рівень «RAID 0 + 1» створює масив типу «RAID 1», що складається з двох вкладених масивів типу «RAID 0». Цей формат передбачає використання парної кількості дисків. Загальний рівень продуктивності та, закладеної можливостями масиву, ефективності об’єднання пристроїв «RAID 01», у порівнянні зі зразком «RAID 10», при однакових параметрах практично ідентичний, але відмовостійкість варіанта «RAID 01» дещо нижче, тому цей вид масиву практично не використовується.
«RAID 03» («RAID 0 + 3», «RAID 53» або «RAID 5 + 3»)
Тип комбінованого масиву дисків використовує чергування (в стилі базового рівня «RAID 0») для блоків віртуальних дисків конструктивного формату «RAID 3». Цей тип забезпечує більш високу продуктивність, ніж у масиву «RAID 3», проте суттєво впливає на кінцеву вартість у бік її збільшення.
«RAID 50» («RAID 5 + 0»)
Ця конфігурація поєднує у собі розподілену парність «RAID 5» з чергуванням «RAID 0», для підвищення продуктивності задіяного варіанта «RAID 5» без зниження захисту даних. Конструктивно, архітектура масиву вимагає повноцінного функціонування наявності щонайменше шести дисків. Порядок організації сукупного дискового простору на основі масиву RAID 50 забезпечує набагато кращу продуктивність запису, підвищений захист даних і швидше відновлення, ніж базовий рівень RAID 5. Продуктивність та сумарна ефективність не знижуються так сильно, як у масиві RAID 5, оскільки один збій впливає тільки на один масив. Сукупно, можна подолати до чотирьох відмов дисків, якщо кожен диск, що не відповідає, знаходиться в окремому масиві «RAID 5». Недоліком RAID 50 є лише той факт, що масиву потрібен складний контролер. Найкращий варіант використання «RAID 50» передбачає його залучення для додатків, які потребують високої надійності.
Нестандартні рівні «RAID»
Головною відмінністю зазначених рівнів масивів від базових типів «RAID», безумовно є їх безпосередні розробки, окремими компаніями або організаціями, і подальше використання унікальної конфігурації «RAID», яка є авторською власністю творців, у пропрієтарних цілях. І далі ми наведемо декілька таких прикладів.
Нестандартні рівні RAID | Характеристики |
---|---|
RAID 7 | Комерційний рівень RAID, який використовує кеш-пам’ять для підвищення швидкості доступу. Включає динамічне балансування навантаження та підтримує відмовостійкість. |
Адаптивний RAID | Системи, що адаптуються до змін у навантаженні та конфігурації, дозволяючи налаштовувати RAID масиви в реальному часі для оптимізації продуктивності. |
Linux MD RAID 10 | Використовує функціональність Linux для створення RAID 10; забезпечує високий рівень відмовостійкості та продуктивності, поєднуючи переваги RAID 0 і RAID 1. |
«RAID 7»
Нестандартний рівень RAID, торгова марка якого належить компанії Storage Computer Corporation. Масив конструктивно виконаний на основі базових рівнів RAID 3 та RAID 4 з додаванням операції кешування. «RAID 7» включає вбудовану операційну систему реального часу як контролера, відповідальну за запуск коду для виконання закладених функцій, кешування по високошвидкісній шині з використанням оперативної пам’яті та інші характеристики для керування доступом до диска та потоком даних.
Адаптивний «RAID»
Цей варіант організаційної побудови масиву надає «RAID-контролеру» пріоритетне право визначати порядок збереження парності на дисках. Прийняття рішення ґрунтуватиметься на порівнянні двох рівнів «RAID 3» та «RAID 5», і безпосередньо залежатиме від того, який тип «RAID-набору» працюватиме краще з типом даних, що записуються на диски.
«Linux MD RAID 10»
Пропонований рівень, наданий ядром «Linux», підтримує створення комбінованих та нестандартних «RAID-масивів» і дозволяє керувати «RAID-пристроями» за допомогою відповідного функціонального прикладного інструментарію. Програмний «RAID» для «Linux» також може підтримувати створення стандартних конфігурацій, таких як «RAID 0», «RAID 1», «RAID 4», «RAID 5» та «RAID 6».
Переваги «RAID»
Безумовно, технологія надлишкових масивів незалежних дисків RAID має ряд переваг, і далі ми виділимо перелік основних з них.
-
Підвищення економічної ефективності, оскільки у великих кількостях використовуються недорогі накопичувачі на жорстких магнітних дисках.
-
Сукупне використання кількох жорстких дисків дозволяє «RAID» підвищити продуктивність кожного одиничного елемента підсумкового масиву.
-
Збільшення швидкості та надійності комп’ютера, а також захищеності даних після збою однієї з дискових складових «RAID-сховища», залежно від конфігурації.
-
Операції читання та записування даних з використанням масиву формату «RAID 0», можуть виконуватися значно швидше, ніж на одиничному жорсткому диску. Збільшення та приріст швидкісних показників досягається за рахунок конструктивної організації масиву, що дозволяє рівномірно розподіляти та розділяти по дисках інформаційні блоки даних з подальшим спільним до них зверненням.
-
При використанні масиву «RAID 5» підвищується доступність, виражена у збільшенні тривалості безпомилкової роботи, та відмовостійкість.
-
Задіяння функції дзеркалювання дозволяє «RAID-масивам» мати повністю ідентичну копію оригінальних даних на окремому диску та гарантує, що один із накопичувачів продовжить працювати у разі збою або незворотного пошкодження іншого.
Недоліки використання «RAID»
Незважаючи на наявність багатьох дійсно затребуваних і важливих переваг, у RAID-масивів також є й недоліки. Деякі з них представлені в наступному списку.
-
Комбіновані рівні «RAID» дорожчі в реалізації, ніж традиційні базові рівні «RAID», оскільки для їх організації потрібна більша кількість дисків.
-
Вартість комбінованого варіанта «RAID-масиву» у перерахунку на одиницю зберігання даних (гігабайт) – вища, оскільки багато дисків використовуються для резервування.
-
Коли відбувається збій диска, ймовірність того, що інший диск у масиві також скоро вийде з ладу зростає, що може призвести до суттєвої втрати даних. Це випливає із твердження, що всі диски в «RAID-масиві» часто монтуються одночасно, належать одній партії та мають єдині функціональні характеристики, тому схильні до однакового зносу і мають ідентичний тимчасовий та ресурсний інтервал безвідмовної роботи.
-
Деякі рівні «RAID» (наприклад, «RAID 1» та «RAID 5») можуть витримати відмову лише одного накопичувача.
-
Масиви «RAID», та розміщені там дані, перебувають у вразливому стані доти, доки несправний диск не буде замінений, а новий диск не заповнений.
-
Оскільки сучасні зразки запам’ятовуючих пристроїв мають набагато більшу початкову ємність, ніж у період першого впровадження масивів RAID, то для відновлення несправних дисків потрібно набагато більше часу.
-
Якщо відбувається збій диска, то існує ймовірність, що накопичувачі масиву, що залишилися, можуть містити пошкоджені сектори або нечитані дані, здатні призвести до подальшої неможливості здійснити повне відновлення втраченої інформації.
Незважаючи на потенційні недоліки, комбіновані рівні «RAID» здатні вирішувати перелічені проблеми за рахунок забезпечення більшої міри надмірності, тим самим значно знижуючи ймовірність збою на рівні масиву через одночасні відмови дисків.
Історія «RAID»
Термін RAID був запроваджений і вперше задіяний у 1987 році Девідом Петтерсоном (David A. Patterson), Ренді Кацем (Randy H. Katz) і Гартом А. Гібсоном (Garth A. Gibson). У своєму технічному звіті від 1988 року вони стверджували, що масив недорогих дисків може перевищити продуктивність кращих дисків того часу і суттєво перевершити за обсягом, швидкістю та стійкістю найдорожчі екземпляри. А використовуючи надмірність, «RAID-масив» може бути надійнішим, ніж будь-який інший диск.
У той час цей звіт був першим свідченням, де офіційно згадується загальна назва концепції RAID. Проте використання надлишкових дисків вже обговорювалося раніше іншими фахівцями. Гас Герман і Тед Грунау з «Geac Computer Corporation» вперше згадали ідею і представили її у форматі «MF-100». Норман Кен Оучі з IBM подав патент у 1977 році на технологію, яка згодом отримала назву RAID 4. У 1983 році «Digital Equipment Corporation» представила диски, які потім отримають найменування «RAID 1», а в 1986 році був поданий ще один патент «IBM» на формат, який стане рівнем RAID 5. Петтерсон, Кац та Гібсон також додатково вивчали, що пропонують такі компанії, як «Tandem Computers», «Thinking Machines» і «Maxstor», для визначення поняття та параметрів специфікації «RAID».
Незважаючи на те, що рівні RAID, які перелічені у звіті 1988 року, по суті дають назви технологіям, які вже використовуються, створення загальної термінології для даної концепції допомогло стимулювати ринок зберігання даних до розробки більшої кількості продуктів для «RAID-масивів».
За словами Каца, термін «недорогий» («Inexpensive») у початковому варіанті абревіатури («Redundant Array of Inexpensive Disks») незабаром був замінений на «незалежний» («Independent») галузевими продавцями, тому що діапазон застосовуваних дисків був суттєво розширений і представлений різноманітними, за своїми можливостями та характеристиками, зразками.
Майбутнє «RAID»
Надлишковий масив незалежних дисків RAID не зовсім втратив свою актуальність, але багато аналітиків сходяться на думці, що в останні роки ця технологія віртуалізації даних застаріла. У міру збільшення ємності диска, яка постійно зростає за рахунок впровадження нових технологій та конструкційних рішень, автоматично підвищується ймовірність розвитку різноманітних видів помилок із масивом RAID. З метою усунення можливих недоліків масивів, використовуються інші альтернативні варіанти, одним з яких є технологія «Стираючий код» («Erasure code»), що забезпечує кращий захист даних (хоча і за більш високою ціною), та надає можливість відновити дані у разі їх пошкодження чи втрати.
Зростання кількості твердотільних накопичувачів («SSD») також впливає на зниження затребуваності користувачами масивів «RAID». «SSD» не мають рухомих частин і не виходять з ладу так часто, як жорсткі диски. У масивах на основі дисків «SSD» часто використовуються такі алгоритми, як, наприклад, вирівнювання зносу. Інфраструктура гіпермасштабних обчислень, що встановлює найвищі стандарти продуктивності та доступності, часто асоціюється з хмарними обчисленнями та величезними центрами обробки даних, також усуває необхідність у «RAID» масивах, надаючи резервні сервери як альтернативну заміну надлишкових дисків.
Тим не менше, «RAID» залишається укоріненою частиною сховища даних, і великі постачальники технологій все ще випускають продукти «RAID». «IBM» випустила технологію «IBM Distributed RAID» зі своїм програмним забезпеченням «Spectrum Virtualize V7.6», який обіцяє підвищити продуктивність масиву та ефективність зберігання даних у середовищах, де сервер IBM є основним сховищем. Остання версія технології «Intel Rapid Storage» підтримує «RAID 0», «RAID 1», «RAID 5» та «RAID 10», а програмне забезпечення для управління «NetApp ONTAP» використовує «RAID» для захисту від трьох одномоментних відмов дисків. Платформа «Dell EMC Unity» також підтримує «RAID 1/0», «RAID 5» та «RAID 6».
Висновок
Технологія «RAID» стрімко розвивається і доповнюється новими зразками готових масивів дисків, які мають кожен власні переваги та недоліки, а також розраховані на використання у певних пріоритетних областях можливого застосування.
Використовуючи відомості з цього посібника, користувачі зможуть розібратися в понятті надмірного масиву дисків, отримати уявлення про різноманітність доступних рівнів «RAID» та визначити для себе найбільш прийнятний варіант кінцевого конструкційного виконання масиву, виходячи з персональних потреб та доступних можливостей.