Ads by Google

Šta je RAID tehnologija i pregled konfiguracija

Šta je RAID tehnologija

RAID (prvobitno Redundant Array of Inexpensive Disks, danas više poznato kao Redundant Array of Independent Disks) je tehnologija skladištenja podataka gde se kombinuje više fizičkih diskova u jednu logičku celinu, a u cilju redudantnosti podataka, poboljšanja performansi ili oboje. Organizacija podataka na diskovima je standardizovana kroz RAID nivoe. U ovom članku će biti predstavljeni osnovne RAID konfiguracije, kao i pregled primena RAID nivoa.

Pre početka opisa nivoa, da pomenemo i legendu i termine koje ćemo korisiti kroz tekst. Blocks su blokovi diska, ECC predstavlja Hamming Error Correction Code, potom slede bajtovi, bitovi i unos za parnost:

RAID configurations legend

RAID tehnologiju su razvili David Patterson, Garth Gibson, i Randy Katz, 1987. godine na Berkeley univerzitetu. Zamišljena je kao jeftina alternativa za aktuelnu DASD tehnologiju.

Šta je RAID nivo 0

Kod RAID nivoa 0 neophodna su najmanje dva diska. Upis podataka u blokove u ovom slučaju ide na “cik-cak”: blok A se nalazi na prvom disku, blok B na drugom disku i tako dalje, što se vidi sa sledeće slike:

RAID level 0 configuration diagram

Osobine:

  • odlične performanse, pošto su blokovi “razdeljeni” (eng. striped),
  • nema redundantnosti, te se ne preporučuje kod sistema gdje je bitna pohrana podataka već performanse,
  • otkaz jednog diska u RAID polju, utiče na pad celog polja,
  • kapacitet rezultujućeg logičkog diska je jednak sumi kapaciteta diskova koji ga čine.

Šta je RAID nivo 1

Kod RAID nivoa 1 neophodna su najmanje dva diska. Upis podataka u blokove u ovom slučaju ide u vidu preslikavanja: blok A se nalazi na prvom disku, a taj blok A se preslikava i na drugi disk, i tako dalje, što se vidi sa sledeće slike:

RAID level 1 configuration diagram

Osobine:

  • zadovoljavajuće performanse,
  • odlična redundantnost; u slučaju otkazivanja jednog diska, svi podaci su identično preslikani (eng. mirrored) na drugom disku,
  • ukupni kapacitet RAID polja je jednak kapacitetu najmanjeg diska u polju,
  • ukoliko je bitna pouzdanost podataka, a ukupni kapacitet polja nije od velikog značaja, ova konfiguracija je dobar izbor.

Šta je RAID nivo 2

Kod RAID nivoa 2 su neophodne dve grupe diskova; podaci nisu razdeljeni po blokovima nego po bitovima. Šematski pregled se vidi sa sledeće slike:

RAID 2 configuration diagram

Osobine:

  • koristi se Hamingov algoritam za ispravku grešaka (ECC), kako bi se ove informacije pohranile u redundantnim ECC diskovima. ECC kod se generiše “u letu”, prilikom zapisivanja podataka,
  • prilikom čitanja podataka iz diskova za podatke, takođe se čitaju i redundantni diskovi kako bi se uočilo ima li grešaka (tj. da li su podaci konzistentni); ukoliko podaci nisu konzistentni, ispravke se takođe vrše “u letu”,
  • grupe ne moraju imati jednak broj diskova; recimo možemo imati konfiguraciju sa 10 diskova za podatke i 4 diska za ECC. Ili konfiguraciju sa 4 diska za podatke i 3 diska za ECC,
  • iako teorijski značajno da se pomene, ne koristi se u praksi jer je skupo (potreban veći broj diskova), i zahteva kompleksan RAID kontroler. Takođe, ECC nema neku značajnu prednost u odnosu na parnost.

Šta je RAID nivo 3

Kod RAID nivoa 3 takođe postoji grupa diskova za podatke, a samo se jedan koristi za izračunavanje parnosti (eng. parity); podaci nisu razdeljeni po blokovima, niti po bitovima, već po bajtovima. Šematski pregled se vidi sa sledeće slike:

RAID 3 configuration diagram

Osobine:

  • diskovi treba da se “vrte” sinhronizovano kako bi se dobili podaci.
  • svi diskovi učestvuju u izvršenju svakog zahteva,
  • zahteva se samo jedan redundantni disk, bez obzira na veličinu niza. Umesto ECC koda, proračunava se jednostavan bit parnosti za skup bajtova na istoj poziciji na svim diskovima za podatke (preko čega se mogu rekonstruisati podaci u slučaju otkaza nekog diska; prilikom jednog diska, učestvuju svi drugi diskovi za podatke i disk za parnost),
  • takođe se ne koristi u praksi, jer ne može istovremeno da opsluži više zahteva za čitanje/pisanje na disk.

Šta je RAID nivo 4

Kod RAID nivoa 4 takođe postoji grupa diskova za podatke, i samo se jedan koristi za izračunavanje parnosti (najmanje 3 diska; dva za podatke i jedan za parnost); podaci nisu razdeljeni niti po bitovima, niti po bajtovima, već po blokovima. Šematski pregled se vidi sa sledeće slike:

RAID 4 configuration diagram

Osobine:

  • zadovoljavajuća nasumična čitanja jer se blokovi razdeljuju na više diskova,
  • loša nasumična upisivanja jer se za svaki upis upisuje i parnost,
  • glavna prednost u odnosu na RAID 2 i RAID 3 je mogućnost paralelnog izvršavanja zahteva: na primer moguće je simultano čitanje bloka A i bloka E (na istim diskovima nije moguće paralelno izvršavanje),
  • takođe se ređe koristi u praksi, jer parnost nije distribuirana (kao kod RAID 5) već je za to namenjen poseban disk.

Šta je RAID nivo 5

Pored RAID 0 i RAID 1, evo još jednog RAID nivoa koji se često koristi u praksi. Da bi konfigurisali RAID 5, neophodno vam je najmanje tri diska. Kao što smo već pomenuli, parnost je distribuirana na diskovima, što se može videti sa sledeće slike:

RAID 5 configuration diagram

Osobine:

  • dobre performanse (podaci su razdeljeni po blokovima),
  • dobra redundantnost (parnost je distribuirana),
  • nudi dobar odnos cene, performansi i pouzdanosti,
  • ukoliko je akcenat na opracijama upisa na disk, smanjuju se performanse.

Šta je RAID nivo 6

RAID nivo 6, za razliku od RAID 5, zahteva minimalno 4 diska i poseduje dvostruku parnost koja je distribuirana na diskovima – što se može videti sa sledeće slike:

RAID 6 configuration diagram

Osobine:

  • veća redundantnost nego kod RAID 5, jer mogu otkazati 2 diska a da ne nastane gubitak podataka u polju,
  • složen je dizajn kontrolera kako bi se proračunala dualna parnost,
  • praktično je za sisteme od kojih se zahteva visoka dostupnost,
  • umanjene performanse prilikom upisivanja podataka (zbog proračuna dualne parnosti).

Šta je RAID nivo 10

Ovom prilikom ćemo predstaviti i dva hibridna ili ugnježdena RAID nivoa (više informacija: nested RAID). Prvi od njih je RAID 10, za koga su neophodna najmanje 4 diska. Podaci su rasuti (striped) na diskove 1 i 3, a koji su istovremeno i preslikani (mirrored): 1–>2 i 3–>4.

RAID 10 configuration diagram

Osobine:

  • odlična redundantnost (svi blokovi su preslikani),
  • odlične performanse (blokovi su razdeljeni),
  • najbolja opcija za kritične aplikacije (baze podataka, na primer),
  • po testovima, pruža najbolje performanse u smislu protoka podataka (rame uz rame sa RAID 0) i latencije.

Šta je RAID 0+1

Ovo je drugi tip ugnježedog RAID-a, kog treba pomenuti. Pregled ostalih hibridnih tipova (RAID nivo 03, 50, 60, 100 … ), pogledajte na Vikipediji. Moguća je i implementacija sa najmanje 3 diska, ali se najčešće susrećemo sa implementacijom od 4 diska:

RAID 01 or RAID 0+1 configuration diagram

Osobine:

  • za razliku od RAID nivoa 10, ovde su podaci rasuti na diskove 1 i 2, a koji su istovremeno i preslikani: 1–>3 i 2–>4; diskovi 1 i 2 formiraju jednu grupu (kao RAID 0), koja se preslikava na diskove druge grupe (RAID 1 preslikava jednu grupu na drugu). Otud naziv RAID 01 ili 0+1,
  • performanse i kapacitet su isti kao kod RAID 10,
  • razlog što se RAID 01 u praksi manje koristi je manji nivo tolerancije na greške nego kod RAID 10
  • ukoliko imamo više diskova, na primer 6: RAID 10 će imati više grupa (3 grupe, gde se pojedinačna grupa sastoji od dva diska koji imaju identične podatke), dok će RAID 01 u ovom slučaju imati manje grupa (2 grupe od po 3 diska). Ukoliko iz svake grupe otkaže po jedan disk, RAID 10 polje neće biti poremećeno, dok će RAID 01 polje puknuti i niz će se rasformirati.

Primer RAID nivoa sa različitim kapacitetom diskova u praksi

Za povezivanje i organizaciju diskova u RAID polju, odgovoran je kontroler. RAID kontroler može biti integrisan na matičnu ploču, dostupan kao zasebna PCI kartica za računare/servere ili rešen softverski.

Iako je poželjno da diskovi (bilo HDD bilo SSD) budu istog kapaciteta (pa i istog modela), moguće je iskoristiti i diskove različitog kapaciteta, s tim da su tada rezultati ukupnog dostupnog kapaciteta logičkog diska malo nepredvidivi. U ovoj sekciji je prikazan primer iz prakse – kakav je rezultat kapaciteta logičkog RAID diska, kada se koriste različiti nivoi RAID polja, a sa 4 fizička diska na PowerEdge serveru.

Da biste konfigurisali RAID, prilikom pokretanja računara je neophodno pritisnuti kombinaciju tastera CTRL + R kako bi se pokrenuo alat za konfiguraciju (Configuration Utility):

Power Edge Expandable RAID Controller BIOS

Na raspolaganju stoje 4 SAS diska, dva su kapaciteta 300 GB, a druga dva 150 GB, a što se ovde vidi manje gigabajta nego što je proizvođač naznačio, pročitajte u ovom članku. Dakle, stvarni kapaciteti su 278.87 GiB odnosno 136.12 GiB:

PERC H700 Integrated BIOS Configuration Utility

Rekli smo da kod RAID polja više fizičkih diskova čine jedan logički disk; u ovom slučaju taj logički disk je opisan terminom virtualni disk (Virtual Disk):

Create new VD item in BIOS: RAID Virtual Disk configuration (logical disk)

Kao što je pomenuto u članku, nije loše znati vrste RAID nivoa, ali i iz ovog primera iz prakse vidimo koje RAID nivoe podržava PowerEdge server, dakle, podržani su samo: RAID-0, RAID-1, RAID-5, RAID-6 i RAID-10, što će vam najčešće i biti potrebno:

How to define RAID level configuration in Power Edge Server

Evo rezultata testa sa ovim diskovima (raspored SAS diskova u serveru ne utiče na rezultujući virtualni disk), po pitanju kapaciteta:

  • RAID 0: 544.50 GiB (kapacitet većih diskova se računa kao kapacitet manjih),
  • RAID 1: 278.87 GiB (RAID 1 je moguć na samo dva diska, ovde smo odabrali dva veća diska),
  • RAID 5: 408.37 GiB (ako želimo redundantnost, ovaj nivo pruža najveći kapacitet za ovaj primer),
  • RAID 6: 272,25 GiB (zbir dva najmanja diska),
  • RAID 10: 272,25 GiB (zbir dva najmanja diska).

 

Ako vam se svideo članak, podelite ga vašim prijateljima.

 

Summary
What is RAID technology and configuration overview
Article Name
What is RAID technology and configuration overview
Description
RAID (originally Redundant Array of Inexpensive Disks, today commonly referred to as Redundant Array of Independent Disks) is a data storage technology that combines multiple physical disks into a single logical unit for the purposes of data redundancy, performance improvement, or both.
Author
www.CreativForm.com