reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Pořiďte si RAID 1 (zrcadlení)

12.1.2005, Eagle , článek
Pořiďte si RAID 1 (zrcadlení)
Nedávno jsme mluvili o (ne)spolehlivosti dnešních pevných disků. Pro klíčová data se ale nabízí jednoduché a přitom levné řešení v podobě RAID polí. Jednoduché zrcadlo RAID 1 si můžete postavit na většině nových základních desek. Dnes se podíváme, jak na to.
Kapitoly článku:
  1. Pořiďte si RAID 1 (zrcadlení)
  2. Postup tvorby RAID1
  3. Když pole selže...

Co je to RAID


RAID je zkratka pro Redundant Array of Independent Disks. V podstatě jde o to, že použitím diskového řadiče se speciálními funkcemi a více pevnými disky zároveň lze získat určité speciální vlastnosti. Jsou to především:
    • rychlost
    • spolehlivost
    • jejich kombinace

Existuje šest typů RAIDových polí, z nichž praktického použití dosáhly tři.

RAID 0 (striping / proužkování) - Data jsou na disky ukládána v určitých blocích prokládaně. Takže například při bloku nastaveném na 4096 bytes (4 kBytes) je soubor o velikosti 16 kBytes rozdělen tak, že první disk disk obsahuje v pořadí prvních a třetích 4096 bytes a druhý disk v pořadí druhých a čtvrtých 4096 bytes.

RAID 1 (mirroring / zrcadlení) - Na disky jsou ukládána naprosto stejná data, druhý disk je tak věrnou kopií prvního disku. V případě poruchy jednoho z disků uživatel nepřichází o data.



Jak již z popisu a schématu vyplývá, účelem RAID 0 je především dosažení vyšší rychlosti. Za to zaplatíte především nízkou spolehlivostí, protože při poruše jednoho disku zbudou pouze liché či sudé bloky, čili přijdete o všechna data (stejně tak při využití více než dvou disků ztráta jedno znamená ztrátu všech dat). Kapacita pole RAID 0 je rovna součtu kapacit jednotlivých disků - to ovšem za předpokladu, že disky mají stejnou kapacitu, v opačném případě totiž není možné využít celou kapacitu většího disku, protože k němu není odpovídající další kapacita na druhou polovinu bloků.

Naproti tomu účelem RAID 1 je spolehlivost. Celková kapacita pole RAID 1 je rovna kapacitě jednoho pevného disku, tedy polovině součtu kapacity dvou pevných disků (opět za předpokladu stejných velikostí). RAID 1 nepřidá na rychlosti (naopak jí může trochu ubrat), ale zajišťuje uživateli velmi vysokou pravděpodobnost, že nepřijde o data.

Mimo těchto dvou typů se uchytil ještě RAID 5, což je pole, kde data jsou distribuovány mezi tři disky (minimálně), přičemž kapacita pole je rovna součtu dvou disků. Zbytková kapacita je využita pro kontrolní součty operace eXclusive-OR (exkluzivní nebo), která je vypočítána takto:





Při poruše jednoho z disků je možné zpětně dopočítat, jaká data obsahoval. Pokud například víme, že jedna z hodnot je 0 a druhá 1 (nezávisle na pořadí), je jasné, že třetí hodnota musí být 1 (0 XOR 1 = 1). Logická operace XOR prováděná na několikabajtovém rozsahu je jednoduchá, umí jí spočítat každý procesor - 486ka jí zvládne za jeden hodinový cyklus, při frekvenci 50 MHz tedy v ideálním případě zvládne 50 milionů těchto operací za vteřinu. Problémem ovšem je, že 1. potřebujete onen procesor na výpočet XOR a 2. potřebujete alespoň tři disky. Tyto důvody zapříčinily, že RAID 5 z levných diskových řadičů podporuje málokterý.


Který RAID si pořídit?


Jste-li ovlivněni médii a přemýšlíte o RAIDu, je jistě základní otázkou, který typ zvolit. Popišme si nyní, kde je nasazení jednotlivých polí vhodné a kde nevhodné:

RAID 0 - Jeho použití je dost diskutabilní, protože pro běžnou práci má nulový či dokonce negativní vliv na výkon. RAID 0 zvýší pouze rychlost sekvenčního čtení a sekvenčního zápisu. Nijak ale nezrychlí rychlost seeku, která je naprosto klíčová pro drtivou většinu aplikací. Naopak, protože například při čtení 20 kBytes při rozdělení po blocích 4 kBytes na jednotlivé disky musí oba seekovat (na stejná místa na plotnách), bude výsledná rychlost seeku tou pomalejší ze dvou disků. RAID 0 proto najde využití pouze v případech, kdy je třeba rychlého zápisu / čtení velkých bloků dat - například při editaci filmů, fotografií, audio nahrávek atp. Pro běžnou práci s operačním systémem je jeho použití naprostý nesmysl a dva nezávislé disky, jeden použitý pro operační systém a druhý pro swap file a programy, poskytují mnohem vyšší reálnou rychlost, větší uživatelský komfort... a samozřejmě v takovém případě při ztrátě jednoho disku nepřijdete o data na disku druhém. Důvodem pro vyšší rychlost dvou nezávislých disků je, že jeden disk seekuje na DLL knihovny Windows a druhý na soubory programů.

RAID 1 - Hodí pro všechny případy, kdy jsou na disk ukládána cenná data. Pokud jste účetní, provádíte finanční analýzu, rozvrhujete plán výroby, pak RAID 1 je přesně pro vás. Administrace RAIDu 1 je jednoduchá, kdykoliv můžete jeden z disků odebrat, kdykoliv můžete synchronizovat stav (o tom více dále). Dopady na výkon jsou závislé na způsobu implementace v řadiči - teoreticky je rychlost zápisu pomalejší, protože je nutné stejná data zapsat na dva disky. Řadič ale může využívat zpožděných zápisů a na druhý (mirror - zrcadlový disk) zapisovat až v okamžiku menšího vytížení. Pokud se druhý disk využívá pouze k zápisu, je rychlost čtení stejná jako u jednoho pevného disku, opět zde ale připadají v úvahu dvě modifikace. První spočívá v čtení z obou disků zároveň a porovnávání čtených dat (v případě rozdílů je nahlášena chyba čtení) - v takovém případě je rychlost čtení tou pomalejší ze dvou disků. Druhý naopak čte z obou disků jiná data, takže pole se při čtení chová jako RAID 0 - toto má pozitivní vliv na sekvenční čtení, kdy se jeho rychlost výrazně zvyšuje.

RAID 5 - Výhodou RAIDu 5 ve srovnání s RAID 1 je procentuelně menší ztráta kapacity při zachování podobné spolehlivosti. Protože data jsou na discích prokládána, má RAID 5 při čtení výhody RAIDu 0. Při zápisech je na tom bohužel vcelku špatně, protože data se musí zapsat na tři disky najednou a zápis nejde opozdit. Hlavní nevýhodou z hlediska spolehlivosti je pak fakt, že pro získání dat nutně potřebujete ony tři disky. Zatímco u RAIDu 1 selhání jednoho disku nezabrání samostatné práci disku druhého, zde se musí chybějící data dopočítat - čili nutně potřebujete třetí disk. Při případné reklamaci jednoho z disků jste tudíž nuceni zakoupit stejný disk ještě jeden.



- RAID 0 + 1 je RAID 0, na nějž byl aplikován RAID 1
- JBOD je kapacitní sloučení více disků "za sebe"


Osobně se domnívám, že RAID 0 pro domácí použití nemá opodstatnění, naopak jeho použitím naprosto vylučujete jakoukoli alespoň trochu seriózní práci. RAID 5 je zase příliš komplikovaný a na jeho pořízení potřebujete už tři disky - ne vždy se vejdou do všech počítačových skříní, rostou nároky na zdroj, potřebujete speciální RAID řadič. Vylučovací metodou tedy vychází, že pro domácí použití je vhodný především RAID 1 - zrcadlení.


Co je na RAID potřeba?


Pro pořízení RAID pole potřebujete v zásadě dvě věci:
    • RAID řadič
    • dva pevné disky (nebo více)

Dva pevné disky jsou jen otázkou ceny. Hodí se zmínit, že při výběru značky je vhodné se nejdříve podívat na nějaké ty srovnávací testy pevných disků zapojených do RAIDu - především pro RAID 0 a RAID 5 se některé typy nemusí zrovna dvakrát hodit. Tak například Seagate Barracuda IV byl známý tím, že v RAID polích dosahoval velmi špatného výkonu. Na vině byl tehdy firmware, který byl optimalizován pro samostatné použití disku (dokonce existoval upgrade, který tento neduh odstraňoval - jenže tím zase mírně klesl výkon při samostatném použití).

Pokud jde o RAID řadič, existují dvě varianty - přídavný řadič do PCI slotu (popř. na PCI napojený řadič integrovaný na základní desce) nebo v čipsetu integrovaný řadič. Výhodou přídavných řadičů často bývají poněkud lepší možnosti konfigurování a to, že do systému přidají další IDE / Serial ATA porty pro pevné disky, a nezaberou tak pozice z čipové sady. Nevýhodou naopak je, že PCI sběrnice je pomalá a výkon takového řadiče často neplní očekávání, obzvlášť při napojení dalších zařízení na PCI sběrnici - jako např. zvukových karet, TV tunerů nebo grafických karet. V některých případech dokonce tyto přídavné řadiče selhávaly a poškozovaly data ukládaná na disk - před několika lety z toho byl velký skandál. Řadič v čipsetu je na tom přesně naopak - jeho možnosti někdy nebývají tak veliké, ale zase má velmi rychlé nesdílené spojení s ostatními částmi čipové sady (tj. i rychlé spojení s pamětí).




RAID řadič integrovaný v čipu VIA VT8237


Nevýhodou všech levných RAID řadičů je, že některé jejich funkce jsou závislé na výkonu procesoru a že nemají žádnou vyrovnávací paměť RAM pro urychlení práce s disky. Profesionální řešení pro sběrnici PCI-X, PCI-Express či 64bitovou PCI je samozřejmě mnohem lepší, také ovšem stojí v řádu mnoha tisíců až desetitisíců korun. Od levných řadičů do PCI / v čipsetu integrovaných řadičů nečekejte žádné zázraky. Jejich hlavní devizou je nízká prodejní cena, přičemž na domácí použití bohatě stačí.

Které základní desky RAID řadiče mají? Ty připojené na PCI se začaly masově objevovat zhruba v dobách Pentia II, konkrétně jako doplněk čipsetu 440BX, který byl tehdy velmi dobrý, ale poměrně rychle zastaral. RAID řadiče tehdy sloužily pro doplnění vlastností nedostupných z čipsetu - především Ultra ATA 66 a později Ultra ATA 100. Boom v čipsetu integrovaných řadičů přišel s rozvojem Serial ATA. V současnosti pouze některé čipsety nabízí RAID, zde je krátký přehled nejpoužívanějších z nich:




* 0+1 vyžaduje dodatečný čip Silicon Image PHY pro další dva pevné disky - ten se však běžně na základní deskách nevyskytuje
** 0+1 vyžaduje dodatečný čip PHY, který však některé desky nepoužívají

Pro stavbu RAID pole je ideální rozhraní Serial ATA. To především z toho důvodu, že kabely Serial ATA lépe odolávají rušení (jsou stíněné) a disk je na samostatném kanálu, čili poskytuje optimální výkon. Použití staršího rozhraní IDE je sice také možné, ale tam už musíte dávat pozor na zapojení disků na jednotlivé kanály - ideální je mít každý disk nastaven jako Master, tedy na samostatném kanálu.
reklama