Google na konci minulého týdne zveřejnil zprávu "Flash Reliability in Production: The Expected and the Unexpected", která přináší závěry studie týkající se spolehlivosti SSD ve firemních serverech. Některé závěry jsou přitom překvapivé.
Co je RTX AI
Web Světhardware.cz přináší velký přehled o NVIDIA RTX AI ve vašem počítači a popisuje spolehlivou a bezpečnou cestu, jak si na svém počítači vytvořit lokální umělou inteligenci.
Něco podobného Google provedl už před devíti lety, kdy provedl studii o spolehlivosti pevných disků, přičemž dnes už logicky přišla na řadu SSD s paměťmi NAND Flash. V jejich případě je totiž výdrž a spolehlivost velkou otázkou, která trápí firmy i uživatele. Výrobci nám přitom už ve specifikacích běžně udávají hodnoty TBW (Total Bytes Written) a ne pouze nic neříkající MTBF (Mean Time Before Failure). Jenomže problém je ten, že ani TBW udávající celkový objem dat, který je možné v průběhu životnosti na SSD zapsat, není vůbec průkazným ukazatelem toho, co opravdu zvládnou. Spíše jde jen o součást záruky, čili výrobce takového SSD obvykle poskytuje několikaletou záruční lhůtu a rovněž zaručuje, že SSD vydrží stanovený objem TBW. Čili pokud tuto hranici ještě v době záruky překročíte a SSD pak selže, stejně máte smůlu.
Ale zpět ke studii, kterou provedla Prof. Bianca Schroeder z University of Toronto ve spolupráci s Raghavem Lagisettym a Arifem Merchantem z Googlu. Společně říkají, že již bylo publikováno mnoho studií o výdrži a spolehlivosti pamětí Flash, které však byly založeny na výsledcích laboratorních zkoušek, tedy relativně na malém počtu vzorků. Tato studie (pdf) ale má základ ve sledování mnoha různých úložných zařízení s paměťmi Flash, která pracují v datových centrech firmy Google. Ta jsou založena na různých pamětech, jako jsou MLC, eMLC či SLC a navíc jde o dlouhodobě používaná úložiště (cca 6 let a více).
Dle závěrů lze říci, že paměti s buňkami SLC a MLC mají srovnatelnou životnost, což je poměrně překvapivé. Paměti SLC jsou totiž v průmyslovém nasazení stále využívané především právě kvůli tomu, že slibují větší spolehlivost, ovšem mají také poloviční kapacitu, což se zase odráží v ceně. A dále můžeme mluvit o následujících závěrech:
- Častější výskyt chyb je spojený spíše s věkem daného SSD než s mírou jeho užívání
- U 20 až 63 procent SSD se v prvních 4 letech nasazení objeví alespoň jedna neopravitelná chyba
- U 30 až 80 procent SSD se v prvních 4 letech nasazení objeví přinejmenším jeden vadný blok a u 2 až 7 procent je to celý vadný čip
- RBER (raw bit error rate), standardně využívaný ukazatel spolehlivosti SSD, není vhodný pro předpovídání opravdu závažných chyb
- RBER a počet neopravitelných chyb roste společně s P/E cykly (mazací a programovací cykly buněk), a to lineárně
- UBER (uncorrectable bit error rate), standardní metoda pro měření neopravitelných chyb, není příliš vypovídající metoda
- Oproti HDD je třeba SSD vyměňovat méně, ale objevuje se u nich výrazně větší počet závažných chyb (čili HDD dávají vědět dopředu, že nejsou zcela fit)
- Na základě počtu špatných bloků se dá dobře předpovídat hrozící celkové selhání paměťového čipu
Zdroj: Hexus.net