Scale-out storage

Scale-out storage is een network-attached storage (NAS) architectuur waarbij de totale hoeveelheid schijfruimte kan worden uitgebreid door de toevoeging van apparaten in verbonden arrays met hun eigen bronnen.

In een scale-out systeem kan nieuwe hardware worden toegevoegd en geconfigureerd als de behoefte zich voordoet. Wanneer een scale-out systeem zijn opslaglimiet bereikt, kan een andere array worden toegevoegd om de systeemcapaciteit uit te breiden. Bij scale-out storage kan de extra opslagcapaciteit over de arrays heen worden benut en kunnen toegevoegde apparaten ook worden gebruikt om de netwerkopslagcapaciteit te vergroten, waardoor de prestaties worden verbeterd en in de behoefte aan extra opslag kan worden voorzien.

Voordat scale-out storage populair werd, kochten ondernemingen vaak veel grotere storage-arrays dan nodig was om er zeker van te zijn dat er voldoende schijfruimte beschikbaar zou zijn voor toekomstige uitbreiding. Als die uitbreiding nooit plaatsvond of als de behoeften minder bleken te zijn dan verwacht, ging veel van de oorspronkelijk aangeschafte schijfruimte verloren. Met een scale-out architectuur kan de initiële investering in het begin bescheidener zijn, omdat het niet nodig is de behoefte op de lange termijn te voorzien - als de opslagbehoeften groter worden dan verwacht, kunnen nieuwe arrays worden toegevoegd als dat nodig is, in wezen zonder limiet.

Verticale vs. horizontale schaalbaarheid

Schaalbaarheid is het vermogen van een bepaald type systeem om goed te blijven functioneren als de omvang of het volume is gewijzigd om aan een gebruikersbehoefte te voldoen. In sommige contexten verwijst schaalbaarheid naar de mogelijkheid om aan hogere of lagere eisen te voldoen naar gelang van de behoefte. In een opslagcontext verwijst schaalvergroting echter meestal naar aanpassing om te voldoen aan een vraag naar meer capaciteit. Er zijn twee hoofdbenaderingen om dat te bereiken.

De oudere schaalvergrotingsbenadering is een voorbeeld van verticale schaalbaarheid. Verticale schaalbaarheid is de mogelijkheid om de capaciteit van bestaande hardware of software te vergroten door middelen aan een fysiek systeem toe te voegen - bijvoorbeeld door rekenkracht aan een server toe te voegen om deze sneller te maken. In het geval van opslagsystemen betekent dit het toevoegen van meer apparaten, zoals diskdrives, aan een bestaand systeem wanneer meer capaciteit nodig is.

Aan de andere kant is horizontale schaalbaarheid het vermogen om meerdere entiteiten met elkaar te verbinden zodat ze als een enkele logische eenheid werken. In het geval van scale-out opslag kunnen er veel nodes zijn, geografisch gescheiden.

De beperkingen van scale-up opslag

Traditionele NAS wordt soms aangeduid als scale-up NAS omdat de opslagcapaciteit alleen kan worden geüpgraded (opgeschaald) door extra systemen aan een bestaande architectuur toe te voegen. Een opschaalsysteem bestaat uit een of twee controllers, NAS-koppen genoemd, die toegang hebben tot een vooraf ingestelde hoeveelheid CPU en geheugen en een vooraf bepaald aantal schijfslots. Apparaten in scale-up NAS delen systeembronnen en de controlefunctie neemt niet toe naarmate de opslagcapaciteit toeneemt, wat betekent dat de prestaties de neiging hebben af te nemen naarmate meer opslagruimte wordt toegevoegd. Zodra het NAS-systeem zijn grenzen heeft bereikt, kunnen de capaciteit en prestaties alleen worden verhoogd door een nieuw, afzonderlijk beheerd systeem toe te voegen.

Schaalout-opslagarchitectuur

Een schaalbaar systeem kan zoveel clusters bevatten als nodig is.

Elk apparaat (node) bevat opslagcapaciteit, mogelijk in de vorm van meerdere schijfspindels, en kan zijn eigen verwerkingskracht en I/O-bandbreedte (input/output) hebben. Het opnemen van deze middelen betekent dat naarmate de opslagcapaciteit toeneemt, ook de prestaties toenemen.

Scale-out NAS groeit door het toevoegen van geclusterde nodes. Dit zijn vaak x86-servers met een speciaal besturingssysteem en opslag die zijn aangesloten via een extern netwerk. Nodes kunnen voor onderlinge communicatie worden verbonden via een backplane met hoge snelheid of een netwerk. Gebruikers beheren het cluster als één systeem en beheren de gegevens via een globale naamruimte of een gedistribueerd bestandssysteem (DFS), zodat ze zich geen zorgen hoeven te maken over de werkelijke fysieke locatie van de gegevens.

Zie een korte geschiedenis van gegevensopslag en een inleiding tot schaalbare opslag in de video van Peter Larson: