Cassandra (Apache Cassandra)

Apache Cassandra is een open source gedistribueerd database systeem dat is ontworpen voor het opslaan en beheren van grote hoeveelheden gegevens over commodity servers. Cassandra kan zowel dienen als een real-time operationele gegevensopslag voor online transactionele toepassingen als een lees-intensieve database voor grootschalige business intelligence (BI) systemen.

Orspronkelijk gemaakt voor Facebook, is Cassandra ontworpen om peer-to-peer symmetrische nodes te hebben, in plaats van master of named nodes, om ervoor te zorgen dat er nooit een single point of failure (SPoF) kan zijn. Cassandra verdeelt gegevens automatisch over alle nodes in het databasecluster, maar de beheerder heeft de macht om te bepalen welke gegevens worden gerepliceerd en hoeveel kopieën van de gegevens worden gemaakt.

Nadat Facebook de code open-sourcede, werd Cassandra een Apache Incubator-project in 2008 en een top-level Apache-project in 2010. Op dit moment wordt Cassandra onder meer gebruikt door Netflix, Digg, Adobe, Twitter, HP, IBM, Rackspace, Cisco en Reddit.

De naam Cassandra is geïnspireerd op de mooie mystieke ziener uit de Griekse mythologie wiens voorspellingen voor de toekomst nooit werden geloofd.

Deze tutorial van DataStax geeft een uitstekend overzicht van Cassandra: