Bei TecChannel.de einen Artikel zu Datenbanken zu finden, ist schon eher ungewöhnlich. Der Artikel "Datenkompression in SQL-Datenbanken" ist etwa auf Level 100 bis 200 und somit ein ganz guter Einstieg in das Thema. Weil heutzutage das Lesen und Schreiben von Daten tatsächlich noch in fast allen Fällen der Flaschenhals ist, ist das alte Thema immer noch relevant.

Folgende Aspekte werde hier unter dem Stichwort "Komprimierung" genannt, die dahin abzielen, dass auf eine Datenseite möglichst viele Datensätze passen:

  • Verwendung numerischer Typen anstelle von Zeichenketten
  • Verwendung von Unicode nur wo es wirklich nötig ist (SQL-Server speichert Unicode-Zeichen das als UTF-16): Der Platzbedarf sei typischerweise um 40 bis 60 Prozent höher.
  • Verwendung von numerischen Werten mit variablen Feldgröße (geht nur mit der SQL Server 2008 Enterprise Edition)
  • Seiten- oder Tabellen-Kompression bei vielen doppelten Werten nutzen (auch das geht nur mit der teuren SQL Server 2008 Enterprise Edition). Einen Performancevergleich findet man hier. Das beeindruckt.

Wer richtig große Datenbanken betreut und sich die Enterprise-Edition leisten kann, sollte sich die neuen Features dazu mal ansehen. Aber auch im Kleinen lohnt es sich Platz zu sparen.