Hochverfügbarkeit von verteilten Systemen (HVS)
6/7. Semester
5 ECTS | 4 SWS
Projektarbeit (PA)
Zuverlässige und skalierbare IT-Systeme verstehen: Du erfährst, wie große verteilte Systeme stabil und leistungsfähig bleiben. Im Fokus stehen Geschwindigkeit, Ausfallsicherheit und Monitoring sowie moderne Cloud- und Container-Architekturen. Zusätzlich geht es um Datenverteilung und den Betrieb hochverfügbarer Dienste.
Inhalte
- grundlegende Konzepte: Latenz, Verfügbarkeit und Durchsatz in verteilten Systemen, Redundanz, Monitoring und Observability
- verteilte Dienste: Actor-Systeme (Akka, OTP-Erlang/-Elixir), Load-Balancing (auf Infrastruktur- und Anwendungsebene), Caches und Performance, Circuit Breaker, Scatter/Gather, Monitoring
- Orchestrierung und Kubernetes (Architektur-Muster), Redundanz für FaaS und in Event-gesteuerte (Batch) Architekturen, Work Queues
- verteilte Daten: Reliable Autonomic Distributed Object Store mit Ceph und CephFS, Daten-Konsistenz, Leader Election
- Prozesse: Chaos-Engineering bei Netflix, Last-Tests planen und auswerten
- Exkursion in ein Rechenzentrum
Lernziele/Kompetenzen
Die Studierenden sind in der Lage,
- Konzepte und Technologien für Hochverfügbarkeit zu benennen
- einen Dienst mit hoher Verfügbarkeit in einem Proxmox-Cluster zu betreiben
- hohe Verfügbarkeit von Diensten in existierenden verteilten Systemen zu prüfen, zu bewerten und zu dokumentieren
Literatur
- Heather Adkins et al. (2020): Building Secure and Reliable Systems: Best Practices for Designing, Implementing, and Maintaining Systems. O'Reilly.
- Jamie Allen (2013): Effective Akka. Patterns and Best Practices. O'Reilly.
- Betsy Beyer et al. (Hrsg, 2016): Site Reliability Engineering: How Google Runs Production Systems. O'Reilly.
- Brendan Burns (2024): Designing Distributed Systems. Patterns and Paradigms for Scalable, Reliable Systems Using Kubernetes. [2. Aufl.] O'Reilly.
- Jones Rosenthal & Nora Casey (2020): Chaos Engineering: System Resiliency in Practice. O'Reilly.
- Vaughn Vernon (2016): Reactive Messaging Patterns With The Actor Model. Applications and Integration in Scala and Akka. Pearson Education.
- David Williams (2007): IT Operations Run Book Automation. Gartner.
Dozentinnen / Dozenten
- Prof. Dr.-Ing. Sandro Leuchter
Empfohlene Vorkenntnisse
VS ist keine Voraussetzung
Daten zum Modul
| Semester |
6/7 |
| Unterrichtssprache |
Deutsch |
|
Häufigkeit
|
Unregelmäßig
|
| Kreditpunkte |
5 |
| Modulverantwortlich |
Prof. Dr.-Ing. Sandro Leuchter |
| Dauer |
1 Semester |
| Studienleistung |
Keine |
| Prüfungsvorleistung |
Keine |
| Prüfungsleistung |
Projektarbeit (PA) |
Semesterwochenstunden
| Vorlesung |
2 SWS |
| Labor |
2 SWS |
| Summe |
4 SWS |
Arbeitsaufwand (work load)
| Vorlesung |
30 h |
| Labor |
30 h |
| Selbststudium |
30 h |
| Projekt |
60 h |
| Summe |
150 h |