Data Koncepter
Forstå fundamentale koncepter i data management og database design. Fra ACID transactions til CAP Theorem, indexing til sharding.
Teori
Teoretiske fundamenter og principper i data management
ACID-transaktioner
Fire egenskaber der garanterer pålidelige databasetransaktioner: Atomicitet, Konsistens, Isolation, Varighed.
CAP-teoremet
Fundamental teori om at distribuerede systemer kun kan garantere to af tre: Konsistens, Tilgængelighed, Partitionstolerance.
Database Transactions
En logisk enhed af arbejde der grupperer flere database operationer til en atomic unit med ACID garantier.
Transaction Isolation Levels
Forskellige niveauer af isolation mellem samtidige transaktioner der balancerer konsistens mod ydeevne.
Arkitektur
Arkitektur mønstre og design principper for data systemer
Data Lakes
Centraliseret repository til at gemme alle strukturerede, semi-strukturerede og ustrukturerede data i råformat.
Data Warehousing
Centralt repository designet til at konsolidere og analysere data fra flere kilder til business intelligence.
Database Normalization
Proces til at organisere relationelle databaser for at reducere redundans og forbedre dataintegritet.
Database Partitioning
Opdeling af store tabeller eller databases i mindre, mere håndterbare dele kaldet partitions for bedre performance og skalerbarhed.
Database Replication
Proces hvor data kopieres fra én database til en eller flere andre for høj tilgængelighed og performance.
Database Sharding
Teknik til at horizontalt partitionere data på tværs af multiple databaser for at opnå skalering.
Denormalisering
Strategisk tilføjelse af redundant data til en normaliseret database for at forbedre læseydeevne på bekostning af skrivekompleksitet.
ETL (Extract, Transform, Load)
Proces til at udtrække data fra kilder, transformere det, og loade det ind i et destination system.
NoSQL Design Patterns
Almindelige designmønstre og best practices for at modellere data effektivt i NoSQL-databaser som MongoDB, DynamoDB og Cassandra.
Two-Phase Commit Protocol (2PC)
En distributed transaction protocol der sikrer atomic commits across multiple databases eller services.
Ydeevne
Data-caching
Teknik til at gemme ofte brugt data i hurtig lagring for at reducere latenstid og databasebelastning.
Database Indexing
Teknik til at accelerere databaseforespørgsler ved at skabe datastrukturer der giver hurtigere søgning.
Database-forbindelsespooling
En teknik til at genbruge databaseforbindelser i stedet for at oprette nye for hver forespørgsel, hvilket forbedrer ydeevnen markant.
Materialized Views
Forudberegnede forespørgselsresultater gemt som fysiske tabeller for hurtig adgang til komplekse aggregeringer og JOINs.
Query Optimization
Teknikker til at forbedre databaseforespørgslers ydeevne gennem indekser, omskrivning af forespørgsler og forståelse af udførelsesplaner.
Infrastruktur
Konsistens
Data konsistens modeller og trade-offs