Will Percey — Portfolio

Database Theory

> > Updated Dec 2025

account_balance

Transaction & ACID

ACID Properties

Fundamental database guarantees: Atomicity (all-or-nothing), Consistency (constraints), Isolation (concurrent), Durability (persistence).

Key Features

Atomicity for all-or-nothing
Consistency maintains constraints
Isolation for concurrent transactions
Durability persists committed changes

Use Cases

Bank fund transfers
Order processing systems
Inventory updates
Financial transaction systems

Transaction Isolation Levels

Trade-offs between consistency and performance: Read Uncommitted, Read Committed, Repeatable Read, Serializable.

Key Features

Dirty read prevention
Non-repeatable read handling
Phantom read protection
Lock-based vs MVCC approaches

Use Cases

Concurrent data updates
Reporting queries
Batch processing operations
Critical financial transactions

Two-Phase Commit (2PC)

Distributed transaction protocol with coordinator managing prepare and commit phases across multiple databases.

Key Features

Atomic distributed operations
Prepare and commit phases
Blocking protocol behavior
Recovery mechanisms

Use Cases

Microservice transactions
Multi-database updates
Distributed system consistency
Cross-system operations

Optimistic vs Pessimistic Locking

Conflict handling strategies: optimistic assumes low conflict with version checking, pessimistic uses locks to prevent conflicts.

Key Features

Timestamp or version-based checking
Lock duration management
Deadlock prevention strategies
Rollback handling

Use Cases

Collaborative document editing
Inventory management
Booking systems
Counter increments

folder_open

Indexing Strategies

B-Tree Indexes

Balanced tree structure for efficient range queries, most common index type, optimized for disk access patterns.

Key Features

Maintains sorted order
Efficient range scans
Covering index optimization
Multi-column indexing

Use Cases

Primary key indexing
WHERE clause optimization
ORDER BY performance
Foreign key relationships

Hash Indexes

O(1) equality lookup using hash tables, fast for exact matches but no support for range queries or sorting.

Key Features

Constant time equality checks
No ordering support
Collision handling
Memory efficiency

Use Cases

Primary key exact lookups
Exact match queries
JOIN operation optimization
In-memory caching

Full-Text Indexes

Inverted index for text search with stemming, relevance scoring, and phrase matching capabilities.

Key Features

Token-based indexing
Relevance ranking algorithms
Phrase and proximity search
Language-specific support

Use Cases

Search functionality
Document content search
Log analysis
Content filtering

Bitmap Indexes

Efficient for low-cardinality columns using bitwise operations, excellent compression and fast AND/OR/NOT operations.

Key Features

Fast bitwise AND/OR/NOT
Excellent compression
Data warehouse optimization
Low-cardinality columns

Use Cases

Gender or status columns
Boolean flag fields
Categorical data
Analytics queries

tune

Query Optimization

Query Execution Plans

Database optimizer decisions for query execution including cost estimation, join order, and index selection.

Key Features

EXPLAIN output analysis
Scan type identification
Join algorithm selection
Statistics-based optimization

Use Cases

Slow query diagnosis
Index recommendation
Query performance tuning
Bottleneck identification

Query Optimization Techniques

Strategies for improving query performance including index usage, query rewriting, and materialized views.

Key Features

Covering index usage
Index hint specification
Materialized view creation
Statistics updates

Use Cases

Complex query optimization
Aggregation performance
JOIN optimization
Subquery rewriting

Normalization

Database design process (1NF, 2NF, 3NF, BCNF) reducing data redundancy and ensuring data integrity through decomposition.

Key Features

Eliminate data duplicates
Functional dependency management
Update anomaly prevention
Referential integrity

Use Cases

Schema design
Data modeling
Migration planning
Database refactoring

Denormalization

Performance optimization adding redundancy for read-heavy workloads through calculated fields and aggregate tables.

Key Features

Duplicate data strategically
Aggregate table creation
Materialized view usage
Cache table patterns

Use Cases

Reporting databases
Analytics platforms
Dashboard queries
High-traffic read operations