Will Percey — Portfolio

Database Scaling

> > Updated Dec 2025

speed

Query Optimization

Indexing

Analyze query patterns and create the right indexes to speed up data retrieval. B-tree indexes for range queries, hash indexes for equality lookups, composite indexes for multi-column queries, partial indexes for filtered subsets, covering indexes to avoid table lookups.

Key Features

B-tree indexes for range queries
Hash indexes for equality lookups
Composite indexes for multi-column queries
Partial indexes for filtered subsets
Covering indexes to avoid table lookups

Use Cases

Speeding up WHERE clause filtering
Optimizing JOIN operations
Supporting ORDER BY without sorting
Enforcing uniqueness constraints

Related Strategies

Materialized ViewsDenormalizationQuery Caching

Materialized Views

Pre-compute complex query results and store them for faster access. Unlike regular views, materialized views persist computed results to disk. Refresh strategies include on-demand, scheduled, and incremental updates.

Key Features

Pre-computed query results
Physical storage of results
On-demand refresh
Scheduled refresh
Incremental updates

Use Cases

Dashboard and reporting queries
Aggregations over large datasets
Complex joins used repeatedly
Data warehouse summaries

Related Strategies

Database CachingIndexingDenormalization

Denormalization

Reduce complex joins by duplicating data to improve query performance. Intentionally violates normal forms to optimize read-heavy workloads. Strategies include adding redundant columns, pre-joined tables, and summary tables.

Key Features

Redundant columns for fast access
Pre-joined tables
Summary/aggregate tables
Embedded documents (NoSQL)
Computed columns

Use Cases

Read-heavy OLAP workloads
Eliminating expensive multi-table joins
Embedding frequently accessed related data
NoSQL document model design

Related Strategies

Materialized ViewsCachingIndexing

memory

Caching & Pooling

Database Caching

Store frequently accessed data in a faster storage layer (Redis, Memcached) to reduce database load. Cache-aside, read-through, write-through, and write-behind patterns. Cache invalidation strategies include TTL, event-driven, and version-based approaches.

Key Features

Cache-aside pattern
Read-through caching
Write-through caching
Write-behind (write-back) caching
TTL-based invalidation

Use Cases

Session data storage
Frequently read reference data
API response caching
Query result caching

Related Strategies

Materialized ViewsRead ReplicasCDN Caching

Connection Pooling

Maintain a pool of reusable database connections to reduce connection overhead. Avoids expensive connection establishment for each request. Tools include PgBouncer, ProxySQL, HikariCP.

Key Features

Connection reuse
Pool size configuration
Connection timeout management
Idle connection reaping
Connection multiplexing

Use Cases

High-concurrency applications
Serverless database access
Microservices architectures
Connection limit management

Related Strategies

Serverless DatabasesConnection-per-requestPersistent Connections

dns

Scaling Infrastructure

Vertical Scaling

Boost database server capacity by adding more CPU, RAM, storage, or faster disks. Scale-up approach that increases single-node resources. Simpler than horizontal scaling but has hardware limits.

Key Features

CPU upgrade for compute-bound queries
RAM increase for caching
SSD/NVMe for faster I/O
Network bandwidth increase
No application changes required

Use Cases

Initial scaling before sharding
Memory-bound workloads
CPU-intensive queries
Storage capacity expansion

Related Strategies

Horizontal ScalingShardingRead Replicas

Replication

Create replicas of your primary database on different servers for scaling reads and improving availability. Synchronous replication ensures consistency, asynchronous improves performance. Primary-replica or multi-primary topologies.

Key Features

Primary-replica (master-slave) topology
Multi-primary replication
Synchronous replication
Asynchronous replication
Automatic failover

Use Cases

Scaling read-heavy workloads
Geographic distribution
Disaster recovery
Reporting without impacting production

Related Strategies

ShardingCachingCDN

Sharding

Horizontally partition data across multiple database instances based on a shard key. Each shard holds a subset of data. Strategies include hash-based, range-based, and directory-based sharding.

Key Features

Hash-based sharding
Range-based sharding
Directory-based sharding
Shard key selection
Cross-shard query routing

Use Cases

Scaling beyond single-node limits
Multi-tenant data isolation
Geographic data partitioning
Very large datasets (TB+)

Related Strategies

Vertical ScalingRead ReplicasNewSQL Databases