Đây là series tối ưu hóa cơ sở dữ liệu từ nền tảng đến các chủ đề chuyên sâu 2026: pgvector/RAG, CDC/outbox, distributed SQL, benchmark, cùng các cập nhật quan trọng về PostgreSQL 16/17, MySQL 8.4 LTS, Redis 7/Valkey, và OpenTelemetry DB semantic.

Lộ trình series

Series có 2 phần:

  • Phần 1 (bài 1-9): 9 bài cốt lõi xây dựng nền tảng, từ phân tích query, indexing, schema, transaction, caching, SQL/NoSQL tuning, tới monitoring & DR.
  • Phần 2 (bài 10-14): 5 bài chuyên đề hiện đại (2026), vector database, CDC & outbox, distributed SQL, benchmark, và cheatsheet tổng hợp.

Mỗi phần nối với phần trước, nhưng mục tiêu không phải học thuộc thuật ngữ DBA. Mục tiêu là đọc được triệu chứng, đo đúng chỗ, rồi chọn tối ưu không phá production.

Cập nhật 2026 đáng chú ý

Các bài trong series đã được refresh với các nội dung:

  • PostgreSQL 16/17: pg_stat_io, EXPLAIN (... WAL, SETTINGS), JIT tuning, logical replication nâng cao, BRIN/DiskANN.
  • MySQL 8.4 LTS: innodb_redo_log_capacity, parallel replication (WRITESET), SHOW REPLICA STATUS, rename semi-sync plugin.
  • Redis 7/8 + Valkey fork: ACL đầy đủ, Redis Stack, UNLINK/SCAN production-safe, Valkey vs Redis license note.
  • NoSQL/Cassandra: data model query-first, tunable consistency, compaction strategy, monitoring.
  • Modern ops: OpenTelemetry DB semantic, auto_explain, pg_stat_kcache, pg_wait_sampling.
  • Cloud storage: gp3 / io2 / Premium SSD v2 IOPS đúng cách, tách WAL/data.
  • Modern patterns: Transactional Outbox, CDC với Debezium, vector search với pgvector.

Danh sách bài trong series

Phần 1, Nền tảng (bài 1-9)

  1. Nền tảng tối ưu hóa cơ sở dữ liệu và tư duy phương pháp Nguyên tắc nền tảng, quy trình tối ưu, cloud storage & IOPS.

  2. Phân tích và tối ưu câu truy vấn SQL toàn diện EXPLAIN ANALYZE nâng cao, Performance Schema, pg_stat_statements 2026.

  3. Index và chiến lược indexing chuyên sâu B-tree, Hash, GIN, GiST, BRIN, Covering index (PG INCLUDE, SQL Server filtered), case study đa dialect.

  4. Thiết kế schema tối ưu cho hiệu năng cao Normalization, partitioning, sharding với Vitess/Citus/TiDB, HTAP 2026.

  5. Quản lý transaction và concurrency hiệu quả Isolation levels, PG SSI vs InnoDB locking, primary/replica rename, parallel replication.

  6. Chiến lược caching và tối ưu tầng ứng dụng Cache-aside, write-through, cache stampede, TTL jitter, SCAN/UNLINK production-safe, N+1 ORM.

  7. Tối ưu hóa cho cơ sở dữ liệu SQL MySQL innodb_redo_log_capacity, PostgreSQL pg_stat_io, JIT, PostGIS geography, semi-sync rename.

  8. Tối ưu hóa cho cơ sở dữ liệu NoSQL và Redis MongoDB WiredTiger, Redis/Valkey, ACL, Cassandra data modeling, consistency level, compaction.

  9. Monitoring, troubleshooting và bảo trì liên tục PMM/Prometheus, OpenTelemetry DB, auto_explain, pg_stat_kcache, PITR đúng cách (PG 12+), DR runbook.

Phần 2, Chuyên đề hiện đại 2026 (bài 10-14)

  1. Vector Database và pgvector cho AI workload Embedding, HNSW/IVFFlat, halfvec, hybrid search, RAG pipeline production.

  2. CDC và Outbox Pattern Transactional Outbox, Debezium PG/MySQL, sync DB → ES/cache/warehouse/vector đáng tin cậy.

  3. Distributed SQL và sharding thực chiến Vitess, Citus, CockroachDB, TiDB, YugabyteDB, Spanner: chọn đúng, thiết kế shard key, migrate.

  4. Benchmark và load testing database pgbench, sysbench, HammerDB, YCSB, ClickBench, cạm bẫy warmup/variance/observer effect.

  5. Cheatsheet tổng hợp series Lệnh, query, config tuning PG/MySQL/Redis/Cassandra/pgvector/CDC, tham khảo nhanh incident.

Phần 3, Vận hành production (bài 15-16)

  1. Zero-downtime schema migration pt-online-schema-change, gh-ost, expanding/contracting, pgroll: thay đổi schema không lock bảng, không downtime.

  2. Connection pooling chuyên sâu PgBouncer, ProxySQL, pool modes, transaction vs session pooling, sizing, monitoring.