HA có thể được hiểu là:
- Một hệ thống có khả năng phục vụ liên tục
- Chịu nhiệt cao (tức là khi nhiều người yêu cầu phục vụ thì vẫn có thể chạy ổn định).
Bài viết này ta sẽ tập trung vào mục (1).
Là phương pháp sử dụng "lính dự bị", lên đảm nhiệm vai trò của "lính chủ lực" khi ông chủ lực kiệt sức chết.
Ta sẽ sử dụng 1 server chính (master) và 2 server dự bị (slave).
Tổng cộng sẽ cần 3 server vật lý, sau này sẽ gọi là node để khỏi nhầm lẫn với redis server.
3 node này có IP lần lượt là:
master: 10.0.1.100
slave-1: 10.0.1.101
slave-2: 10.0.1.102
Cài đặt Redis:
Mình sử dụng Ubuntu 16.04.
Cài redis vào cả 3 NODE
sudo apt-get update
sudo apt-get install redis-server -y
Ở node master, mở file /etc/redis/redis.conf
lên và cấu hình:
Tìm đến dòng bind 127.0.0.1
, đây là khai báo redis server sẽ lắng nghe request ở đâu.
Với cấu hình mặc định thì nó chỉ lắng nghe từ localhost (hiện tại đang là dòng 69) nên mình đổi về IP của node:
bind 10.0.1.100 127.0.0.1
Lưu lại file sau đó khởi động lại redis server:
sudo systemctl restart redis-server.service
Test thử server master
$ redis-cli -h 10.0.1.100
10.0.1.100:6379> info replication
Redis master output
# Replication
role:master
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
Mặc định, redis server sẽ chạy ở cổng 6379
.
Ghi dữ liệu vào để lát nữa đọc thử từ slave ra:
10.0.1.100:6379> set test 'this key was defined on the master server'
OK
Thoát redis server:
10.0.1.100:6379> exit
Cấu hình cho các NODE slave
Trên 2 NODE slave:
Trước khi cấu hình thì kết nối vào server để đảm bảo rằng nó chưa có dữ liệu bên master.
$ redis-cli
127.0.0.1:6379> get test
(nil)
Tiếp đến, mở file /etc/redis/redis.conf
lên và cấu hình:
bind 10.0.1.101 127.0.0.1
slave 2:
bind 10.0.1.102 127.0.0.1
Tiếp, tìm đến dòng có slaveof <masterip> <masterport>
(dòng 281), điền vào:
slaveof 10.0.1.100 6379
Cấu hình này sẽ khai báo đây là node dự bị (slave) cho NODE chính 10.0.1.100
và liên lạc với nó thông qua cổng 6379
- cổng mà bên kia đang lắng nghe.
OK, lưu lại rồi khởi động lại redis server:
sudo systemctl restart redis-server.service
Test thử server slave:
Bây giờ ta sẽ vào server slave và đọc dữ liệu ở bên server master ra:
$ redis-cli
10.0.1.101:6379> get test
'this key was defined on the master server'
Kiểm tra thông tin về replication:
10.0.1.101:6379> info replication
Redis slave output
# Replication
role:slave
master_host:10.0.1.100
master_port:6379
master_link_status:up
master_last_io_seconds_ago:5
master_sync_in_progress:0
slave_repl_offset:1387
slave_priority:100
slave_read_only:1
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
Nếu bạn kiểm tra thông tin tương tự bên server master thì sẽ thấy có chút cập nhật so với lúc nãy:
master$ redis-cli
10.0.1.100:6379> info replication
Redis master output
# Replication
role:master
connected_slaves:2
slave0:ip=10.0.1.101,port=6379,state=online,offset=1737,lag=1
slave0:ip=10.0.1.102,port=6379,state=online,offset=10000,lag=1
master_repl_offset:1737
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:2
repl_backlog_histlen:1736
OK, đến đây là xong phần redis replication. Tiếp đến, dùng sentinel để quản lý việc đưa salve lên làm master khi ông master bị down.
Cơ chế hoạt động:
Các sentinel
sẽ luôn quan sát master server, khi master sập, các sentinels sẽ loan truyền nhau 1 tín hiệu sdown
: tao thấy đại ca chết rồi thì phải.
Khi đủ 1 số lượng n sentinel
đồng ý rằng tao cũng thấy master sập rồi, tụi sentinels sẽ loan tiếp tín hiệu odown
: nó thực sự chết rồi đó.
Lúc này, tụi sentinels sẽ bầu chọn ra 1 slave để nâng cấp lên làm master mới, đồng thời cập nhật các cấu hình theo bộ máy chính quyền mới.
Khi thằng master kia sống lại, nó sẽ được tham gia vào băng nhóm với vai trò slave.
Cài đặt và cấu hình:
Cài đặt sentinel
trên cả 3 NODE:
$ sudo apt-get install redis-sentinel -y
Mở file /etc/redis/sentinel.conf
và cấu hình:
daemonize yes
pidfile "/var/run/redis/redis-sentinel.pid"
logfile "/var/log/redis/redis-sentinel.log"
bind 10.0.1.100
port 26379
sentinel monitor mymaster 10.0.1.100 6379 2
sentinel down-after-milliseconds mymaster 2000
sentinel failover-timeout mymaster 180000
sentinel parallel-syncs mymaster 1
bind 10.0.1.100
: báo cho cácsentinel
ở NODE khác biết rằng tôi đang lắng nghe ở địa chỉ này.port 26379
: để cho dễ nhớ thì thường là lấy cổng của redis +20000 rồi làm cổngsentinel
.sentinel monitor mymaster 10.0.1.100 6379 2
: lệnh này khai báo là sẽ lắng nghe thằng master ở địa chỉ10.0.1.100:6379
, tham số cuối cùng (2) là số lượngsentinel
tối thiểu để tham gia việc bầu chọn (lúc xác địnhmaster
chết, và bầumaster
mới), mymaster là tên củamaster
.sentinel down-after-milliseconds mymaster 2000
: sau 2 giây mà không thấy đại ca phản hồi thì tao sẽ loan tinsdown
đi.
Hai cấu hình cuối cùng thì có thể tham khảo thêm ở đây
Cấu hình cho 2 slave server cũng tương tự cho master, chỉ khác 1 chỗ duy nhất là địa chỉ để bind-dùng IP của slave server tương ứng:
daemonize yes
pidfile "/var/run/redis/redis-sentinel.pid"
logfile "/var/log/redis/redis-sentinel.log"
bind 10.0.1.101
port 26379
sentinel monitor mymaster 10.0.1.100 6379 2
sentinel down-after-milliseconds mymaster 2000
sentinel failover-timeout mymaster 180000
sentinel parallel-syncs mymaster 1
OK, bây giờ khởi động lại cả 3 sentinel
:
sudo systemctl restart redis-server.service
Kiểm tra việc bầu cử
Đầu tiên, mở các file log ra để xem diễn biến băng nhóm:
master$ tailf /var/log/redis/redis-sentinel.log
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 4.0.10 (01888d1e/0) 64 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 16379
| `-._ `._ / _.-' | PID: 57464
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | http://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
57464:X 07 Jul 16:33:18.109 # Sentinel runid is 978afe015b4554fdd131957ef688ca4ec3651ea1
57464:X 07 Jul 16:33:18.109 # +monitor master mymaster 10.0.1.100 6379 quorum 2
57464:X 07 Jul 16:33:18.111 * +slave slave 10.0.1.101:6381 10.0.1.101 6379 @ mymaster 10.0.1.100 6379
57464:X 07 Jul 16:33:18.205 * +sentinel sentinel 10.0.1.101:16379 10.0.1.101 16379 @ mymaster 10.0.1.100 6379
57464:X 07 Jul 16:33:18.111 * +slave slave 10.0.1.102:6381 10.0.1.102 6379 @ mymaster 10.0.1.100 6379
57464:X 07 Jul 16:33:18.205 * +sentinel sentinel 10.0.1.102:16379 10.0.1.102 16379 @ mymaster 10.0.1.100 6379
Kiểm tra xem ai đang là master
$ redis-cli -p 26379 sentinel get-master-addr-by-name mymaster
1) "10.0.1.100"
2) "6379"
Đánh sập master để bầu master mới
Trên master server:
master$ sudo systemctl stop redis-server.service
Nhìn vào log, bạn sẽ thấy thông tin về việc loan tin và bầu cử:
57464:X 07 Jul 16:35:30.270 # +sdown master mymaster 10.0.1.100 6379
57464:X 07 Jul 16:35:30.301 # +new-epoch 1
57464:X 07 Jul 16:35:30.301 # +vote-for-leader 2a4d7647d2e995bd7315d8358efbd336d7fc79ad 1
57464:X 07 Jul 16:35:30.330 # +odown master mymaster 10.0.1.100 6379 #quorum 3/2
57464:X 07 Jul 16:35:30.330 # Next failover delay: I will not start a failover before Tue Jul 7 16:35:50 2015
57464:X 07 Jul 16:35:31.432 # +config-update-from sentinel 10.0.1.101:16379 10.0.1.101 16379 @ mymaster 10.0.1.101 6379
57464:X 07 Jul 16:35:31.432 # +switch-master mymaster 10.0.1.101 6379 10.0.1.101 6379
57464:X 07 Jul 16:35:31.432 * +slave slave 10.0.1.102:6379 10.0.1.102 6379 @ mymaster 10.0.1.101 6379
57464:X 07 Jul 16:35:36.519 # +sdown slave 10.0.1.102:6379 10.0.1.102 6379 @ mymaster 10.0.1.101 6379
Giờ thì kiểm tra xem NODE nào được lên làm master:
$ redis-cli -p 16379 sentinel get-master-addr-by-name mymaster
1) "10.0.1.101"
2) "6379"
Ta thử khởi động lại master lúc nãy, và xem trong log sẽ thấy nó đã được gia nhập nhóm lại, nhưng bây giờ với vai trò là slave