一、配置和安装
(1)下载zookeeper-3.4.6.tar.gz
解压 tar xf zookeeper-3.4.6.tar.gz
一般放在opt目录下
mkdir/opt/ly
mv zookeeper-3.4.6 /opt/ly
(2) yum安装的jdk是开源的openJDK, 最好用oracle的hotspot JVM 需要到官网下载
(3) zookeeper的文件目录配置目录conf中,zoo_sample.cfg 是配置模板,拷贝一下:
cp zoo_sample.cfg zoo.cfg zookeeper启动默认加载的配置文件的名字是zoo.cfg
配置好后,将文件夹分发到其他从服务器
(4)vi zoo.cfg
tickTime=2000 维持主从服务器之间的心跳时间2S
initLimit=10 初始化的次数10次,leader等待follower2000*10 = 20S的一个初始延迟,超过以后不要此follower
syncLimit=5 5*2000=10S ,leader向flower发送信息,10没有反馈,则被放弃
dataDir=/tem/zookeeper 持久化目录,改为/var/ly/zk /var目录是存放临时数据的
clientPort=2181 客户端链接时使用的端口号
maxClientCnxns=60 允许客户端最大的链接数
配置所有zookeeper:server.1=node01:2888:3888 (node01是ip)
server.2=node02:2888:3888
server.3=node03:2888:3888
server.4=node04:2888:3888
第一次启动 ,一般会推选id号最大的为leader,断电后再次启动,会比较谁的数据最完整,若都完整,则再比id号
(5)选择leader 还是其他,都是过半通过(n/2+1)。
(6) 创建持久化的目录:mkdir -p /var/ly/zk
在此目录下创建文件myid -- 写入1(配置文件中的id号,即server.id号)
(7) 配置好以后,将zookeeper文件夹,分发到各个服务器:
scp -r ./ly/ node02:'pwd' 将ly真个文件夹,分发到node02的相同目录下
mkdir -p /var/ly/zk
echo 2 > /var/ly/zk/myid
(8)将可执行目录放到环境变量path中,其命令就可以在任何地址使用
vi /etc/profile
export ZOOKEEPER_HOME=/opt/ly/zookeeper-3.4.6
export PATH=SPATH:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin
将配置文件加载到内存: . /etc/profile 或者 source /etc/profile
zk+table键,即可出现可使用的命令
分发配置文件: scp /etc/profile node01:/etc
二、zookeeper使用
(1)启动: zkServer.sh help ---查看一些命令
zkServer.sh start --后台启动
zkServer.sh start-foreground --前台启动,实时打印日志
(2) zkserver.sh status -- 查看状态、身份leader or follower
(3) 启动第三台后,就可以使用过半通过策略,选出第三台是 leader,然后启动第四台,日志中:Getting a smapshot from leader -- 复制快照
(4) 链接zookeeper命令行的客户端: zkCli.sh
命令:help -- 查看所有命令
ls / ----- 查看根目录节点
create /ooxx "" -- 创建ooxx 后面“”是数据,没有则使用空“”
create /ooxx/xxoo ""
ls /ooxx
get /ooxx ---- 查看ooxx节点的数据
set /ooxx "hello" --设置数据,只能放1M数据,是二进制安全的(外面推送什么样的字节数组,就存什么样的,必须给字节数组)
get /ooxx :
![](https://img-blog.csdnimg.cn/1afe9b614f094d1a97fdc370e70dbb95.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_16,color_FFFFFF,t_70,g_se,x_16)
cZxid: c是创建create,Zxid是顺序执行的id,0x2是前32位(二进制位),2表示现在是变换的第几个leader,000000002是增删改事务操作的递增id,保证leader顺序执行命令
ctime: 修改操作的时间
mZxid: 修改事务id -- (set /ooxx "hello")
pZxid: get的节点中,创建最后一个节点的id
ephemeralOwner: 临时持有者,0x0 表示现在的节点,没有归属者,是持久节点
一个客户端链接zkCli.sh ,会创建一个session
create -e /xoxo "adalff" ----- /e是临时节点,是当前客户端存在的情况下,此节点会同步到其他服务器,如果此客户端停止,则此节点消失伴随会话期。
ephemeralOwner 会显示sessionID
(5) 链接一个客户端,会有一个事务,将此客户端的sessionID同步到其他服务器中,zxid会增加1,断开客户端链接,会同步其他客户端删除此sessionID。
很多客户端都想在同一节点创建数据,-s是序列化,不会覆盖创建
create -s /abc/xxx 'sdfsd' ---自动生成xxx000000000
第二个客户端同样创建xxx: create -s /abc/xxx 'afdafa' ----生成文件xxx000000001
删除 rmr /abc/xxx/xxx000000001
重新create,名字中的id会从02开始
create -s -e /xxx --- 可以同时设置序列化、临时节点
(6) netstat -natp | egrep '(2888|3888)' ---- egrep指后面写正则表达式,查询关于2888和3888相关的链接
3888:选主投票用的,节点直接可以相互通信
![](https://img-blog.csdnimg.cn/ab06033bebb54a05af795eb8fb502824.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)
2888:leader接受write请求,只能follower和leader之间通信。
三、zookeeper特性
(1) 扩展性
角色:leader、follower([ˈfɒləʊə(r)]追随者)、observer( [əbˈzɜːvə(r)] 观察者)
读写分离:leader写,follower和observer读
leader挂了以后,只有follower可以选举投票,因为follower的数量决定选 举的时间快慢,所以在庞大的集群里面,30台的话,个位数的为follower即 可,5台也可以,observer是放大查询能力;
配置文件中: server.1=node01.2888:3888
server.1=node01.2888:3888
server.1=node01.2888:3888
server.1=node01.2888:3888:observer
(2)可靠性:攘其外必先安其内 ---- 快速恢复、数据的可靠、可用、一致性
搜寻:paxos site:douban.com [ˈpæksoʊs] -- 文章
paxos 是一个基于消息传递的一致性算法
leader挂了以后,选举过程中,不对外提供读操作。(即只要有一个server不和leader的2888连接,所有server都不提供服务)
(3) ZAB 原子广播协议 (paxos的简化)
![](https://img-blog.csdnimg.cn/da33477cdfc243219b0adb950ac5f1cc.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)
每个follower和leader连接都会各自有一个发送信息的队列,client提出create请求,follower将请求提交给leader,leader发起让每个follower将创建这个事情,写入日志,follower回送一个ok的消息,leader也是一个ok,一个leader和一个follower 是2个 ,已经过半,则leader向每个follower发送write 信息更改内存数据信息,follower会返回一个ok,最终一致。最后leader 返回给follower,再返回给client-ok。
如果右边follower 还没有执行write命令,与leader不同,则client调用时,可以先调用sync同步的方法,再回调client的方法, sync同步方法是自己选择调用或者不调用。
若follower挂掉以后,再启动会连接leader,同步数据,同步完成后再开始接收服务。
任何操作,没有完成leader就挂了,就会回滚。
如果有5台,最多挂2台,选举过半原则,需要3台同意才可,如果挂了3台,则zookeeper会处于不可用的状态。
(4) jps命令:查看当前所有java进程的pid。
当server挂的数量超过半数,则所有不可对外提供服务,但是正常的serve进程还在。
如果有4台zk,leader-node04挂了,node03先察觉到,node03向1和2发送消息,并推选自己为leader,node02的zid比3高,则node02否定3,并推送消息给1和3,选择自己为leader,1收到2的消息,id是2比自己大,表示同意,并向2和3推送消息-同意推选2,3收到2的消息则也表示同意,向1和2推送消息选2,则2是3票,1、2、3都是2是3票,2为leader,并向大家同步数据。
(5)watch 监控
![](https://img-blog.csdnimg.cn/d0ac5d0a4cc340f3a2403738a30a2e5c.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)
集群与客户端用的版本号要一样
四、分布式锁
(1) 多个客户端访问同一资源,需要上锁,锁放到zookeeper中,
1. 争抢锁,只有一个人能获得锁
2. 获得锁的人出问题,挂掉会变成死锁,所以整成临时节点(session)
3. 获得锁的人成功了,释放锁
4. 锁被释放,删除,别人如何知道:
4-1 主动轮询,心跳。 弊端:延迟,客户端多的话zookeeper压力大
4-2 watch 解决延迟问题,弊端:压力
4-3 sequence + watch :watch前一个节点,最小的获得锁,最小的释放以后,只会通知下一个。
版权归原作者 *豆豆 所有, 如有侵权,请联系我们删除。