0


zookeeper

一、配置和安装

(1)下载zookeeper-3.4.6.tar.gz

 解压 tar xf zookeeper-3.4.6.tar.gz 

 一般放在opt目录下

 mkdir/opt/ly

 mv zookeeper-3.4.6 /opt/ly

(2) yum安装的jdk是开源的openJDK, 最好用oracle的hotspot JVM 需要到官网下载

(3) zookeeper的文件目录配置目录conf中,zoo_sample.cfg 是配置模板,拷贝一下:

cp zoo_sample.cfg zoo.cfg         zookeeper启动默认加载的配置文件的名字是zoo.cfg

配置好后,将文件夹分发到其他从服务器

(4)vi zoo.cfg

 tickTime=2000    维持主从服务器之间的心跳时间2S

 initLimit=10         初始化的次数10次,leader等待follower2000*10 = 20S的一个初始延迟,超过以后不要此follower

 syncLimit=5         5*2000=10S ,leader向flower发送信息,10没有反馈,则被放弃

 dataDir=/tem/zookeeper    持久化目录,改为/var/ly/zk      /var目录是存放临时数据的

 clientPort=2181    客户端链接时使用的端口号

 maxClientCnxns=60   允许客户端最大的链接数

配置所有zookeeper:server.1=node01:2888:3888  (node01是ip)

                                   server.2=node02:2888:3888

                                   server.3=node03:2888:3888

                                  server.4=node04:2888:3888

    第一次启动 ,一般会推选id号最大的为leader,断电后再次启动,会比较谁的数据最完整,若都完整,则再比id号

(5)选择leader 还是其他,都是过半通过(n/2+1)。

(6) 创建持久化的目录:mkdir -p /var/ly/zk

  在此目录下创建文件myid   -- 写入1(配置文件中的id号,即server.id号)

(7) 配置好以后,将zookeeper文件夹,分发到各个服务器:

scp -r ./ly/    node02:'pwd'     将ly真个文件夹,分发到node02的相同目录下

mkdir -p /var/ly/zk

echo 2 > /var/ly/zk/myid

(8)将可执行目录放到环境变量path中,其命令就可以在任何地址使用

vi /etc/profile

        export ZOOKEEPER_HOME=/opt/ly/zookeeper-3.4.6

        export PATH=SPATH:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin

将配置文件加载到内存:   . /etc/profile 或者 source /etc/profile

 zk+table键,即可出现可使用的命令

  分发配置文件: scp  /etc/profile  node01:/etc

二、zookeeper使用

(1)启动: zkServer.sh help ---查看一些命令

                zkServer.sh start  --后台启动

                zkServer.sh start-foreground --前台启动,实时打印日志

 (2) zkserver.sh status -- 查看状态、身份leader or follower

 (3) 启动第三台后,就可以使用过半通过策略,选出第三台是 leader,然后启动第四台,日志中:Getting a smapshot from leader   -- 复制快照

 (4) 链接zookeeper命令行的客户端: zkCli.sh

      命令:help    -- 查看所有命令

      ls / -----  查看根目录节点

      create /ooxx ""    -- 创建ooxx   后面“”是数据,没有则使用空“”

      create /ooxx/xxoo ""

      ls /ooxx

      get /ooxx    ---- 查看ooxx节点的数据

     set  /ooxx  "hello"  --设置数据,只能放1M数据,是二进制安全的(外面推送什么样的字节数组,就存什么样的,必须给字节数组)

      get  /ooxx : 

                ![](https://img-blog.csdnimg.cn/1afe9b614f094d1a97fdc370e70dbb95.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_16,color_FFFFFF,t_70,g_se,x_16)

                cZxid: c是创建create,Zxid是顺序执行的id,0x2是前32位(二进制位),2表示现在是变换的第几个leader,000000002是增删改事务操作的递增id,保证leader顺序执行命令

                ctime: 修改操作的时间

                mZxid: 修改事务id  -- (set /ooxx "hello")

                pZxid: get的节点中,创建最后一个节点的id

                ephemeralOwner: 临时持有者,0x0 表示现在的节点,没有归属者,是持久节点

                          一个客户端链接zkCli.sh ,会创建一个session

                          create -e /xoxo "adalff"     ----- /e是临时节点,是当前客户端存在的情况下,此节点会同步到其他服务器,如果此客户端停止,则此节点消失伴随会话期。

                          ephemeralOwner 会显示sessionID

   (5) 链接一个客户端,会有一个事务,将此客户端的sessionID同步到其他服务器中,zxid会增加1,断开客户端链接,会同步其他客户端删除此sessionID。

      很多客户端都想在同一节点创建数据,-s是序列化,不会覆盖创建

                    create  -s /abc/xxx 'sdfsd'   ---自动生成xxx000000000

                第二个客户端同样创建xxx: create  -s /abc/xxx 'afdafa'   ----生成文件xxx000000001

         删除  rmr /abc/xxx/xxx000000001

         重新create,名字中的id会从02开始

      create -s -e /xxx  --- 可以同时设置序列化、临时节点

   (6) netstat -natp | egrep '(2888|3888)'    ---- egrep指后面写正则表达式,查询关于2888和3888相关的链接

     3888:选主投票用的,节点直接可以相互通信

            ![](https://img-blog.csdnimg.cn/ab06033bebb54a05af795eb8fb502824.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)

     2888:leader接受write请求,只能follower和leader之间通信。

三、zookeeper特性

  (1) 扩展性

            角色:leader、follower([ˈfɒləʊə(r)]追随者)、observer( [əbˈzɜːvə(r)] 观察者)

            读写分离:leader写,follower和observer读

                                    leader挂了以后,只有follower可以选举投票,因为follower的数量决定选                                     举的时间快慢,所以在庞大的集群里面,30台的话,个位数的为follower即                                       可,5台也可以,observer是放大查询能力;

                     配置文件中:  server.1=node01.2888:3888

                                             server.1=node01.2888:3888

                                             server.1=node01.2888:3888

                                             server.1=node01.2888:3888:observer

      (2)可靠性:攘其外必先安其内  ---- 快速恢复、数据的可靠、可用、一致性

               搜寻:paxos site:douban.com    [ˈpæksoʊs]  -- 文章

                 paxos 是一个基于消息传递的一致性算法

           leader挂了以后,选举过程中,不对外提供读操作。(即只要有一个server不和leader的2888连接,所有server都不提供服务)   

      (3) ZAB      原子广播协议 (paxos的简化)

              ![](https://img-blog.csdnimg.cn/da33477cdfc243219b0adb950ac5f1cc.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)

           每个follower和leader连接都会各自有一个发送信息的队列,client提出create请求,follower将请求提交给leader,leader发起让每个follower将创建这个事情,写入日志,follower回送一个ok的消息,leader也是一个ok,一个leader和一个follower 是2个 ,已经过半,则leader向每个follower发送write 信息更改内存数据信息,follower会返回一个ok,最终一致。最后leader 返回给follower,再返回给client-ok。

      如果右边follower 还没有执行write命令,与leader不同,则client调用时,可以先调用sync同步的方法,再回调client的方法, sync同步方法是自己选择调用或者不调用。

      若follower挂掉以后,再启动会连接leader,同步数据,同步完成后再开始接收服务。

     任何操作,没有完成leader就挂了,就会回滚。

      如果有5台,最多挂2台,选举过半原则,需要3台同意才可,如果挂了3台,则zookeeper会处于不可用的状态。

    (4) jps命令:查看当前所有java进程的pid。

当server挂的数量超过半数,则所有不可对外提供服务,但是正常的serve进程还在。

            如果有4台zk,leader-node04挂了,node03先察觉到,node03向1和2发送消息,并推选自己为leader,node02的zid比3高,则node02否定3,并推送消息给1和3,选择自己为leader,1收到2的消息,id是2比自己大,表示同意,并向2和3推送消息-同意推选2,3收到2的消息则也表示同意,向1和2推送消息选2,则2是3票,1、2、3都是2是3票,2为leader,并向大家同步数据。

(5)watch 监控

     ![](https://img-blog.csdnimg.cn/d0ac5d0a4cc340f3a2403738a30a2e5c.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAKuixhuixhg==,size_20,color_FFFFFF,t_70,g_se,x_16)

  集群与客户端用的版本号要一样

四、分布式锁

 (1) 多个客户端访问同一资源,需要上锁,锁放到zookeeper中,

1. 争抢锁,只有一个人能获得锁

           2. 获得锁的人出问题,挂掉会变成死锁,所以整成临时节点(session) 

           3. 获得锁的人成功了,释放锁

           4. 锁被释放,删除,别人如何知道:

                 4-1 主动轮询,心跳。 弊端:延迟,客户端多的话zookeeper压力大

                 4-2 watch 解决延迟问题,弊端:压力

                 4-3 sequence + watch :watch前一个节点,最小的获得锁,最小的释放以后,只会通知下一个。          

       

   
标签: zookeeper

本文转载自: https://blog.csdn.net/tedfdndg/article/details/121410721
版权归原作者 *豆豆 所有, 如有侵权,请联系我们删除。

“zookeeper”的评论:

还没有评论