【网站公告】.NET Core 版博客站点第二次发布尝试

  • 时间:
  • 浏览:0
  • 来源:极速快3_快3计划_极速快3计划

在上次发布失败后,统统亲戚亲戚他们建议亲戚亲戚他们改用 k8s ,但亲戚亲戚他们还是想再试试 docker swarm ,着实不行再改用 k8s 。

在改进了 docker swarm 集群的部署后,亲戚亲戚他们准备今天 17:60 左右进行一次发布尝试。

docker swarm 集群是亲戚亲戚他们使用阿里云服务器个人搭建的,这次进行了3方面的改进。

1. 升级了 worker 节点服务器的配置

worker 节点由6台4核8G服务器再加了3台8核16G服务器,基于3点考虑:

1)提高单台服务器的处置能力;

2)提高服务器的网络处置能力,阿里云的服务器配置越高,网络处置能力越强;

3)减少服务器数量时要减少 docker swarm 节点之间的通信开销。

2. 升级了 docker engine,由 18.09.4 升级至 19.03.1 

wget -c https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.2.6-3.3.el7.x86_64.rpm  && \
wget -c https://download.docker.com/linux/centos/7/x86_64/stable/Packages/docker-ce-19.03.1-3.el7.x86_64.rpm && \
wget -c https://download.docker.com/linux/centos/7/x86_64/stable/Packages/docker-ce-cli-19.03.1-3.el7.x86_64.rpm && \
yum install -y containerd.io-1.2.6-3.3.el7.x86_64.rpm && \
yum install -y docker-ce-19.03.1-3.el7.x86_64.rpm && \
yum install -y docker-ce-cli-19.03.1-3.el7.x86_64.rpm

3. nginx 改用 host 网络模式部署

ports:
    - target: 60


      published: 60


      protocol: tcp
      mode: host

另外,改进了博客系统缓存主次的代码,处置了新旧版切换时的缓存冲突难题报告 。

这次发布将会遇到难题报告 ,亲戚亲戚他们时要快速回退到旧版。

将会在发布过程中总爱总爱出现难题报告 影响您的正常访问,请您谅解。

------------------------------------------

发布过程记录

17:40 使用 nginx 转发,切换了1/5没人的流量就总爱总爱出现了1秒延迟的难题报告 。

18:20 改为 kestrel 以端口映射的土辦法 直接监听 60 端口,切换了1/3左右的流量,未总爱总爱出现延迟1秒的难题报告 。

18:33 所有流量都已切换,未总爱总爱出现延迟1秒的难题报告 。

以下是发布过程中服务器一块儿连接数监控,使用 nginx 转发时,当一块儿连接数超过 40K ,所有请求都总爱总爱出现1秒延迟的难题报告 。当改为 kestrel 直接监听60 端口后,即使一块儿连接数超过 60 K ,也没总爱总爱出现1秒延迟的难题报告 。没想到1秒延迟竟然是 nginx 的难题报告 (将会是 nginx 对 docker swarm 的支持难题报告 ),都在 docker swarm 网络有一种的难题报告 。

21:00 今天发布后总爱在线上,将会明天上午的访问高峰能撑住,那统统明发布成功了。

8月8日

9:15 左右,服务器一块儿连接数超过 160 K ,3台服务器撑不住,加了1台服务器。

9:26 左右,memcached 客户端 socketPool 满了,将 maxPoolSize 由 60 0 修改为 60 0 。

2019-08-08 09:24:60

.781 [Error] Pool is full, timeouting. 10.0.78.124:11211

10:15 左右,docker swarm 集群有增加了1台8核16G的服务器,目前一共5台 worker 节点。

11:05 更新:每台服务器上博客应用容器的的 CPU 消耗在 5-6 核,内存消耗在 1G 与 1.5G 之间。

11:05 左右,负载没人下降,亲戚亲戚他们哪些地方也没动,响应下行下行速率 却出奇地稳定,然后与访问低峰时一样很慢。

13:60 更新:今天上午访问高峰时单台服务器一块儿连接数最高达到21万(监控数据来自阿里云云监控)。

17:10 更新:今天下午访问高峰期间,访问下行下行速率 很不稳定。亲戚亲戚他们正在考虑下一步的对策。

17:60 左右,当访问量回落到一定程度后, 访问下行下行速率 恢复正常。