Surpath Dolphin DevOps 2.0 基于跨境网络延迟的问题,成熟的比较直接的解决方案是通过SDWAN或者专线来解决网络连通的质量问题,但是成本比较贵,5M带宽年费就在10万上下,对于一个创业公司来讲,网络开销的成本占比到运维成本的30%,是不太合理的,也是不容易接受的; 另外随着不同国家地域,不同云厂商对于创业公司的支持力度,我们也开始采用混合云架构来进行运维侧的第二次升级--Dolphin 2.0. Dolpin 2.0 的核心在于前端的代码、服务层代码的本地化部署,DNS的智能路由,nginx 的反向代理, Netty TCP 长链接的构建4个方面。 智能DNS路由可以基于用户地理位置、运营商实现就近接入,这样就会智能调度到不同地域、不同的云服务器部署的前端工程上,页面的加载缓慢问题就会从根本上进行解决。解决后端服务请求慢的核心问题在于代理侧,比如从aws美国加州 --> 阿里云华北1区 ping会比较慢,但是从aws美国加州 --> oracle singapore --> 阿里云华北1区ping会比较快,所以我们可以利用oracle singapore 服务器作为转发侧,使用nginx作为七层反向代理。 Surpath Dolphin DevOps 3.0 随着物流履约、跨境供应链、数据服务业务线的逐步扩展,前后端微服务井喷式地爆发,运维的工作越来越重, 前端工程多达30个左右,后端服务也在40个上下,宿主机的CPU、内存、磁盘、网络等问题频发,服务器的资源调配及优化,水平弹性扩容,混合云几十个节点的管理等所花费时间、成本都比较高,运维的同事每天都在疲于进行线上问题的排查及处理。由此我们进行了运维体系的第三次升级--Dolphin 3.0 。Dolphin 3.0 的核心在于容器化升级、K8s 的引入、Rancher 多云的管理、云原生托管服务的使用。 Docker对系统资源的利用率更高,一致的运行环境,支持回滚和版本管理,更加轻松地进行迁移和水平扩展;结合阿里云镜像中心,私有化搭建的Harbor镜像中心,亚马逊的ECR中心,能够高效进行应用镜像仓库的管理。多地镜像中心的构建也是在跨境贸易系统构建过程中必不可少的环节,否则在进行容器部署时,拉取镜像会出现网络超时等问题,导致CD流程中断。 K8s完成了对于容器服务的编排,使运维工作更加轻松;提供RBAC权限体系及Namespace,能够更加便捷地进行资源、应用的权限隔离;统一的资源调度、健康检查、监控体系,让运维能够通过多种方式实时感知应用的存活状态;自我修复、资源回收、滚动发布及回滚机制,极大地节约了运维线上优化的时间。同时阿里云、AWS、OCI提供云原生的k8s托管服务,对于网络性能、磁盘IO读写要求较高的服务,可以完全使用云原生服务进行托管。 Rancher 提供了一个统一的可视化平台,降低了运维管理混合云k8s集群的门槛,但是复杂的场景还是需要通过kubelet进行;同时kt-connect也能够让你本地和cluster 建立一个connect shadow, 便于进行问题的排查。