千寻CORS如何做到“每秒服务百万用户”-支撑千寻服务稳定性的是一项 “高并发”技术能力

千寻CORS的稳定性用过的人都知道。支撑千寻服务稳定性的是一项 “高并发”技术能力。什么是“高并发”?“高并发”它是指大量用户(终端)的快速访问。对于网络平台来说,如果没有良好的高并发处理能力,它会导致服务中断或服务器死机。

千寻CORS的稳定性用过的人都知道。支撑千寻服务稳定性的是一项 “高并发”技术能力。

什么是“高并发”?“高并发”它是指大量用户(终端)的快速访问。对于网络平台来说,如果没有良好的高并发处理能力,它会导致服务中断或服务器死机。

2021年,千寻定位高精度定位服务平台的高并发能力达到每秒100万级,即每秒可为100多万用户提供高精度定位服务。

这不仅是行业的提升,也是整个互联网的高水平能力。这是怎么做到的?下面莱佳德科技小编将从系统能力和运维能力两个方面分析技术要点。

系统能力:水平扩展基于分布式服务架构设计的千寻位置高精度位置服务平台,具有 “海量用户”服务扩展能力,增加服务器可以服务更多的用户。在具体的实现路径上,主要分为四个步骤:

第一步:自主研发SpaceX高性能分布式框架千寻位置的服务具有覆盖面广、规模大、实时性要求高的特点需要千寻定位高精度定位服务平台以高灵活性效率。鉴于这种情况,自2015年以来,千寻定位独立开发了内部代号SpaceX高性能分布式应用框架。

SpaceX框架:一个巨大的计算任务可以分为几个小任务,并分配给每台计算机。计算机集群通过并行处理提高了效率,在统一管理和控制下完成了大规模的信息处理任务。国家北斗基础增强系统“全国一张网”解算,就是通过SpaceX框架,分为几千个小网任务,分布在几百台机器同时解算。

第二步:快速复制数据扩展坞程序Switch千寻位置针对国家北斗地基增强系统的快速复制“全国一张网”能力,开发了一个扩展坞程序,它被命名为Switch。Switch复制算法生成的多个网格数据,然后将复制的数据分发给下游用户。

第三步:提高效率,集中处理提高处理性能。千寻高精度位置服务平台中的热点识别应用程序将识别用户分布较多的区域,集中同一区域的用户进行处理,大大提高性能,降低服务器压力,达到降低成本率的效果。

第四步:用户均匀分布,减少用户连接服务的平均排队时间,千寻位置高精度位置服务平台将有特殊的负载平衡SLB应用程序指导用户处理哪个服务器。这样,每个服务器的压力平衡,用户的平均等待时间就减少了。

系统能力:服务高可用千寻位置高精度位置服务平台不仅要支持用户,还要保证服务的高可用性。千寻位置做了多套服务冗余备份,在数据中心下分为6个可用区和3个隔离集群。

6个可用区,主要是为了防止单机房出现故障,可用区的概念有点像当地的机房;•三个隔离区群按千寻位置的业务群划分。由于不同行业(智能电子设备、汽车、测绘等)RTK)对于不同要求和标准的高精度位置服务,隔离区群可以互补干扰。

系统能力:自我保护千寻位置高精度位置服务平台在流量突然增加时拥有自我保护机制,主要是流量控制和熔断机制。

一、流控有六个影响因素,主要包括算法A/B群灰度、链路规则、用户应用、产品、区域、百分比,根据这六个因素的不同排列组合,可以形成适合不同用户的策略。例如,有一种只适合广东电力的策略,如果有这种路线规划,你可以准确地将这项服务推给客户。

二是保险丝机制的建设。千寻位置的服务实际上是有容量的。比如现在容量1亿,流量突然来了2亿。千寻位置的高精度位置服务平台可以实现自我保护,优先服务前1亿用户。随着服务器的扩展,逐渐支持2亿流量的涌入。

运维能力:基于系统可视化和智能定位能力,千寻位置高精度位置服务平台可以快速定位问题。

系统可视化能力由业务监控大屏幕、应用处理能力监控大屏幕和云资源服务状态监控大屏幕组成。从这三个维度来看,系统完全变得透明。

业务监控大屏幕实时显示在线用户数量、整体分布、定位状态、特定用户组和在线工具(距离测量、定位、回放);应用处理能力监控大屏幕核心显示用户实时连接数,每秒新增连接数,每秒下线连接数;云资源服务状态监测可查看CPU使用情况、内存使用情况、TCP网络连接状态等。

智能定位能力由系统控制台、网格异常分析和基站异常分析组成,主动判断用户服务是否正常,问题是否由基站引起,是否受周围环境影响。

运维能力:快速恢复千寻位置高精度位置平台具有从问题中快速恢复的能力,分为快速响应、记录通知、启动计划和工具处理四个步骤。

首先,千寻位置设置7*24小时值班的应用监控室响应问题;其次,千寻位置应急平台记录事件,通过电话、软件系统通知相关运维、开发等处理人员;第三,日常处理计划记录,运维人员与系统流程相结合+工具、自动操作减少错误,实现快速恢复能力;最后,日常标准流程升级为工具执行,无需人工干预,提高效率,避免人为不可控因素。

操作和维护能力:故障演练混沌工程是分布式系统学科。通过长时间的测试,模拟功能测试、性能测试和极端场景测试发现系统很难通过传统的测试方法进行模拟和测试BUG。

混沌工程主要解决网络中断、服务器停机等极端情况。通过长时间的测试和频繁的验证,培养系统级的反应能力并加以巩固,并在真正遇到问题时做出反应。

莱佳德科技提供测绘仪器以旧换新,测绘仪器维修,测绘仪器检定,全站仪租赁销售,工程测量业务承接。 需要购买全站仪GPS-RTK水准仪经纬仪测绘仪器,或有测绘仪器相关问题可以联系莱佳德科技

版权说明|莱佳德科技南京有限公司尊重原创,图片和文章的版权为原作者所有,若有侵权请联系本单位,我们会及时声明或删除。

苏ICP备2022025297号
点击咨询客服
点击咨询客服