西安“一码通”故障问题解析,IT专业人士给出这些建议

时间:2021-12-28来源:栏目:新媒体

21世纪经济报道记者毕华章 西安报道Xi的抗疫工作仍在进行中。自广泛要求48小时有效核酸政策发布以来,Xi“一码通”出现系统故障。具体故障包括健康码无法打开,点击二维码后页...

21世纪经济报道记者毕华章 西安报道

Xi的抗疫工作仍在进行中。自广泛要求48小时有效核酸政策发布以来,Xi“一码通”出现系统故障。

具体故障包括健康码无法打开,点击二维码后页面空白;核酸报告系统有问题,结果无法显示;在恢复过程中,中国电信的手机网络可以打开健康码,但中国移动等不及了。

针对Xi“一码通”故障,Xi高新区某片区10余名“一线大厂”技术专家就问题进行了讨论交流,从前端、后端、测试等方面分析推测了各种可能出现的问题及原因,并给出了多项建议。

其中几位接受了21世纪经济报道记者的采访,详细讲解了这些专业技术和行业术语,方便更多业内外人士了解情况,促进“一码通”的正常运行维护和防疫保障。

21世纪经济报道记者致电Xi安大数据资源管理局多个业务部门,但电话无人接听。

问题推测:性能过载、架构设计、容灾备份

经过讨论,技术人员认为限流是主要问题之一。

市民在长时间刷不出健康码的情况下,多次退出刷新重试,新流量到达服务器,导致服务器压力增大,负载增加。他们认为,Xi的“一码通”系统可能没有采取限流措施。

然后是服务器问题。企业和个人在租用服务器时都会受到峰值负载限制。一旦超过服务器的负载能力,服务器将瘫痪,应用程序将被挂起,网站将无法访问。服务器瘫痪的原因是同一时间段访客量大,导致高流量的涌入,超出了服务器的承受能力。这与Xi安大数据局局长刘军在发布会上给出的答案接近。

类似的假设包括性能过载和场景问题。他们认为这是典型的性能过载场景。也许内因是数据库瓶颈和网络链路数瓶颈,但外因是过载。

据他们分析,或许Xi安“一码通”是一个门户,核酸等“卡”的数据是各子系统带来的服务器宕机。

高峰期市民一起访问,导致服务器瞬时访问流量飙升,数据库性能跟不上。最后,Xi安的整个“一码通”服务失败了,这在之前的设计中可能没有考虑到。

在设计漏洞方面,可能没有考虑高流量、高负载的情况,导致测试不充分;产品设计没有考虑数千万并发访问,交付前也没有进行同样级别的压力测试。

此外,还可能涉及架构问题。

Xi安“一码通”功能影响“核酸检测”服务,说明模块之间从接口到数据调用的交互可能不是微前端、微服务架构。

在接受21世纪经济报道记者采访时,高新区某小区业主、IT行业前端工作人员李女士表示,安的“一码通”页面与核酸检测页面相关,正常情况下这两个业务已经很大了。“一码通”不仅包含自身数据,还包含核酸检测数据。两个模块原则上不应该互相影响,相关性也不应该很高。事实上,它们可以分成两个不同的模块并分开,以减少它们之间的粘性。这样做的好处是两块不会互相影响。如果数据仍然相关,关联程度可以最小化,即使一个服务有问题,另一个也可以独立运行。

技术专家认为,接口上发生的事情,可能意味着“一码通”和核酸检测两个模块之间不仅存在问题,后端和前端的架构也存在问题,可能不是微前端、微服务架构,没有很好的分离。

他们还讨论了不同的域名解析系统、灾难恢复备份不足等问题。比如在中国电信的网络信号可以打开,中国移动的网络信号却不能打开的情况下,这可能是因为不同的运营商依赖不同的DNS(域名解析)系统,又因为Xi安“一码通”系统是电信相关公司,指向新IIP的DNS见效最快。

他们认为,在国内外疫情形势依然严峻的背景下,Xi安“一码通”相关系统的容灾备份建设仍存在不足,存在故障隔离和流量控制处理、运维计划不足、伸缩性不够灵活等问题。

未来“一码通”如何优化完善?

技术专家给出的产品建议是剥离业务,将小程序中具有高度业务相关性的模块分离出来。

在系统建议方面,他们给出了快速响应的短期建议和项目稳定性的长期建议。

短期内可以优化页面,善意提醒用户耐心等待。当查询结果无法显示时,为避免公众猜测,应在页面上进行友好提示,而不是“忙,没反应”等。

同时,访问节流和短时间内的多个请求可以作为防抖机制。由于核酸的结果在24小时内(或更长或更短)是恒定的,因此建议可以使用缓冲机制。24小时间隔后,再次访问强制刷新,界面可以有时间戳参数。

项目稳定性的长期建议包括更专业的术语。例如,尽可能简单的数据模型可以快速响应回调;组件被沉淀并重新使用,以减少项目的体积;建立中间站,减少对后台数据的直接请求;崩溃预警,让相关开发者在线快速响应。

在系统设计方面,技术专家给出的建议包括架构设计、云原生、中间件选择、分层管理、内容分发网络缓存、网络可用性等。

比如,就分级管理而言,IT内部人士、后端工作人员Bird(化名)告诉21世纪经济报道记者,分级管理可以根据业务重要性进行,更好的硬件优先考虑核心应用和服务,在服务部署上进行必要的隔离,避免失败的连锁反应。

低优先级服务可以通过启动不同的线程或部署在不同的虚拟机上来隔离,而高优先级服务需要部署在不同的物理机上伯德

说。

再如安全提升方面,他建议,可以提升西安“一码通”系统机房安全等级,以应对各种极端情况,“建议参考银行一类业务系统建设标准。也可以关闭不用的端口,减少不必要的暴露。”

另外,在高可用设计方面,他们也给出了诸多专业建议。例如,数据冗余问题,以关系数据库为例,可采取读写分离,极端故障可以进行主从切换实现故障恢复。

测试方面,建议添加高性能自动化测试、压力测试,并且在发布前做预防机制。进行服务演练,经常开展各种应急演练、灾备演练工作,提高问题处理效率及验证灾备系统可用性。

尽管具体原因运营方并未详尽公布,但是技术咖们依然愿意对西安“一码通”问题提出分析与建议,将各类可能的环节考虑周全,供业内外参考,为西安抗疫贡献力量。

1.本站部分来源于互联网用户自主整合上传,如有侵权,请联系我们删除;

2.文章内容并不代表本站的观点或立场,如有关于文章内容,版权或其它问题请联系删除;

3.本文地址:https://www.jiatu888.com/xmt/87726.html

最新文章

网站介绍

本站部分内容收集于互联网,如有侵犯贵司(个人)版权,请联系本站删除。

Copyright@2018-2021 www.jiatu888.com 嘉图网 All Rights Reserved 粤ICP备20051635号 网站地图 tag列表

嘉图网