
6月8日下午,广东电信出现大范围断连,影响用户达4500万以上,通信全面恢复时间长达4-5小时,直到晚上7点多才完全恢复。 以下是详细分析:
时间线:
6月8日下午,大量广东电信用户反馈手机无法打电话和上网(后确认上网功能不受影响)。
下午2点左右,用户开始报告无法拨打电话。
下午4点左右,官方微博通报了这一事件。
晚上7点多,通信全面恢复。
影响范围:
不仅限于广东地区的电信用户,使用广东电信卡的用户无论身处何地都受到影响。
广东电信用户总数量达到4500万以上。
特殊现象:
受影响用户仅电话与短信功能无法使用,上网功能不受影响。
核心网故障:
广东电信的核心网出现故障,具体为LDRA(本地Diameter路由代理)到HDRA(高层Diameter路由代理)之间链路出现拥塞现象。
链路拥塞原因:可能为某设备商的数通设备出现异常,导致数据包重传,引起信令风暴。
技术背景:
DRA(Diameter Routing Agent):负责LTE Diameter信令目的地址翻译和转接,实现LTE用户的鉴权、位置更新、计费管理等功能。
LDRA与HDRA:LDRA负责省内不同地区的信令转接,最终统一接入省级的HDRA。HDRA的故障会导致全省范围内的通信中断。
通话与网络独立:4G时代后,通话业务通过IMS线路传输,互联网通过LTE线路传输,两者独立,因此故障仅影响通话与短信。
应急方法:
在SBC(会话边界控制器)部署了流量控制流程。
将某设备商的路由器隔离,以缓解链路拥塞。
恢复时间:
通信全面恢复时间长达4-5小时,远超一般服务器宕机事件的恢复时间(通常半小时内解决)。
防灾冗余机制失效:
中国电信曾实现5G核心网用户数据库网元全故障极端场景下仍保持用户业务的可用,但本次断连事件中,这些防灾措施并未发挥作用。
可能原因:5G核心网并未出现故障,防灾机制未设置3G数据向上逃逸的方案。
通信备份的重要性:
电话与短信仍是用户的重要通信方案,尤其在数据网络覆盖有限的情况下,2G或3G通信仍是重要的备份通信方式。
运营商需继续提高或优化防灾能力,以应对未来可能发生的更大范围通信中断事故。
