断连4小时,5G覆盖下的广东电信怎么了?

断连4小时,5G覆盖下的广东电信怎么了?

6月8日下午,广东电信出现大范围断连,影响用户达4500万以上,通信全面恢复时间长达4-5小时,直到晚上7点多才完全恢复。 以下是详细分析:

时间线

6月8日下午,大量广东电信用户反馈手机无法打电话和上网(后确认上网功能不受影响)。

下午2点左右,用户开始报告无法拨打电话。

下午4点左右,官方微博通报了这一事件。

晚上7点多,通信全面恢复。

影响范围

不仅限于广东地区的电信用户,使用广东电信卡的用户无论身处何地都受到影响。

广东电信用户总数量达到4500万以上。

特殊现象

受影响用户仅电话与短信功能无法使用,上网功能不受影响。

核心网故障

广东电信的核心网出现故障,具体为LDRA(本地Diameter路由代理)到HDRA(高层Diameter路由代理)之间链路出现拥塞现象。

链路拥塞原因:可能为某设备商的数通设备出现异常,导致数据包重传,引起信令风暴。

技术背景

DRA(Diameter Routing Agent):负责LTE Diameter信令目的地址翻译和转接,实现LTE用户的鉴权、位置更新、计费管理等功能。

LDRA与HDRA:LDRA负责省内不同地区的信令转接,最终统一接入省级的HDRA。HDRA的故障会导致全省范围内的通信中断。

通话与网络独立:4G时代后,通话业务通过IMS线路传输,互联网通过LTE线路传输,两者独立,因此故障仅影响通话与短信。

应急方法

在SBC(会话边界控制器)部署了流量控制流程。

将某设备商的路由器隔离,以缓解链路拥塞。

恢复时间

通信全面恢复时间长达4-5小时,远超一般服务器宕机事件的恢复时间(通常半小时内解决)。

防灾冗余机制失效

中国电信曾实现5G核心网用户数据库网元全故障极端场景下仍保持用户业务的可用,但本次断连事件中,这些防灾措施并未发挥作用。

可能原因:5G核心网并未出现故障,防灾机制未设置3G数据向上逃逸的方案。

通信备份的重要性

电话与短信仍是用户的重要通信方案,尤其在数据网络覆盖有限的情况下,2G或3G通信仍是重要的备份通信方式。

运营商需继续提高或优化防灾能力,以应对未来可能发生的更大范围通信中断事故。