陳濤 蘇玉珍
【摘要】 目前中國移動TD-SCDMA系統(tǒng)相對于GSM系統(tǒng)的主要優(yōu)勢是數(shù)據(jù)業(yè)務(wù),TD的H業(yè)務(wù)相對于GSM的EDGE業(yè)務(wù)的速率有明顯的優(yōu)勢。在TD的網(wǎng)絡(luò)優(yōu)化過程中,對數(shù)據(jù)業(yè)務(wù)性能提升非常關(guān)鍵,無速率,速率慢,速率不穩(wěn)定等影響因素比較大,需要詳細(xì)的了解數(shù)據(jù)業(yè)務(wù)傳輸過程,才能有效的分析數(shù)據(jù)業(yè)務(wù)受影響的方面,使數(shù)據(jù)業(yè)務(wù)的性能得到有效的提升。
【關(guān)鍵字】 TCP層數(shù)傳機(jī)制 RLC層數(shù)傳機(jī)制 HSPA數(shù)傳機(jī)制 TCP層時延底層數(shù)據(jù)傳輸
一、前言
數(shù)據(jù)業(yè)務(wù)在傳輸過程中一般會經(jīng)歷TCP/UDP,RLC及HSPA這幾層,其分別在移動通信系統(tǒng)中的位置見圖1。這些數(shù)據(jù)傳輸協(xié)議一般都具有復(fù)雜的數(shù)傳機(jī)制,如果配合不好會降低移動網(wǎng)絡(luò)傳輸效率。本文在介紹這幾類協(xié)議傳輸機(jī)制的基礎(chǔ)上,重點(diǎn)介紹網(wǎng)絡(luò)優(yōu)化過程中無線側(cè)對RLC層和HSPA數(shù)據(jù)傳輸?shù)挠绊?,提出常見問題的解決方案和措施以指導(dǎo)數(shù)據(jù)業(yè)務(wù)的優(yōu)化。(圖1)
二、TCP層數(shù)傳機(jī)制
TCP層主要是為上層提供面向連接的、可靠的按序傳送數(shù)據(jù)的服務(wù)。
TCP層主要采用“可變發(fā)送窗口機(jī)制”和“重傳機(jī)制”,“可變發(fā)送窗口機(jī)制”能夠自適應(yīng)底層帶寬、時延的變化。主要有“發(fā)送窗口”,“通知窗口”和“擁塞窗口”。
“通知窗口”的調(diào)整機(jī)制如圖2所示,通知窗口的大小會因為傳輸包的錯誤而不斷縮小。
“擁塞窗口”的調(diào)整可總結(jié)為三點(diǎn):“慢啟動”,“加速遞減”及“擁塞避免”,如圖3所示。
TCP層的重傳機(jī)制設(shè)置,TCP每發(fā)送一個報文段都會設(shè)置重傳定時器,如果定時器超時還收不到確認(rèn)消息則重傳該報文段。一旦發(fā)生重傳,就會導(dǎo)致?lián)砣翱诘淖兓?,進(jìn)而導(dǎo)致發(fā)送窗口變小,影響到業(yè)務(wù)速率。
三、RLC層數(shù)傳機(jī)制(AM)
RLC層主要是3G系統(tǒng)的無線接入網(wǎng)為高層提供的面向連接,可靠且有序發(fā)送的服務(wù)。該層主要的機(jī)制是輪詢(Polling)和狀態(tài)報告(Status Report)。
協(xié)議中共定義了7種觸發(fā)輪詢的機(jī)制,分別是:Every Poll_PDUPDU、Every Poll_SDU SDU、Window based、Last PDU in buffer、Last PDU in Retransmission buffer、PollTimer、Timer based。同時,為防止頻繁地觸發(fā)輪詢,協(xié)議中還定義了輪詢禁止定時器(Poll Prohibit Timer),該定時器超時前不發(fā)送輪詢比特。如果是輪詢觸發(fā)狀態(tài)報告,則只配置一種輪詢機(jī)制是不夠的,需要其中的幾種機(jī)制配合,如果配合不好同樣會影響RLC層的數(shù)傳性能。
這7種輪詢機(jī)制的配置參數(shù)如下:
LASTTXPDUPOLL=TRUE,LASTRETXPDUPOLL=TRUE, TIMERPOLLPROHIBIT=D100, TIMERPOLL=D200, POLLPDU=D4, POLLSDU=D1, POLLWINDOW=D50, TIMERPOLLPERIODIC=D200;這幾種機(jī)制是配合使用的,由于RLC層的傳輸采用AM不丟棄模式傳輸,在發(fā)送了輪詢比特后啟動禁止定時器,如果在Poll Timer定時器超時前收不到輪詢響應(yīng)要重傳輪詢,最終不是無限制的重傳,在達(dá)到最大不丟棄次數(shù)后停止重傳,啟動TRB RESET,Reset成功則重新建立業(yè)務(wù)的連接并傳輸數(shù)據(jù),超時失敗則PS業(yè)務(wù)掉線。
RLC層接收端通過狀態(tài)報告通知發(fā)送端已接收報文段正確與否。狀態(tài)報告有兩種觸發(fā)方式,一是基于定時器周期性發(fā)送狀態(tài)報告;二是輪詢觸發(fā)。為避免頻繁觸發(fā),協(xié)議中定義了狀態(tài)報告禁止周期定時器,在定時器超時后才發(fā)送狀態(tài)報告。同時狀態(tài)報告發(fā)送周期應(yīng)該大于RLC層的環(huán)回時延(Round Trip Time)。
狀態(tài)報告機(jī)制目前使用的是輪詢觸發(fā)模式,基于定時器周期性發(fā)送狀態(tài)報告機(jī)制目前不使用。而且接收端在發(fā)現(xiàn)丟失的PDU后會生成狀態(tài)報告進(jìn)行上報,通知發(fā)送端重新發(fā)送。
四、HSPA數(shù)傳機(jī)制
本節(jié)描述HSPA的與數(shù)據(jù)傳輸關(guān)系密切的快速調(diào)度和HARQ重傳機(jī)制。
4.1快速調(diào)度
在HSPA架構(gòu)中,用戶間無線資源的分配是NodeB(基站)完成?;灸軌蚣皶r獲取用戶信道狀況,實現(xiàn)快速的用戶間調(diào)度及資源分配。常用策略包括循環(huán)調(diào)度(Round Robin),最大信噪比(Max C/I)及比例公平(Proportion Fairness)。循環(huán)調(diào)度比較平均但是不公平,信道利用率太低,最大信噪比調(diào)度可以最大化調(diào)度率但是有可能“餓死”其它用戶導(dǎo)致部分用戶感知比較差。所以目前使用最多的是比例公平調(diào)度策略,對信道狀況較差的用戶,如果某時段調(diào)度機(jī)會較少,平均吞吐量降低,過一段時間其調(diào)度優(yōu)先級會因此而提高。該策略兼顧效率與公平性。可見信道狀況的變化會導(dǎo)致用戶調(diào)度時間的不確定性,會影響到用戶的調(diào)度次數(shù),進(jìn)而影響到速率,同時也給高層的時延帶來影響,影響上層數(shù)據(jù)的充足性。
4.2 HARQ重傳
HARQ重傳是在物理層進(jìn)行的,采用N信道停-等機(jī)制,如圖4所示。
每個HARQ進(jìn)程必須在收到接收端的ACK(或NACK)反饋后才能發(fā)送新的數(shù)據(jù)(或重傳數(shù)據(jù))。HSPA需向上層提供按序遞交服務(wù),但為避免無限地等待重傳,(HSDPA)引入了T1定時器機(jī)制以及滑窗機(jī)制,兩種機(jī)制目前的實現(xiàn)基本上比較成熟,配合上出問題的概率很低,在數(shù)據(jù)業(yè)務(wù)優(yōu)化過程中一般不需要考慮。
相對于TCP/RLC重傳,HSPA重傳有顯著優(yōu)勢:
◆重傳時延小,HSPA重傳是在物理層完成,重傳時延相對較小,從而降低高層數(shù)據(jù)傳輸時延。
◆合并增益,HSPA重傳能夠合并接收數(shù)據(jù),而TCP/RLC重傳不成功就丟棄,沒有合并增益。
由此可見,從無線側(cè)降低下行數(shù)據(jù)發(fā)送的BLER,提高終端反饋ACK(NACK)的成功率,也就是改善下行信道和上行信道的信道質(zhì)量,保證數(shù)據(jù)快速調(diào)度和重傳的準(zhǔn)確性是最根本也是最有效的優(yōu)化手段。
五、移動數(shù)據(jù)業(yè)務(wù)類型及原因分析
5.1 常見業(yè)務(wù)適用的數(shù)據(jù)傳輸協(xié)議
數(shù)據(jù)業(yè)務(wù)傳輸?shù)母鱾€層面的機(jī)制以及對數(shù)據(jù)業(yè)務(wù)傳輸?shù)挠绊懛秶私夂螅槍?shù)據(jù)業(yè)務(wù)的優(yōu)化就要從每個層面進(jìn)行系統(tǒng)分析。FTP下載、HTTP下載、HTTP瀏覽,Email及BT下載等業(yè)務(wù)對數(shù)據(jù)可靠性要求非常高,一般需用TCP來承載。而交互式聊天及視頻點(diǎn)播對數(shù)據(jù)及時性要求高,因此數(shù)據(jù)可靠性要求適當(dāng)降低,可以用UDP承載。實際網(wǎng)絡(luò)中各業(yè)務(wù)類型也基本符合該規(guī)律。
不論是TCP還是UDP承載的業(yè)務(wù),都應(yīng)盡量用確認(rèn)模式RLC來承載,因為無線傳輸誤塊率遠(yuǎn)高于有線網(wǎng)絡(luò)。在下行HSDPA+上行DPCH承載時,下行HSDPA采用快速調(diào)度和能夠保證數(shù)據(jù)傳輸速率,HARQ重傳合并可以保證較低的殘留誤塊率,但是下行PDSCH信道質(zhì)量是數(shù)據(jù)傳輸?shù)母?。上行用DPCH承載誤塊率難以保證,相對于下行來說就更加依賴上行確認(rèn)模式的RLC重傳,如果上行HS-SICH以及DPCH信道的質(zhì)量能夠得到保證,能夠盡可能避免重傳發(fā)生,保證數(shù)據(jù)的環(huán)回時延,對速率的提升非常關(guān)鍵。
5.2 數(shù)據(jù)業(yè)務(wù)優(yōu)化方法
前TD-SCDMA系統(tǒng),采用下行HSDPA+上行專用信道承載的方案。對下載而言,用戶對下行速率更敏感,下行速率與TCP層反饋時延有關(guān),而TCP層反饋數(shù)據(jù)與上行影響關(guān)系密切,目前按照FIFO原則傳輸,如果限制上行帶寬會增大TCP反饋時延。
如上述第2節(jié)所述,影響TCP層數(shù)據(jù)發(fā)送的主要因素就是窗口的變化和往返時延的影響。
◆窗口受限一般會是通知窗口受限,應(yīng)該增大通知窗口。
◆時延過大一方面有可能是路由環(huán)節(jié)太多或者防火墻存在問題,應(yīng)該減少路由或者更新防火墻。另一方面可能是TCP下層網(wǎng)絡(luò)環(huán)境的帶寬、時延變化范圍很大,進(jìn)而表現(xiàn)為往返時延的方差很大,很容易導(dǎo)致超時定時器的超時而引起重傳。底層的影響主要表現(xiàn)在網(wǎng)絡(luò)擁塞、HSPA進(jìn)行多用戶調(diào)度或者無線環(huán)境的變化導(dǎo)致時延不穩(wěn)定,應(yīng)該通過優(yōu)化手段盡量保持時延的穩(wěn)定,即時延要盡量小且方差要盡量小,這樣能夠減少對TCP層窗口變化的影響,穩(wěn)定速率。
5.2.1 TCP層時延的影響
從無線網(wǎng)優(yōu)側(cè)對TCP層時延的影響有如下因素和解決方案:
1、針對網(wǎng)絡(luò)擁塞和用戶數(shù)比較多的小區(qū)及時進(jìn)行擴(kuò)容處理,避免用戶太多調(diào)度不及時或者上行碼資源不足引起用戶接收數(shù)據(jù)和反饋不及時帶來TCP層無法及時收到確認(rèn)消息而進(jìn)行無謂的重傳,發(fā)送窗口縮小而影響傳輸效率。
2、無線環(huán)境不穩(wěn)定的區(qū)域應(yīng)及時通過相應(yīng)的優(yōu)化手段進(jìn)行解決,通過覆蓋調(diào)整來解決由于覆蓋導(dǎo)致誤塊率高的問題,通過頻率調(diào)整來規(guī)避干擾,功率調(diào)整來提升上下行的信道質(zhì)量等。
3、RNC側(cè)通過軟件進(jìn)行調(diào)整,目前TD-SCDMA系統(tǒng)RNC產(chǎn)品中的TPE的特性能夠?qū)o線側(cè)不穩(wěn)定帶來的TCP不適應(yīng)問題進(jìn)行處理,TPE特性能夠根據(jù)不同情況加速擁塞窗口增長進(jìn)而增大發(fā)送窗口,同時也能縮短重傳時間,避免了慢啟動和擁塞窗口減半的發(fā)生,提升TCP層的傳輸效率。
5.2.2底層數(shù)據(jù)傳輸影響
底層主要表現(xiàn)為無速率和速率低,從Node B側(cè)的調(diào)度機(jī)制出發(fā),以下載無速率為例進(jìn)行詳細(xì)介紹:
從Node B快速調(diào)度機(jī)制方面進(jìn)行下載無速率的情況分析流程如圖6。
按照上圖所示,從Node B側(cè)分析下行不調(diào)度情況:
◆如果RLC BO為空,說明RLC層從上層沒有接收到數(shù)據(jù),影響因素主要是TCP層的數(shù)據(jù)量不足(需要CN側(cè)配合分析)或者中間IP連接有問題或者無線側(cè)的上行導(dǎo)致TCP層的發(fā)送窗口變小影響數(shù)據(jù)的下發(fā)。無線側(cè)首先要檢查上行信道質(zhì)量是否存在干擾或者功率不足的情況。
◆如果RLC BO不為空而Node B的PQ卻獲取不到數(shù)據(jù),有可能是RLC層的窗口滿導(dǎo)致數(shù)據(jù)溢出,產(chǎn)生該現(xiàn)象有可能是RLC層的發(fā)送端窗口和接收端窗口配置不合適,RLC層數(shù)據(jù)一直重傳導(dǎo)致。
◆如果PQ中有數(shù)據(jù)而無調(diào)度,只能說明上行或者下行鏈路有問題,斷鏈導(dǎo)致下行調(diào)度數(shù)據(jù)發(fā)送失敗或者上行收不到反饋消息而重傳超時。
Node B側(cè)分析下行有調(diào)度的情況:
◆HS-SCCH接收失敗,UE收不到SCCH調(diào)度信息,無法準(zhǔn)確檢測到PDSCH信道而無法接收數(shù)據(jù),需要檢查SCCH的功率配置是否合理,下行時隙的干擾是否有問題。
◆HS-PDSCH接收失敗,這種情況表示UE按照調(diào)度信息從PDSCH信道上接收到的數(shù)據(jù)都是錯誤的,UE會返回NACK消息給Node B,HARQ會不斷進(jìn)行重傳。
◆HS-SICH接收失敗,因為UE收到Node B側(cè)調(diào)度的數(shù)據(jù)塊后,需要通過SICH信道反饋ACK或者NACK消息,SICH的信道質(zhì)量不好很容易導(dǎo)致Node B收不到UE的反饋消息,會不停重傳同樣數(shù)據(jù)塊,導(dǎo)致UE側(cè)無速率。
同理,下載速率慢和下載速率不穩(wěn)定問題分析思路也主要從Node B側(cè)和空口環(huán)境進(jìn)行系統(tǒng)分析:
1、針對干擾:上行方向針對HS-SICH分析,如果HS-SICH的接收到的 No signal Num較多,并且HS-SICH的C/I 和SIR較差,可以判斷為HS_SICH質(zhì)量比較差,需要重點(diǎn)調(diào)整如下參數(shù):1)HS-SICH ACK/NACK功率偏置;2)調(diào)整HS-SICH的目標(biāo)SIR值;3)HS-SICH 期望接收功率。
2、針對下行方向:分析HS-PDSCH C/I和SIR和HS-SCCH C/I和SIR,并統(tǒng)計HS-SICH上報的ACK和NACK的比例,如果HS-PDSCH和HS-SCCH的 C/I和SIR比較差,而且HS-SICH上報的NACK比較比較高,可以說明:
1)下行干擾比較嚴(yán)重,空口質(zhì)量差,檢查NodeB功率配置和UE的功率參數(shù)配置是否合理,可以進(jìn)行參數(shù)優(yōu)化,提升HSDPA速率。
2)在空口質(zhì)量不好的場景下,需要進(jìn)一步排查是否是同頻干擾導(dǎo)致,需要進(jìn)一步判斷,可以調(diào)整HSDPA載波的頻點(diǎn),如果HSDPA速率有明顯的提升,可以判斷是同頻干擾導(dǎo)致速率下降。3)可以通過CQI和調(diào)度模式分析16QAM和QPSK所占的比例,如果16QAM調(diào)制模式所占比例較少,也可以判斷是空口質(zhì)量較差,導(dǎo)致HSDPA速率較低,優(yōu)化功率配置參數(shù)。
3、如果空口質(zhì)量不存在問題,通過TPCWin統(tǒng)計PQ隊列里的緩存數(shù)據(jù),以及流控相關(guān)的Credits,判斷RNC和NodeB之間IUB 接口是否異常;
4、如果HSDPA載波用戶多,優(yōu)先對H載波進(jìn)行擴(kuò)容,然后分析每個用戶的對應(yīng)的空口信號質(zhì)量是否有問題,分析整體的調(diào)度次數(shù)是否充足,帶寬是否充分利用。如果NodeB的PQ緩存數(shù)據(jù)較少,這時需要查找RNC數(shù)據(jù)緩存的情況,如果在RNC出現(xiàn)RLC BO一直為0,可能是數(shù)據(jù)源數(shù)據(jù)不足,這時需要查看核心網(wǎng)和IUPS鏈路有沒有問題(是否擁塞或者連接不穩(wěn)定),排除IUPS鏈路問題和PS域CN的問題。
5、如果核心網(wǎng)和IUPS鏈路都沒有問題,可以檢查PS業(yè)務(wù)服務(wù)器是否存在問題,可以采取更換FTP服務(wù)器的方式排除。
參 考 文 獻(xiàn)
[1]謝希仁編著“計算機(jī)網(wǎng)絡(luò)” (第二版)
[2] 3GPP TS 25.322 - 750
[3] 3GPP TS 25.222 - 750