周忠超,劉曦元
(國家無線電監(jiān)測(cè)中心云南監(jiān)測(cè)站,昆明 650031)
在大數(shù)據(jù)時(shí)代背景下,我們對(duì)于信息的獲取,已不僅僅滿足于數(shù)據(jù)表面,而是需要對(duì)這些數(shù)據(jù)進(jìn)行加工、深度挖掘才能使數(shù)據(jù)體現(xiàn)出價(jià)值,從而為未來工作決策做出正確的判斷和提出預(yù)見性的建議。目前,隨著無線電監(jiān)測(cè)基礎(chǔ)數(shù)據(jù)的大量積累,數(shù)據(jù)挖掘在無線電監(jiān)測(cè)管理工作中顯得尤為重要,應(yīng)用愈加廣泛。對(duì)短波監(jiān)測(cè)而言,除了掌握和獲取短波信號(hào)動(dòng)態(tài),如何對(duì)這些監(jiān)測(cè)數(shù)據(jù)進(jìn)行深度挖掘,從而優(yōu)化常規(guī)監(jiān)測(cè)方法,更為科學(xué)高效地實(shí)現(xiàn)短波頻段資源監(jiān)管,為頻譜管理提供決策支撐,是未來短波監(jiān)測(cè)工作的又一個(gè)重要內(nèi)容。
短波通信是指利用波長(zhǎng)為100-10m(頻率為3-30MHz)的電磁波進(jìn)行的無線電通信。短波通信主要是利用不易被“摧毀”的“中繼系統(tǒng)”電離層的反射來進(jìn)行,具有傳輸距離遠(yuǎn)、機(jī)動(dòng)重建性好、成本低廉、容易實(shí)現(xiàn)等優(yōu)點(diǎn),廣泛應(yīng)用于政府、軍事、外交、氣象等領(lǐng)域。為了更好地掌握短波頻段電臺(tái)設(shè)置情況、頻率使用情況,合理進(jìn)行頻譜資源配置,為短波頻譜管理工作提供數(shù)據(jù)支撐,開展短波監(jiān)測(cè)意義重大。日常短波監(jiān)測(cè)工作所關(guān)注的主要參數(shù)有:電臺(tái)呼號(hào)、發(fā)射地點(diǎn)、時(shí)間、發(fā)射頻率、所屬業(yè)務(wù)類型等。短波監(jiān)測(cè)數(shù)據(jù)分析挖掘,主要分為兩部分:研究監(jiān)測(cè)周期內(nèi)各參數(shù)自身的變化趨勢(shì);與其他外部因素之間的關(guān)聯(lián)性等。
在進(jìn)行短波監(jiān)測(cè)數(shù)據(jù)分析與挖掘時(shí),假設(shè)研究的參數(shù)為n個(gè),其具體分析步驟如下:(注:以下對(duì)研究參數(shù)本身周期內(nèi)變化規(guī)律分析稱為:內(nèi)部分析;對(duì)研究參數(shù)與其他參數(shù)之間的關(guān)系分析稱為:外部分析。)首先,進(jìn)行內(nèi)部分析。對(duì)所研究的n個(gè)參數(shù),在一定周期內(nèi)單獨(dú)對(duì)每個(gè)參數(shù)進(jìn)行統(tǒng)計(jì)與分析,以便觀察其自身變化情況;其次,進(jìn)行單因素外部分析。先選擇其中一個(gè)參數(shù)(有Cn1種選擇)作為研究對(duì)象,與另外n-1個(gè)參數(shù)之間進(jìn)行探究分析,共有(n-1)*Cn1種選擇,如:選擇電臺(tái)呼號(hào)為研究對(duì)象,對(duì)于同一個(gè)電臺(tái)呼號(hào),對(duì)其出現(xiàn)的時(shí)段、發(fā)射頻率、位置、業(yè)務(wù)類型的分布分別進(jìn)行統(tǒng)計(jì),以便掌握某電臺(tái)的發(fā)射特征及規(guī)律;然后,進(jìn)行雙因素外部分析。在第二步的基礎(chǔ)上繼續(xù)推進(jìn),再次選擇一個(gè)參數(shù)(有Cn-11種選擇)與另外n-2個(gè)參數(shù)之間的聯(lián)系探究,共有(n-2)*Cn-11種選擇,如:選擇發(fā)射頻率為第二個(gè)研究參數(shù),對(duì)使用某一發(fā)射頻率的某一電臺(tái),對(duì)其出現(xiàn)的時(shí)段、位置、業(yè)務(wù)類型,進(jìn)行統(tǒng)計(jì)分析;最后,逐步縮小范圍,進(jìn)行n-1因素外部分析。對(duì)n-1個(gè)參數(shù)與另外一個(gè)參數(shù)之間的聯(lián)系探究,共有1種選擇,由此可以找到精確地規(guī)律,最終挖掘出具有足夠信息量、清晰具體的信息條目,找到一條完整的涉及所有參數(shù)項(xiàng)目的信息。具體流程如圖1所示:
圖1 短波數(shù)據(jù)挖掘基本流程
下面以電臺(tái)呼號(hào)、發(fā)射地點(diǎn)、時(shí)間、發(fā)射頻率、所屬業(yè)務(wù)類型這5個(gè)基本參數(shù)為例,運(yùn)用以上數(shù)據(jù)挖掘方法進(jìn)行統(tǒng)計(jì)分析。(注:由于監(jiān)測(cè)數(shù)據(jù)為敏感信息,以下示例中,涉及到的具體名稱、數(shù)據(jù)均以字母表示。)
選擇電臺(tái)呼號(hào)為研究對(duì)象,分析統(tǒng)計(jì)周期內(nèi)電臺(tái)呼號(hào)的個(gè)數(shù)以及每個(gè)出現(xiàn)的次數(shù),假設(shè)電臺(tái)呼號(hào)情況如表1所示:(現(xiàn)設(shè)電臺(tái)名稱為:XX、YY、ZZ,出現(xiàn)次數(shù)為:a、b、c,下同)
表1 電臺(tái)呼號(hào)
內(nèi)部分析,對(duì)于監(jiān)測(cè)周期內(nèi)電臺(tái)呼號(hào)分布情況進(jìn)行了統(tǒng)計(jì)分析,可以得出統(tǒng)計(jì)周期內(nèi),存在3個(gè)電臺(tái),分別為:XX,YY,ZZ。以下外部分析,繼續(xù)以電臺(tái)呼號(hào)為研究對(duì)象,以XX電臺(tái)為例,現(xiàn)選擇發(fā)射頻率作為一個(gè)外部因素,來分析電臺(tái)呼號(hào)與發(fā)射頻率之間的關(guān)系。XX電臺(tái),對(duì)其發(fā)射頻率分布進(jìn)行統(tǒng)計(jì),可以按特定頻率間隔分段統(tǒng)計(jì),假設(shè)XX電臺(tái)的頻率分布情況如表2所示:
表2 發(fā)射頻率
基于單因素外部分析的結(jié)果,得到以下組合:對(duì)3-10MHz頻段的XX電臺(tái),進(jìn)行分析;對(duì)10-20MHz頻段的XX電臺(tái),進(jìn)行分析;對(duì)20-30MHz頻段的XX電臺(tái),進(jìn)行分析。選擇另一個(gè)外部因素:發(fā)射時(shí)間,進(jìn)行雙因素外部分析,以3-10MHz為例,對(duì)3-10MHz頻段的XX電臺(tái),對(duì)其發(fā)射時(shí)間進(jìn)行統(tǒng)計(jì),假設(shè)其發(fā)射時(shí)間分布情況如表3所示。
表3 發(fā)射時(shí)間
基于雙因素外部分析結(jié)果,得到以下組合:
對(duì)3-10MHz頻段、0-8h的XX電臺(tái),進(jìn)行分析;對(duì)3-10MHz頻段、8-16 h的XX電臺(tái),進(jìn)行分析;對(duì)3-10MHz頻段、16-24h的XX電臺(tái),進(jìn)行分析。對(duì)10-20MHz、20-30MHz頻段的分析跟0-10MHz類似。選擇另一個(gè)外部因素為:發(fā)射位置,進(jìn)行三因素外部分析。例如:對(duì)3-10MHz頻段、0-8h的XX電臺(tái),對(duì)其發(fā)射位置進(jìn)行分析。假設(shè)其發(fā)射位置分布情況如表4所示(發(fā)射位置分別記為:M、N,次數(shù)為:a,b)。
表4 發(fā)射位置
基于三因素外部分析結(jié)果,得到以下組合:對(duì)3-10MHz頻段、0-8h、M地區(qū)的XX電臺(tái),進(jìn)行分析;對(duì)3-10MHz頻段、0-8h、N地區(qū)的XX電臺(tái),進(jìn)行分析。對(duì)10-20MHz、20-30MHz頻段、8-16h、16-24h的分析跟以上類似。
選擇最后一個(gè)外部因素為:業(yè)務(wù)類型,進(jìn)行四因素外部分析。無線電業(yè)務(wù)類型,是根據(jù)各頻段信號(hào)的用途、場(chǎng)景來進(jìn)行的劃分。主要有:廣播業(yè)務(wù)、固定業(yè)務(wù)、航空移動(dòng)業(yè)務(wù)等,對(duì)業(yè)務(wù)類型進(jìn)行分類統(tǒng)計(jì)能夠掌握其業(yè)務(wù)分布規(guī)律,更高效地進(jìn)行無線電監(jiān)管。
例如:對(duì)0-10MHz頻段、0-8h、M地區(qū)的XX電臺(tái),對(duì)其業(yè)務(wù)類型進(jìn)行分析:假設(shè)其分布情況如表5所示(業(yè)務(wù)類型以廣播和固定業(yè)務(wù)為例,次數(shù)設(shè)為:a,b)。
以上完成了5個(gè)研究參數(shù)的數(shù)據(jù)挖掘,可以得出如下所示的信息:如:對(duì)0-10MHz頻段、0-8h、M地區(qū)的XX電臺(tái),其業(yè)務(wù)類型分布情況如表5所示。
表5 業(yè)務(wù)類型
該條信息完整包含了5個(gè)研究參數(shù)的具體內(nèi)容,實(shí)現(xiàn)了從監(jiān)測(cè)數(shù)據(jù)表中,提取具體、有價(jià)值信息的目的,將零散的信息匯總成一條條完整的信息條目,有利于進(jìn)行頻譜數(shù)據(jù)分析。
本文介紹了一種基于短波監(jiān)測(cè)數(shù)據(jù)表進(jìn)行的數(shù)據(jù)分析挖掘的方法,通過分析各個(gè)參數(shù)內(nèi)部關(guān)系、與其他參數(shù)之間的聯(lián)系來進(jìn)行多維的數(shù)據(jù)分析,有利于從繁雜的數(shù)據(jù)表中提取信息,最終形成大量有效的信息流,便于進(jìn)行監(jiān)測(cè)數(shù)據(jù)分析,為頻譜管理提供依據(jù)。