企業(yè)建網(wǎng)站特征知識庫的建立
日期 : 2021-09-02 21:28:28
特征知識庫的建立。機器學(xué)習中最重要的是特征選擇。只有選擇合適的特征,訓練有素的分類(lèi)器才能具有良好的分類(lèi)效果。

特征集合是網(wǎng)頁(yè)掛馬特征值的集合,當網(wǎng)頁(yè)被掛馬之后,將網(wǎng)頁(yè)源碼中一處或者多處掛馬特征提取出來(lái),作為網(wǎng)頁(yè)漏洞的特征,加入待檢測特征知識庫便于后續模塊的檢測。

特征提取模板是整個(gè)系統的核心,它的實(shí)現由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負責進(jìn)行提取。然后對提取到的HTML頁(yè)面中的腳本代碼進(jìn)行解析,是通過(guò)HTML unit模塊實(shí)現對DOM樹(shù)形結構的訪(fǎng)問(wèn),將提取的待檢測網(wǎng)頁(yè)的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。

特征集合是網(wǎng)頁(yè)掛馬特征值的集合,當網(wǎng)頁(yè)被掛馬之后,將網(wǎng)頁(yè)源碼中一處或者多處掛馬特征提取出來(lái),作為網(wǎng)頁(yè)漏洞的特征,加入待檢測特征知識庫便于后續模塊的檢測。

特征提取模板是整個(gè)系統的核心,它的實(shí)現由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負責進(jìn)行提取。然后對提取到的HTML頁(yè)面中的腳本代碼進(jìn)行解析,是通過(guò)HTML unit模塊實(shí)現對DOM樹(shù)形結構的訪(fǎng)問(wèn),將提取的待檢測網(wǎng)頁(yè)的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。