企業(yè)做網(wǎng)站網(wǎng)站歸檔技術(shù)和標準不完備
日期 : 2021-10-03 22:49:44
網(wǎng)站歸檔技術(shù)和標準不完備。網(wǎng)頁(yè)信息采集主要針對靜態(tài)或動(dòng)態(tài)網(wǎng)頁(yè)及其中文件,隨后提取網(wǎng)頁(yè)內的全部信息。靜態(tài)網(wǎng)頁(yè)與動(dòng)態(tài)網(wǎng)頁(yè)的抓取難度也不相同,靜態(tài)網(wǎng)頁(yè)的抓取從技術(shù)上較易實(shí)現,只需按時(shí)間頻率定期進(jìn)行即可;而動(dòng)態(tài)網(wǎng)頁(yè)的捕獲則無(wú)法單純依靠抓取軟件實(shí)現,且以目前的技術(shù)條件無(wú)法實(shí)現安全存儲。此外,隨著(zhù)網(wǎng)頁(yè)技術(shù)不斷發(fā)展,網(wǎng)頁(yè)文件類(lèi)型和格式不斷更新。

除了傳統的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁(yè)文件也層出不窮,但目前尚未有明確標準規范來(lái)指導這些文件歸檔。


除了傳統的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁(yè)文件也層出不窮,但目前尚未有明確標準規范來(lái)指導這些文件歸檔。
