Google搜索引擎上已登錄了第 1兆個(gè)網(wǎng)址。但對(duì)于使用者來(lái)說(shuō),如何找到最合理且最滿意的答案,是主流搜索引擎所面臨的最大挑戰(zhàn)。因此,Google已開(kāi)始發(fā)展深度網(wǎng)絡(luò)技術(shù)(Deep Web)。
據(jù)《紐約時(shí)報(bào)》報(bào)道,1 兆個(gè)網(wǎng)址乍看之下很多,可是這些網(wǎng)頁(yè)內(nèi)容在Google的網(wǎng)頁(yè)上,只能呈現(xiàn)一些非常表面的內(nèi)容。使用者無(wú)法立即獲得更深入的細(xì)節(jié),如火車時(shí)刻表、購(gòu)物目錄等等其它藏于數(shù)據(jù)庫(kù)深處的信息,然而這也是Google搜索引擎碰觸不到的。
因此針對(duì)使用者的問(wèn)題,給予最合理且滿意的答案,就是這個(gè)主流搜索引擎所面臨的最大挑戰(zhàn)。目前Google已開(kāi)始發(fā)展深度網(wǎng)絡(luò)技術(shù)(Deep Web)。
深度網(wǎng)絡(luò)技術(shù)是項(xiàng)尚在發(fā)展中的搜索技術(shù),將搜索的觸角,深入網(wǎng)海中被隱藏的角落。如果Google正式啟用這項(xiàng)技術(shù),將大大提升搜索質(zhì)量,也會(huì)因此影響很多公司商業(yè)模式。
搜索引擎多依靠Web Crawlers,自動(dòng)獲得所有信息之后,再以超級(jí)鏈接與網(wǎng)絡(luò)聯(lián)機(jī)。目前多數(shù)入口網(wǎng)站都仰賴這樣的搜索方式。可是由于所有信息都必須先回到數(shù)據(jù)庫(kù),對(duì)于使用者的回復(fù)相當(dāng)費(fèi)時(shí),因此大多只能響應(yīng)關(guān)鍵詞搜索。
為了從深度網(wǎng)絡(luò)摘錄有意義的數(shù)據(jù),搜索引擎必須分析理解使用者的搜索字符串,并且立即安排使用者至合適的數(shù)據(jù)庫(kù)。舉例來(lái)說(shuō),如果使用者鍵入知名畫(huà)家的名字,搜索引擎就能迅速連至最有可能有藝術(shù)信息的數(shù)據(jù)庫(kù)。
聽(tīng)起來(lái)這應(yīng)該是非常輕易就能達(dá)成的目標(biāo),但是實(shí)行面向上的阻礙是非常繁雜的。
Google的深度網(wǎng)絡(luò)搜索策略,就是將一組特別的搜索程序送進(jìn)網(wǎng)絡(luò),使用者鍵入關(guān)鍵詞,然后搜索程序開(kāi)始分析每個(gè)碰到的數(shù)據(jù)庫(kù)內(nèi)容,去找出最有可能解答使用者問(wèn)題的數(shù)據(jù)庫(kù),最后推論這個(gè)數(shù)據(jù)庫(kù)的類型,以便下一個(gè)擁有相同問(wèn)題的使用者。
《Search Engine Land》網(wǎng)站執(zhí)行編輯 Chris Sherman表示,Google將因此面臨極大挑戰(zhàn)。
Sherman 認(rèn)為,Google一直致力于讓使用者獲得良好的使用經(jīng)驗(yàn),因此往后若做出什么改變,都必需優(yōu)先考慮使用者的看法。可是在使用深度網(wǎng)絡(luò)技術(shù)之后,除了考慮一般上網(wǎng)族群的使用面向外,另外在商業(yè)領(lǐng)域也得有所改變。
Deep Web技術(shù)可以藉由自動(dòng)分析數(shù)據(jù)庫(kù)及交叉引用搜索結(jié)果,來(lái)達(dá)成降低成本的目標(biāo)。這當(dāng)中,最龐大的工作就是連結(jié)各種異質(zhì)的數(shù)據(jù)庫(kù)來(lái)源。因此深度網(wǎng)絡(luò)技術(shù)未來(lái)可能將更著力于改變商業(yè)模式,而不僅僅只是滿足上網(wǎng)族群五花八門的需求。