2000/04/13
今天上午我看到報紙的新聞,還以為又是一個網路的泡沫浮上來。畢竟這些日子以來,號稱自己有多優秀、劃時代、有創意的公司實在不少。
下午上去看看他們在台視的應用,才知道台視與富邦壓對了寶,投資到一個真正有用的東西。
電子文本的優勢
電子文本與紙本在資訊上最大的差異其實只有三點:
快速複製與傳遞已經被徹底運用了,這點雖然很了不起,但是跟紙本比起來,還不是那麼的特殊,否則現在所有的書商不全都要關門?
超文本的連結對於電子文本而言,就讓兩者的差異性真正顯現出來。在紙本中,當我寫到「台灣」, 嗯,就只有台灣。想知道更多有關台灣的東西?請自己想辦法。在網路中,我可以將台灣連去一個網站,或是另外產生一個索引頁,這個索引上面會有許多與台灣相關的連結。
搜尋也是電子文本一個很偉大的地方。當你看到一份報紙或一本書的時候,你很難在10秒鐘之內把想要的關鍵字找出來。電子文本卻可以。
資料採掘強化電子文本
有了資料採掘(Data Mining)後,電子文本的力量又更大了。
但目前網站內容生產者都面臨一個問題:「我知道網路文本要連結,才會有意義。可是當我每天產生1000份文本的時候,要花多少寶貴的人力才能夠將文本中每個重要的關鍵字都連結到其他網頁中呢?」。基本上這是很難的。
這套新的系統有幾個地方很強悍。
所以每篇文章中重要的關鍵字,都幫你建立了查詢的連結。當你查詢關鍵字的時候,他又提供你其他的聯想詞,方便找出其他的資料。超連結,不用再花人力、索引頁也可以自動產生。網站經營者就不用花太多的人力在這些單調、繁瑣的資料上,而可以更專注的在「資訊」的產生上面。
對於目前台灣幾個超大資料網站(中時電子報、明日報)而言,有了這套系統,其實可以快速的增加內容服務品質,強化使用者的體驗。
當然,資料採掘系統只是加快資料搜尋與整理的時間,(目前)並不能產生知識。當科技可以完成所有事情的時候,希望科學家能夠把思考的權力留給人類。
保留部分權利 (Some rights reserved), 1996-2006, Richy Li.