“好訊息啊,老闆。 ”一見面任正飛就對著張國棟毫無形象的大喊大叫,如果不是看著張國棟那戒備的眼神,說不定還想衝上來給他一個熱情的擁抱,張國棟有些好奇,從部隊裡面出來的任總可是很沉穩的啊。
“從此以後我們又多了一項在全世界吸血的工具了,盛田昭夫剛剛親自打電話來向我們通報了此事,明天將是我們的CD-I標準正式推廣的日子,目前已經有三十幾家企業加入了我們的壓縮聯盟。 ”從ZIP格式獲得大量利潤的任正飛當然知道標準的好處了,所以聽到索尼的訊息後還是會忍不住高興,不過心裡還是有點感慨,不知道什麼時候中國人能夠獨立的申請一項國際標準就好了,現在卻不得不與小日本合作,想想西方國家對社會主義國家的防治,他又忍不住搖搖頭,看來老闆上次說要加大對創新公司的投入是非常正確的。
“哦,這的確是個不錯的訊息,不過我也有個好訊息要和你分享,世界上第一個搜尋引擎已經由我們中國人首先發明出來了,昨天龔定雨他們已經去登記了專利號了,發明人是我們中國的一個留學生,很難得的他的國籍還是中國。 ”相比於必然的收穫,張國棟顯然對這個偶然的成果更加滿意,以前他都已經忘記了搜尋引擎這回事兒了。
歷史上1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。 當時。 全球資訊網還沒有出現,人們透過FTP來共享交流資源。 Archie能定期蒐集並分析FTP伺服器上地檔名資訊,提供查詢分別在各個FTP主機中的檔案。 使用者必須輸入精確的檔名進行搜尋,Archie告訴使用者哪個FTP伺服器能下載該檔案。 雖然Archie蒐集的資訊資源不是網頁(HTML檔案),但和搜尋引擎的基本工作方式是一樣的:自動蒐集資訊資源、建立索引、提供檢索服務。 所以,Archie被公認為現代搜尋引擎的鼻祖。
然而現在由於龍騰地貢獻,全球資訊網已經出現。 網路上最大最多的資源也是HTML網頁,而留學美國斯坦福大學地趙維均在博士攻讀階段。 發現同學們非常喜歡去彼此的個人網站去湊熱鬧,但是有的同學在看了一個很漂亮的網頁後想介紹給別人時不得不繁瑣的記下該站得網址,要知道網址要鏈到某個具體網頁的時候有可能會非常的長,所以他忍不住想到,能不能做一個工具將網路上所有地網頁都抓取下來,然後存在自己的伺服器中,當人們輸入一定的關鍵字後進行自動匹配。 從而將某個具體的資源返還給人們呢。 大學的研究還不像公司,公司開發一款產品往往會進行大量的市場
調查,然後還要考慮是否盈利,而大學生做產品往往是靈光一閃。 趙維均也是這樣,做這個產品他沒有告訴任何人,經過長達四個多月的程式設計實現,趙維均得到了一款比較滿意的產品。 隨後他前去美國專利局進行註冊,產品名Yout。 可能註定著世界上要多一家偉大地公司。 那天龔定雨和幾個公司的技術專家也去專利局去申請兩項專利,由於總公司和香港分公司專利都在不斷增加,給了美國分公司很大的壓力,所以龔定雨是為了擺個姿態,就一起去了,結果趙維均正好排在他們後面。 得知龔定雨竟然是中國龍騰公司的人。 趙維均非常佩服,畢竟他用的很多計算機產品都是龍騰生產的,可以說龍騰是整個中國人地驕傲。
而龔定雨也不愧擁有鬼神之智,竟然一眼就瞧出了趙維均手上專利的價值,隨後就隆重邀請趙維均加盟了,能加盟自己心目中的大公司,趙維均其實也非常滿意,他博士也快畢業了,只剩下最後論文答辯,本來他最近就一直在猶豫要加入哪個公司。 不過當他聽說龍騰還有一個創業投資基金後。 他就覺的有點心動了。 他想要創業!
開始龔定雨見他婉拒還以為是給的條件不夠吸引人,所以咬咬牙一再的提高籌碼。 搞得那兩個技術人員都是臉一陣陣**。 不過當他得知趙維均是想自己創業時,失落的心情又好了一點點。
和Archie不同,由於有了網際網路,趙維均的Yout擁有世界上第一個Spider程式。 Spider指自動抓取網頁內容的機器人Robots,是搜尋引擎用來訪問Internet上網頁的自動程式。 spiders根據html地語法和格式,對讀取地頁面進行程式碼過濾,收入相關的文字內容。 爬蟲從一個或若干初始網頁地URL開始,獲得初始網頁上的URL,在抓取網頁的過程中,不斷從當前頁面上抽取新的URL放入佇列,直到滿足系統的一定停止條件。 有被爬蟲抓取的網頁將會被系統存貯,進行一定的分析、過濾,並建立索引,以便之後的查詢和檢索;對於聚焦爬蟲來說,這一過程所得到的分析結果還可能對以後的抓取過程給出反饋和指導。
可以說Yout已經具備了後世搜尋引擎的一些特徵了,雖然還比較毛糙,在切詞計算詞之間距離的方面做得還不是那麼完善,但是作為世界上第一個誕生的網頁搜尋器,Yout仍然具備光輝的前景。
沒能將這一專案握在自己手上的張國棟還有些遺憾,不過旋即又開心起來,畢竟這第一的榮譽好歹也是中國人自己的了,於是張國棟馬上自己炮製了一份PageRank演算法的論文寄給了英國自然雜誌。
歷史上PageRank(網頁級別)。 取自Google地創始人LarryPage。 它是Google排名運演算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是Google用來衡量一個網站的好壞的唯一標準。 在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google透過PageRank來調整結果,使那些更具“等級/重要性”的網頁在搜尋結果中另網站排名獲得提升,從而提高搜尋結果地相關性和質量。
級別從1到10級,10級為滿分。 PR值越高說明該網頁越受歡迎(越重要)。 例如:一個PR值為1的網站表明這個網站不太具有流行度。 而PR值為7到10則表明這個網站非常受歡迎(或者說極其重要)。 一般PR值達到4,就算是一個不錯地網站了。 Google把自己的網站的PR值定到10。 這說明Google這個網站是非常受歡迎的,也可以說這個網站非常重要。
PageRank是Google演算法的重要內容。 2001年9月被授予美國專利,專利人是Google創始人之一拉里※#8226;佩奇(Larry Page)。 因此,PageRank裡的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。 而現在張國棟毫不懷疑自己地這篇論文能夠引起學術界的關注,畢竟作為與HITS並舉的連結分析演算法。 在HITS還沒有出現之前能夠有效的對網頁做出基本公平的排名還是非常重要的。 這兩年隨著網際網路的興起已經有越來越多的專家學者將自己地注意力轉移到這上面來了。
反正自己叫它PageRank別人也只會以為是頁面排序的意思。 本來龍騰也可以做一個搜尋引擎的,畢竟以龍騰在軟體方面的實力和權威性,做出來的搜尋引擎可能比Yout更加先進,但是張國棟卻並不準備讓龍騰在每一個產業上都有所突出,畢竟太過於龐大的公司可能在西方有些事情不方便做。 目前地Yout還只能夠搜尋英文,也就是隻開發了英文版本,其它語言都還沒有做,但是這畢竟是一個公司由小到大的過程。 不能什麼事情都替人家做了,那樣就沒什麼意義了。
不知道是鑑於張國棟的威名還是怎麼的,畢竟現在張國棟隨著ZIP格式和CD-I兩項壓縮標準已經成為了世界上唯一一個不是PHD的壓縮權威,所以對於他的文章自然雜誌自然非常重視,很快就給予了刊登,而且還加上了重點推薦。 PageRank演算法已經發表。 馬上引起了學術界方面的討論。 張國棟也趁此機會為PageRank申請了專利,雖然還沒有批下來,不過申請的是國際專利,不怕別人再搞鬼。
有了PageRank演算法在手,張國棟讓龔定雨去和趙維均談判,也不知道楊柳這個丫頭哪裡得知的訊息,反正對於張國棟看好的生意她都要cha上一腳,結果就變成了兩股資金對同一個公司注資地事情。 最後龍騰以技術加資金入股佔了49地股份,楊家用資金入股佔了30的股份,趙維均這個公司地創始人佔了21的股份。 他也比較滿意了。 畢竟以公司目前3000萬的投資來看,他白撿600多萬。 還有什麼不滿意的呢。
就在Yout成立之後的第三天,加拿大的三位同學就發表了Archie,很險,差一點世界第一個搜尋引擎的稱呼就被拿走,張國棟也是暗乎僥倖,當然,Archie肯定沒有Yout的生存能力強,畢竟FTP基本上都要密碼,搜尋的內容比較狹隘。 雖然龍騰不會進入通用搜索引擎,但是垂直搜尋張國棟還是不願意放過,畢竟再怎麼說Yout也不可能佔領整個世界的市場。 所以隨著張國棟一聲令下,整個龍騰的軟體組又動了起來。