未來搜尋

未來搜尋

搜尋的最終目標是理解人的“意思”,即人工智慧。如同谷歌創始人謝爾蓋·布林曾經提到過的“搜尋直接連線大腦”的概念。

基本信息

簡介

搜尋的最終目標是理解人的“意思”,即人工智慧

三款獨特的未來搜尋引擎搜尋將更個性三款獨特的未來搜尋引擎搜尋將更個性

如同谷歌創始人謝爾蓋·布林曾經提到過的“搜尋直接連線大腦”的概念

就是人類的知識最終會由激情來分類:信息流的任何一個結點神經元活動中的任何一波電子火花都能成為一個知識分類的標籤,《新數字秩序的革命》一書的作者戴維·溫伯格就持此觀點。

雲計算規劃未來搜尋

Google雲計算的出發點是網頁搜尋

什麼是雲計算什麼是雲計算

Google為改進搜尋服務而搭建的巨大的世界級雲計算基礎設施平台如今催生了許多新型搜尋服務。那么,五年後Google將創造一個什麼樣的世界呢?讓我們來看一下Google所描繪的未來搜尋。
近期Google快速強化了網頁搜尋服務。僅今年以來就採取了超過15次的大大小小的強化舉動。
其中,改進力度最大的是實時搜尋。一直以來在網上搜尋到的信息大多是幾天前發生的。如今已經可以搜尋到1分鐘前剛剛更新的信息了。
Google之所以能夠實現實時搜尋要歸功於2009年10月與Twitter建立的合作。這項合作使Google可以搜尋到Twitter微博用戶發布的信息。通過直接搜尋Twitter的索引,比Google搜尋系統遍歷網頁生成索引要快很多,從而可以搜尋網頁上實時更新的信息。同時在6月份,Google新增加了將Twitter上的信息顯示在搜尋結果中的功能。
包括實時搜尋在內,Google近幾年來一直致力於四大主題,即讓每個人可以使用最佳選項的“個性化搜尋”、獲取現實世界信息的“非網上搜尋”、以及基於外文自動翻譯技術的“穿越語言壁壘的搜尋”。
實現個性化搜尋的方法之一是運用社交圈子。社交圈子是指用戶的網上交友信息。在一般的搜尋結果中顯示包括SNS(社會性網路服務)內好友所寫的部落格。例如,對搜尋某種商品評論信息來說,在搜尋結果中所看到的自己好友所寫的評論,對其他人來說或許無關緊要,但對自己來說是一個非常有意義的參考信息。
非網上搜尋的代表性服務包括拍攝實際道路的影像供搜尋的“Street View”以及搜尋Google所掃描書籍內容的“Google Books”等。Google驅動安裝攝像頭汽車在世界各地行駛,將龐大現實世界的信息組建成了網路
雖然Google為打造這一現實世界信息網路不惜成本,但仍有它的局限性。尤其是在亞洲,凸顯出了許多問題。亞洲城市大多交通網非常複雜,人口密度較高,道路形狀經常發生變化。例如,印度大多道路既沒有標識,又沒有街道名稱,即使有名稱也大多是當地語言的稱呼。道路信息通常難以反映到網頁上。

地圖編輯工具

因此,Google開始藉助網上用戶的力量蒐集非網上信息。其中的一個方法是推出了稱為“Map Maker”的地圖編輯工具該工具採用了與網上用戶可編輯線上百科事典Wikipedia”同樣的方法,網上用戶可以用這一工具在地圖上添加地名與建築名

穿越語言壁壘

實現“穿越語言壁壘的搜尋”的關鍵自然是自動翻譯技術。目前,Google提供57個國家語言的自動翻譯功能,共有3000多種互譯的組合可供選擇。
Google計畫結合文字翻譯語音識別等基礎技術來充實搜尋服務。例如,地圖搜尋服務Google Maps”上也可以用漢語顯示國外地名的功能已經從去年8月份開始提供,目前涵蓋了60個國家和地區的80%的地名信息。
Google是在後台處理系統上組合各種技術自動翻譯成地名的。首先自動讀取外文地名,轉換語音數據。然後用語音識別技術語音數據轉換成文字數據,然後再使用自動翻譯功能翻譯成漢語。儘管也實施人工核對,但是基本上都是自動化處理
視頻共享服務“YouTube”的字幕功能也是採用同樣方法實現的識別英語語音,轉換成文字添加字幕。經過翻譯,顯示中文字幕。使得無字幕的視頻也附有了字幕。
這樣的語言自動翻譯之所以成為可能,是因為具有“雲計算”這一巨大的系統平台。通過數千台電腦進行運算處理,打造了高速的翻譯機器。當然,Google的自動翻譯技術還遠未達到人工翻譯的準確度。但重要的是,每年翻譯與語音識別的準確度都在大幅提升。未來五年,或許能夠在手機上用漢語直接與說英語的國外朋友溝通。

未來“沒有搜尋,勝似搜尋”

通過實時、個性化、非網上、跨語言等四大主題,最終Google將實現什麼樣的搜尋呢?那就是“沒有搜尋,勝似搜尋”。如今,用戶要搜尋必須進行一下操作。而未來,搜尋引擎將讀取用戶的意圖,直接提示出最佳結果。
Google不斷向其宏偉目標挺進。但也並非一帆風順。例如,StreetView不斷被指責侵犯個人隱私。而今年5月,又因為拍攝影像數據的汽車在最近幾年無意中收集了無線區域網路傳送的個人信息而被曝光。對此,Google表示在銷毀數據的同時,停止對無線區域網路信息的採集。此外,儘管如今已經有許多出版社表示參加檢索書籍的GoogleBooks服務,但是在1年前這項服務還備受指責。
所謂“讀取用戶的意圖”技術超過了搜尋範疇而類似人工智慧。方便是方便,但是將難免會引發與用戶之間更多的衝突。

未來搜尋認識的投影

谷歌的未來搜尋方向,從Android到Chrome,從語音搜尋到谷歌TV,都是其對未來搜尋認識的投影。

這並非幻想,而的確是科學,至少谷歌信仰這種科學,而且已經有了發展這一科學的方法論和路線圖。谷歌的首席研究員阿密特·辛格是谷歌中少數幾個有資格談論谷歌方法論和路線圖的人,他在2001年重寫了谷歌搜尋引擎的算法。他是把這套方法論變得更系統、可執行的一位提煉者,同時他也在制定和推動谷歌搜尋路線圖前進的每一步。簡單講,阿密特講述的搜尋科學的方法論就是,算法和工具的雙螺鏇循環。首先是工具,阿密特認為,人類智慧型的發展是一個不斷發明和改進工具的過程,“針對每一種工作都有其工具,我們將愈發精雕細琢。”阿密特·辛格對記者說。他說的並不是模糊的宏大趨勢,這恰恰就是搜尋科學的基礎。“直到顯微鏡和望遠鏡被發明出來,長期在黑暗中探索的生物學和物理學才有了實質性的突破。所以,搜尋的真正偉大的階段其實並沒有到來。”瑪麗薩·梅耶爾用生物學和物理學在15、16世紀的例子來形容今天的搜尋科學。谷歌在不斷為雲端和各種接地設備提供新產品,因為谷歌認為這些套用工具就是搜尋科學的顯微鏡和望遠鏡,能照亮搜尋通向大腦和世界的未來之路,源源不斷蒐集數據。

秘密配方

算法的改進所依賴的正是這些數據。算法一直是谷歌的“神秘配方”,實際上,谷歌的搜尋引擎在2001年後進行了多次重大改造,其中就包括阿密特·辛格2001年的算法重寫。谷歌機器人做的工作首先是對數據進行抽取、分類和結構化(通過文字進行組織,就像書本的目錄),難點在於排序,這像是讓一個機器人表演同時拋起200個瓶子的高難度雜技。機器人程式的編寫者更像一位藝術家,他要讓機器人理解數據的上下文,“所有搜尋引擎都會引入上下文,但沒有一個像谷歌引入得那樣多、套用那樣自如。PageRank(網頁級別)本身也是一個信號,同時也是頁面的一個屬性(指其相對於其他網頁的重要性),該屬性可以幫助確定其與查詢內容的相關性”,《連線》雜誌在今年2月的文章中介紹。標題通常被予以特別關注,錨文本可以通俗理解為超連結,對於用戶可能沒有看到,但對於谷歌機器人,它是非常重要的指標。隨著網頁功能日益複雜化、智慧型化,機器人對網頁數據的抽取和結構化也日益複雜。新鮮度(對於一些查詢,新近的頁面比較早的頁面更有價值)和地理位置(谷歌知道搜尋者的大致地理坐標,會將本地信息排在前面)成為越來越重要的信號。“谷歌目前使用200多種信號來幫助確定搜尋結果的排序。”《連線》雜誌說。同時,阿密特·辛格還指出,用戶在搜尋過程中產生的數據被證明同樣很有價值,這些數據包括他們點擊哪些結果、不滿意時對關鍵字的更改、查詢關鍵字與所處地理位置的關係等。總之,機器人可以從200多個維度來理解用戶的搜尋意圖,可能是用戶所處的情景模式,旅遊或是購物;也可能是用戶希望要的媒體形式——文字、圖片、聲音或者動態的實時資訊;也可能是用戶所屬的國家、地理位置或者使用的語言;還有用戶的社交圈(需要登錄谷歌個人賬戶)——機器人能夠理解用戶敲入關鍵字背後的複雜意圖,提供個性化搜尋。

重要的進展

據說今年穀歌對搜尋引擎的改進多達500項,這些改進被阿密特·辛格形容為給高度3萬英尺、速度每小時1000英里的飛機改進引擎。每年,我們能從兩個會議上看到谷歌“亞歷山大圖書館”浩大工程的進展,一個是谷歌的I/O大會,針對外部的開發者群體;另一個是“搜尋的科學”大會,可以窺見谷歌搜尋引擎的進展。2010年在東京舉辦的谷歌“搜尋的科學”大會上,谷歌展示了它的重要進展。
“搜尋的科學”大會的一個亮點是ChrometoPhone.ChrometoPhone就好像ChromeOS在手機上的一個切入點,它可以同步桌面網際網路上的視頻、地圖等信息,比如用戶在家的電腦上未看完的世界盃比賽視頻或者約會位置的地圖信息需要攜帶出門,完全可以通過同步到ChrometoPhone,在Android手機上實現。第二個亮點是谷歌TV.它是一個電視的作業系統,內嵌在機頂盒、藍光播放機等器材之內,用戶只需單一平台,在能看電視、影碟之餘,更可以搜尋比如在YouTube,CNN新聞等成千上萬網上頻道的節目;甚至通過無線網路用Android手機操作,或用語音搜尋;更支持邊看電視邊上網找資料的畫中畫功能。谷歌公司透露谷歌TV將於明年初正式面世。
為什麼谷歌會做如此多看似與搜尋不相關的套用?其實,這些套用就是搜尋的未來。阿密特·辛格認為搜尋引擎最終會成為用戶的個人助理,無論用戶是誰、身在何時、何地,都能提供他們最需要的信息。辛格對搜尋引擎抱有的幾大夢想正在一一實現:比如超越文本的搜尋(用聲音、圖像和視頻來搜尋);超越語言的搜尋(搜尋時自動翻譯,並結合所屬語種的語境上下文);搜尋社交網路里的信息(用戶的朋友對某一問題的看法);搜尋這一秒鐘的世界(實時搜尋);搜尋離用戶最近的信息(比如最近的便利店、加油站等位置信息)。
谷歌最終夢想是不需要搜尋的搜尋,也就是連線人類的大腦和世界的機器。

第三代語義網智慧型化搜尋引擎

國外已經有了,國內也有一些智慧型搜尋引擎,雖然功能還有待完善,不過已經有了雛形。名為WOLFFRAMALPHA(簡稱WA)的搜尋引擎由英國科學家史蒂芬·沃爾弗拉姆和他的團隊開發。你可以直接向他提問,他會給你一個較為滿意的答案。
與常見搜尋引擎不同的是,WA系統自帶10萬億條信息的資料庫,還存有5萬種多算法和模型,能對需要搜尋的內容進行計算,給出具體答案而不是提供相關連結。普通搜尋引擎只提供網路上存在的內容,而這種新引擎能通過計算,給出以前沒有出現過的答案。
例如,如果使用者在搜尋框中輸入:委內瑞拉的首都是哪兒?得到的答案不僅僅是加拉加斯,還包括地圖、城市人口、現在的當地時間、天氣實況等一系列數據。如果在谷歌輸入同樣內容,返回的結果是超過3000萬個網頁連結。
又比如,如果輸入:巴黎哪一天能看到下一次日全食?網站會給出答案:2090年9月23日。
要是敲入:2001年9月11日那天布蘭妮·斯皮爾斯多大年齡?WA會顯示:19歲9個月9天。
WA網站在產品介紹中說,這一搜尋引擎要讓儘可能多的人獲得專家級的知識和能力,要實現完全接受自由形式的輸入。

人民搜尋剛起步 挑戰前所未有

人民搜尋新聞搜尋1.0版今日正式上線,人民搜尋總經理鄧亞萍表示,1.0意味著人民搜尋的技術和服務剛剛起步,挑戰前所未有,未來責任重大。
據介紹,人民搜搜新聞搜尋1.0版,是一款具有新聞高精度整合功能、記錄新聞傳播過程、呈現時間全貌的搜尋產品。它他的特點是,通過關鍵字追蹤整個新聞事件,把眾多新聞與信息整合為一個或幾個完整的“事件單元”,通過“事件單元”的有序分布來組織和反應。

框計算:布局未來搜尋

麻省理工建築城規學院院長威廉•米切爾在上個世紀90時代的著作《伊托邦》中,綜合經濟、文化、社會學等角度探索數字生活的未來,呼籲人類“必須學習去建造數字烏托邦——電子服務的、全球互聯的城市”。短短10年,書中描述的概念正在逐漸實現,諸如“虛擬社區”、“電子城市”等等,由互聯智慧型帶來的革命正在徹底改變信息的形式和傳播方式,從而深刻改造著人類傳統的生活體系。
毫無疑問,網際網路是推動“伊托邦”成為可能的核心力量,而智慧型技術的積累、開放的思維、和諧的生態則是必不可少的要素。以小見大,從西方的蘋果、Facebook,到東方的百度,在席捲全球的網際網路開放平颱風潮中,人類正在潛移默化地感受著這種漸變的革命。
2009年,百度首次提出了“框計算”這個概念時,框計算還只是限於一個概念,2010年百度世界技術大會召開時,百度框計算公布了最新的實施方案——開放平台。英國《金融時報》指出,這個把套用開放平台和搜尋引擎結合起來的創意,是中國企業少見的“真正意義上的創新實例”。基於百度框計算下的開放平台,伊托邦的數字理想正在實現。

框計算走入生活

威廉•米切爾對“數字城市”特點的一個核心觀點是“至簡”。環顧網際網路所有套用中,最簡單、用戶互動最便捷的便是搜尋引擎的“框”:用戶將自己的需求訴諸於“框”,然後獲得結果。搜尋誕生10多年來,其用戶參與方式正越來越簡化。
百度創始人、CEO李彥宏心中也有一個數字理想——他把它稱為“框計算”。李彥宏的終極構想是:未來“框”將無所不在,用戶的需求在這裡提交和分析,並匹配最佳的套用服務,滿足其需求。
最近幾年,乃至百度的下一個10年,將“框計算”落地,變革人類的生存方式,將是這家公司最重要的使命。在今年9月2日,框計算理念下的套用開放平台問世,讓第三方套用可以統一運行在百度框計算平台上,從而讓用戶實現“即搜即用”。
通過“框計算”,百度從過去的搜尋工具,逐漸向網際網路作業系統演進,再一次徹底顛覆了中文人群的信息獲取方式,甚至生存方式本身——如果在10年前獲取一本書只能去圖書館,如今通過百度搜尋框,這本書將被直接送至你面前,並可在結果頁面直接閱讀;過去搜尋“電視直播”獲得的只是匹配關鍵字的超級連結,而如今,百度更像是一個功能強大的網際網路作業系統,直接選擇並且調用相關的視頻套用,實現線上的節目播放;而搜尋一款遊戲,也是類似情況——在短短數秒間,百度已經為用戶在浩淼的網際網路海洋中查找並鎖定了數個相關套用,並且支持即時調用。
隨著框計算理念的逐漸深入,人們衣食住行、娛樂休閒、商務旅遊等所有需求將通過“搜尋框”得以一站解決。而這種構想不僅局限在網際網路,隨著移動網際網路的到來、WIFI熱點的增加,任何終端、任何接入方式,一個“框”將滿足用戶所有需求。

框計算背後

“框計算”背後凝聚著數千位百度工程師的心血和努力。這家中國網際網路企業的總部設在北京,擁有8000多名員工,辦公空間類似於美國矽谷,舒適而自然。目的是激發員工迸發改變世界的創新和創意。巨大的玻璃建築包括自然光照明的開放空間,嬰兒護理室,甚至屋頂花園。
在三樓會議室,一群年輕工程師圍坐在桌子旁,桌上雜亂擺放著筆記本電腦和食品包裝袋。他們的工作並不是去空想,而是構建最符合用戶需求和最具實用價值的搜尋引擎。
去年框計算理念推出以來,百度內部成立了“框計算技術委員會”,每天都會基於“框計算”推出多項新技術上線。“我們會讓框越來越智慧型,讓用戶體驗越來越簡單。”百度相關負責人說。“未來的電腦用戶不需要學習一個新的作業系統,不需要有各種各樣複雜的語法,他只要把需求告訴這個框,想到什麼就說什麼,一秒鐘,就可以獲得滿意的答案。”
作為基於用戶需求的最前沿技術理念,框計算包含“需求識別”和“需求回響”這些最複雜和最具技術含量的課題。用戶需求進入搜尋框,後台隨即進行“需求識別”,確定用戶究竟要網際網路為他做什麼,背後又包括語義分析、行為分析、智慧型人機互動、海量計算處理等多環節,最終“窺視”用戶的需求。
框計算的核心除了傳統所認為的計算技術之外,還包括被計算技術所調用、來滿足需求的“資源”,而這種最優質的資源,則由廣大的第三方套用開發者、服務提供者提供,通過百度開放平台,來實現與用戶的對接。據悉,目前百度開放平台已經網羅400多家合作夥伴,共同開發了針對不同領域的優質資源,每天回響超過一億的相關搜尋請求。框計算讓百度繼續領先行走於網際網路技術前沿。

框計算的建築師

框計算這項曠日持久的浩大工程,絕非幾個“工程師”就能建設完成的。它還需要無數“建築師”的參與、長期共贏的遊戲規則、和諧的生態環境。在百度套用開放平台上,擁有優質用戶體驗的套用被大為推崇,那些積極為“框計算”添磚加瓦的“建築師”們已經嘗到了甜頭。
以提供“線上防毒”服務的金山為例,當用戶在百度檢索“線上防毒”等關鍵字時,其服務內嵌至百度頁面,在帶給網民便利、實惠的同時,金山的LOGO、網站連結也同時展示,獲得品牌塑造、海量高黏度用戶、著作權權益的保護等綜合價值。據金山的監測數據,合作前後,這一服務的流量差異高達200%。另一家提供電視直播服務的PPTV也同時宣稱“流量翻番”。
縱觀IT巨擘的開放平台,蘋果已經分給了開發者10億美元,Facebook誕生了IPO市值可能達50億的zynga,而對於剛剛誕生的百度套用開放平台來說,外界給予了更多的期待。分析認為,中國擁有4.2億全球最大、並且還在快速增長的網民群體,而百度的平台一經出台就匹配了捐助、付費、廣告等多種變現模式,加之百度這箇中文最大的需求回響中心匯聚的海量請求,讓其無論從技術創新、還是商業回報上,都有著巨大的想像空間,確保源源不斷的創新,便捷、高效、持續地滿足用戶需求。
搜尋引擎的未來關鍵是“以人為本”,最重要的還是要考慮用戶的需求。百度的框計算一方面通過有效的需求分析讀取需求,另一方面搭建一個具有使用價值的平台,通過開放透明的遊戲規則制定,動員產業鏈各方的動員加入到共同滿足需求的大軍中來。在用戶為核心的驅動下,網際網路的數字理想也正在實現。

相關詞條

相關搜尋

熱門詞條

聯絡我們