《集體智慧編程》

《集體智慧編程》

令線上零售商向用戶提供商品或媒體推薦的協作型過濾技術;

在一個大型數據集中檢測相似項群組的聚類方法;

在針對某一問題的數以百萬計的可能題解中進行搜尋,並從中選出最優解的最佳化算法;

用於垃圾過濾技術的貝葉斯過濾器,如何根據單詞類型及其他特徵對文檔進行分類;

用於對線上約會站點的用戶進行配對的支持向量機;

用於問題求解的智慧型進化技術——隨著玩遊戲的次數逐漸增多,計算機玩家如何通過改進自身代碼的方式來發展技能。

基本信息

內容簡介

《集體智慧編程》集體智慧編程
本書以機器學習與計算統計為主題背景,專門講述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場行銷、個人品味等諸多信息,並得出有用的結論,通過複雜的算法來從Web網站獲取、收集並分析用戶的數據和反饋信息,以便創造新的用戶價值和商業價值。全書內容翔實,包括協作過濾技術(實現關聯產品推薦功能)、集群數據分析(在大規模數據集中發掘相似的數據子集)、搜尋引擎核心技術(爬蟲、索引、查詢引擎、PageRank算法等)、搜尋海量信息並進行分析統計得出結論的最佳化算法、貝葉斯過濾技術(垃圾郵件過濾、文本過濾)、用決策樹技術實現預測和決策建模功能、社交網路的信息匹配技術、機器學習和人工智慧型套用等。
本書是Web開發者、架構師、套用工程師等的絕佳選擇。

作者簡介

TobySegaran是Genstruct公司的軟體開發主管,這家公司涉足計算生物領域,他本人的職責是設計算法,並利用數據挖掘技術來輔助了解藥品機理。TobySegaran還為其他幾家公司和數個開源項目服務,幫助它們從收集到的數據當中分析並發掘價值。除此以外,TobySegaran還建立了幾個

目錄

第1章集體智慧導言
什麼是集體智慧
什麼是機器學習
機器學習的局限
真實生活中的例子
學習型算法的其他用途
第2章提供推薦
協作型過濾
蒐集偏好
尋找相近的用戶
推薦物品
匹配商品
構建一個基於delici0US的連結推薦系統
基於物品的過濾
使用MovieLens數據集
基於用戶進行過濾還是基於物品進行過濾
練習
第3章發現群組
監督學習和無監督學習
單詞向量
分級聚類
繪製樹狀圖
列聚類
K-均值聚類
針對偏好的聚類
以二維形式展現數據
有關聚類的其他事宜
練習
第4章搜尋與排名
搜尋引擎的組成
一個簡單的爬蟲程式
建立索引
查詢
基於內容的排名
利用外部回指連結
從點擊行為中學習
練習
第5章最佳化
組團旅遊
描述題解
成本函式
隨機搜尋
爬山法
模擬退火算法
遺傳算法
真實的航班搜尋
涉及偏好的最佳化
網路可視化
其他可能的套用場合
練習
第6章文檔過濾
過濾垃圾信息
文檔和單詞
對分類器進行訓練
計算機率
樸素分類器
費舍爾方法
將經過訓練的分類器持久化
過濾部落格訂閱源
……
第7章決策樹建模
第8章構建價格模型
第9章高階分類:核方法與SVM
第10章尋找獨立特徵
第11章智慧型進化
第12章算法總結
附錄A:第三方函式館
附錄B:數學公式
索引

盤點有關算法書籍

算法可以理解為有基本運算及規定的運算順序所構成的完整的解題步驟。或者看成按照要求設計好的有限的確切的計算序列,並且這樣的步驟和序列可以解決一類問題。
《算法之道》
《妙趣橫生的算法》
《機器學習》
《光線跟蹤算法技術》
《遊戲核心算法編程內幕》
《植物的算法美》
《計算智慧型》
《組合數學教程》
《套用組合數學》
《大話數據結構》
《蟻群算法原理及其套用》
《數學建模》
《支持向量機導論》
《國際大學生程式設計競賽例題解》
《數據挖掘原理與算法》
《MATLAB函式速查手冊》
《大學算法教程》
《算法設計》
《多任務下的數據結構與算法》
《集體智慧編程》
《最最佳化理論與方法》
《深入淺出數據分析》
《群智慧型算法及其套用》
《高效程式的奧秘》
《近似算法》
《生物信息學算法導論》
《C數值算法》
《計算數論》
《ACM程式設計競賽基礎教程》
《算法引論》
《STL源碼剖析》
《新編實用算法分析與程式設計》
《並行程式設計》
《信息檢索》
《數據壓縮導論》
《多處理器編程的藝術》
《程式設計中常用的解題策略》
《圖論導引》
《算法設計與分析導論》
《分散式算法導論》
《面向千萬億次計算的算法與套用》
《分散式算法》
《數據結構與算法分析》
《具體數學》
《實時碰撞檢測算法技術》
《世界大學生程式設計競賽》
《算法設計與分析基礎》
《柔性字元串匹配》
《程式設計師實用算法》
《圖論簡明教程》
《現代最佳化計算方法》
《現代密碼學理論與實踐》
《MATLAB語言常用算法程式集》
《編程的本質》
《算法藝術與信息學競賽》

相關詞條

相關搜尋

熱門詞條

聯絡我們