搜尋引擎作為網際網路發展中非常重要的一種應用,已經成為網際網路各個領域中的制高點,其重要性不言而喻。搜尋引擎領域也是網際網路應用中以核心技術作為其主要命脈的領域,搜尋引擎各個子系統是如何設計的呢?這值得成為廣大技術人員和搜尋引擎機制優化人員密切關心的內容。本書的最大特點為內容新穎全面且通俗易懂。對於搜尋引擎所涉及的各種核心技術都有全面且詳細的介紹,除了作為搜尋系統核心的網路爬蟲、索引系統、排序系統、連結分析及使用者分析之外,還包括網頁反作弊、快取管理、相似網頁抄襲偵測…等技術於搜尋引擎必須關心的技術,同時使用相當大的篇幅講解雲端運算與雲端儲存的核心技術原理。此外,本書也密切注意搜尋引擎發展的前沿技術:Google咖啡因系統及Megastore等雲端運算新技術、百度的深層網頁抓取技術阿拉丁計畫、內容農場作弊、機器學習排序…等。諸多新技術在相關章節都有詳細的講解,同時對於社交搜尋、即時搜尋及情境搜尋…等搜尋引擎的未來發展方向進行探討。為了增進讀者對於相關技術的了解,在書中引入大量的圖片來講解演算法的運作原理,相信讀者會發現原來搜尋引擎的核心技術比原先想像的要簡單得多。本書適合對於搜尋引擎技術感興趣的所有使用者,尤其對於相關領域的學生以及對於搜尋引擎核心技術感到好奇的技術人員,並且對於從事搜尋引擎機制優化的相關人員及中小網站的站長…更具有參考價值。誰適合閱讀這本書如果您是下列人員之一,那麼本書便非常適合您閱讀。1. 對於搜尋引擎核心演算法有興趣的技術人員.搜尋引擎的整體架構為何?包含哪些核心技術?.網路爬蟲的基本架構為何?常見的網頁爬取原則策略?何謂深層網頁爬取?如何建構分散式爬蟲?百度的阿拉丁計畫內容為何?.何謂反向索引?如何針對反向索引進行資料壓縮?.搜尋引擎如何對搜尋結果排序?.何謂向量空間模型?概率模型?BM25模型?機器學習排序?它們之間有何差異?.PageRank和HITS演算法為何關係?有何差異?SALSA演算法?Hilltop演算法?各種連結分析演算法之間有何關係?.如何辨識使用者搜尋的真正搜尋意圖?使用者搜尋目的可以分為幾類?何謂點擊圖?何謂查詢會話?相關搜尋機制是如何達成的?.為什麼要對網頁進行重複內容刪除機制?如何對網頁進行重複內容去除?哪種演算法效果比較好?.搜尋引擎快取有幾層結構?核心原則為何?.何謂情境搜尋?社交搜尋?即時搜尋?.搜尋引擎機制有哪些發展趨勢?如果您對其中三個以上的議題感到興趣,那麼本書就是為您而寫的。2. 對於雲端運算與雲端儲存技術有興趣的技術人員.何謂CAP原理?ACID原理?它們之間有什麼差異?.Google的整套雲端運算架構中包含哪些技術?Hadoop和Google的雲端運算架構有什麼關係?.Google的三駕馬車GFS、BigTable、MapReduce各自代表什麼含義?其關係為何?.Google的咖啡因系統其基本原理為何?.Google的Pregel運算模型和MapReduce運算模型有什麼區別?.Google的Megastore雲端儲存系統和BigTable關係為何?.Amazon的Dynamo系統為何?.Yahoo的PNUTS系統為何?.Facebook的Haystack儲存系統適合應用於什麼場合上?如果您對上述問題感興趣,相信可以從書中找到答案。3. 從事搜尋引擎優化的網路行銷人員及中小網站站長.搜尋引擎的反作弊策略為何?如何在進行優化時避免被誤認為是作弊行為?.搜尋引擎如何對搜尋結果進行排序?連結分析和內容排序關係為何?.何謂內容農場?連結農場?它們之間的關係為何?.何謂Web2.0作弊?有哪些常見手法?.何謂SpamRank?TrustRank?BadRank?它們之間的關係為何?.咖啡因系統對於網頁排名有何影響?最近有一些電子商務網站針對搜尋引擎進行優化,但是結果卻是被Google 認為是搜尋引擎毒化 (Blackhat SEO) 因此反而導致搜尋排名下降,如何避免發生這種情況? 從事相關行業的行銷人員和網站站長都應該深入瞭解搜尋引擎反作弊的基本策略和方法,甚至是網頁排名演算法等搜尋引擎核心技術。SEO 技術說穿了其實很簡單,雖然不斷發生變化,但是很多原理其實都相似,萬變不離其宗,深入瞭解搜尋引擎相關技術原理將增加您的競爭優勢。
世界正變得更小、更扁平,且變得更智慧。雲端運算,是改變世界的推手之一。面對雲端時代的來臨,你準備好了嗎?雲端運算是一種將IT資源、資料和應用作為服務,透過網路提供給用戶的運算模式。2008年底,IBM向全球推出了「智慧的地球」(Smart Planet)這一願景,其目標是讓世界的運轉更加智慧化,讓個人、企業、組織、政府、自然和社會之間的互動效率更高。而雲端運算(Cloud Computing)作為一種新興的運算模式,正是實現智慧地球最為重要的手段之一。本書有系統地闡述了雲端運算的理念、架構、對產業的影響以及具體的應用,深入分析了雲端運算即將帶來的深刻變革,並分享了作者們在實施雲端運算「落地」過程中的第一手寶貴經驗。內容所列舉出的實際案例,包含Amazon、Google、微軟、IBM等各家公司在雲端技術上所引領的方向與投入的心力,以及雲端運算中心在中國各地開花結果的現況與其價值所在,這也都一再證明了雲端運算的未來可能性。本書清晰、詳實的內容對於身處IT變革浪潮中的技術人員、管理者以及關注技術發展的各個群體都具有極為珍貴的參考價值。本書是由IBM大中華區雲端運算中心總經理朱近之女士主編,IBM大中華區雲端運算中心工作團隊:方興、劉秦豫、曹凡、岳爽、牛猛華、郭哲編著。其中朱近之女士更受聘為中國電子學會雲端運算專家委員會專家委員,並在專業期刊上發表過一系列雲端運算的相關文章,對於雲端運算的實踐有豐富的經驗。
還在「偷菜」嗎?除了「偷菜」Facebook還能為你帶來什麼?SNS是目前最夯的網路產業,廣義來說,部落格、微網誌、視訊網站、網路相簿等,甚至即時通訊,都包含在SNS概念中。社交網站所帶來的不僅僅是社交功能,其所創造出的SNS經濟已經成為主流。瞭解並把握住社會化網路的趨勢,才能在新的商業行銷和公關模式中取得競爭優勢,創造收益。
本書掌握Internet最新的觀念,結合時尚的新知與應用,教導如何利用這些網路資源來強化人脈經營、輔助學習、商業應用、社群經營、微網誌建立和網頁美化,對於網路安全的認識與防範、資訊倫理、電子商務、行動商務,也是本書關心的重點。在內容安排上,絕對是一本真正能夠掌握網際網路相關入門知識及最新科技應用的重點書籍。特色如下:■內容充實完備涵蓋的主題包括最新網際網路新知與科技應用,內容完備且豐富,依單元可分為:網路入門篇、人脈經營篇、資源活用篇、網路商業篇、視覺美化篇。■搭配圖例原理針對不易理解的原理,加入大量的圖例及示意圖來增加理解程度,期以最輕鬆的方式,吸收Internet相關應用的精華資訊。■融入實例操作將重要的軟體功能搭配實例演練,藉由循序步驟式的操作的過程從中學習實用的功能。■課後大量習題各章末尚有安排習題測驗,提供學生課後練習的機會,可作為老師驗收教學成效的測驗平台。
◎參考全國多位老師教學經驗設計編撰,專為大專網路概論所設計的教學用書。◎書中以圖解和個案來談論網路的運作概念,避免艱深技術,方便老師授課。◎書中也安排簡易的網路實作練習,讓讀者可自行學習之用。◎網路基礎篇首先介紹網路的各種用途與分類;通訊協定和網路模型則介紹重要的OSI七層協定和DoD四層協定;而傳輸媒介和和網路設備,則介紹目前實際運用的媒介和概念,讓讀者知道實際網路的實體組成。◎網路原理篇針對網路運作的原理來進行比較深入的談論。深入介紹區域網路的主流-乙太網路和廣域網路,包括ADSL和Cable Modem等;另外介紹DoD模型最重要的IP層和TCP層的相關原理。◎應用層篇係討論網路應用層重要的相關應用和其原理。例如:DNS和 DHCP、WWW、檔案傳輸協定(FTP)與點對點傳輸(P2P)、電子郵件的POP3和SMTP協定、即時通軟體和網路電話等等。◎無線網路和資訊安全篇則探討無線網路和資訊安全相關應用和原理。
本書是Google Web Toolkit (GWT) 的入門書,主要打算為剛接觸 GWT 的讀者介紹 GWT 的概念與主要功能,從傳統 Web 應用程式開發者的角度介紹如何發輝 GWT 的威力。這本書的重點放在實際開發業務系 Web 應用程式的時候,要如何以 GWT 的方式思考、要如何應用 GWT 的相關功能。