0920~0926_夏季暢銷第三波BN

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發

  • 9 792
    880

活動訊息

想找書的時候,特別想偷看網友的書櫃... 原來大家都在看這本 ↓↓↓

用閱讀開啟視野,讓書成為照亮你人生的光
【金石堂選書】本月推薦您這些好書👉 快來看看

內容簡介

☆★☆★【語音辨識專案應用開發!】★☆★☆
了解語音辨識概要,讓你對WebRTC及Kaldi瞭若指掌!


隨著AI時代的來臨,人類語言的處理在硬體高度平民化之後,你我也可以開發出類似的產品,事實上語音服務早在1950年代就開始研究了。這些應用早就存在於智慧喇叭、手機語音助理、車載智慧座艙、語音輸入法與翻譯機等;企業級應用包括智慧客服、語音品管、智慧教育、智慧醫療等。本書是難得少見的中文語音高階技術的教材,用簡單的Kaldi、WebRTC、gRPC等專案,就可以開發出企業等級的語音服務應用,這些下放至平民百姓家的技術,在搭配本書之後,立即成為你可以立刻上手的工具,充份應用人工智慧時代深度學習技術帶來的福利。

本書特色

✪語音前端處理,語音辨識
✪語者自動分段標記演算法原理
✪基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務
✪前端演算法完整介紹
✪語音活動檢測、語音降噪、回聲消除、波束形成
✪WebRTC和Kaldi最佳化處理流程
✪形成語音演算法SDK
✪微服務建構的RPC遠端呼叫框架和SDK

 

作者

楊學銳

大疆創新語音交互演算法負責人,復旦大學及Turku大學碩士,長期從事語音演算法、深度學習、人工智慧等領域的研究與商業落地,在相關領域發表多篇論文及專利。

晏超

北京郵電大學碩士,曾任職於HP Labs, Cisco, Technicolor等公司。 現為雲從科技語音演算法負責人,從事語音辨識、聲紋識別、說話人日誌、語音合成等方向的演算法研發工作,構建了雲從科技整套語音演算法引擎與應用服務平臺。

劉雪松

OPPO音訊演算法專家,復旦大學碩士,曾任職於美國國家儀器、聲網、雲從科技等公司。 在信號處理、音訊演算法和語音演算法等領域有豐富的實戰經驗,在相關領域發表多篇論文及專利。

 

目錄

Chapter 01 語音辨識概述
1.1 語音辨識發展歷程
1.2 語音辨識產業與應用
1.3 常用語音處理工具

Chapter 02 語音訊號基礎
2.1 語音訊號的聲學基礎
2.2 語音訊號的數位化和時頻變換
2.3 本章小結

Chapter 03 語音前端演算法
3.1 語音前端演算法概述
3.2 VAD
3.3 單通道降噪
3.4 回音消除
3.5 麥克風陣列與波束形成
3.6 聲源定位
3.7 其他未盡話題
3.8 本章小結

Chapter 04 語音辨識原理
4.1 特徵提取
4.2 傳統聲學模型
4.3 DNN-HMM
4.4 語言模型
4.5 WFST 解碼器
4.6 序列區分性訓練
4.7 點對點語音辨識
4.8 語音辨識模型評估
4.9 本章小結

Chapter 05 中文漢語模型訓練-- 以multi_cn 為例
5.1 Kaldi 安裝與環境設定
5.2 Kaldi 中的資料格式與資料準備
5.3 語言模型訓練
5.4 發音詞典準備
5.5 特徵提取
5.6 Kaldi 中的Transition 模型
5.7 預對齊模型訓練
5.8 資料增強
5.9 I-Vector 訓練
5.10 神經網路訓練
5.11 解碼圖生成
5.12 本章小結
5.13 附錄

Chapter 06 基於Kaldi 的語者自動分段標記
6.1 語者自動分段標記概述
6.2 聲紋模型訓練-- 以CNCeleb 為例
6.3 本章小結

Chapter 07 基於Kaldi 的語音SDK 實現
7.1 語音特徵提取
7.2 基於WebRTC 的語音活動檢測
7.3 語者自動分段標記模組
7.4 語音辨識解碼
7.5 本章小結

Chapter 08 基於gRPC 的語音辨識服務
8.1 gRPC 語音服務
8.2 ProtoBuf 協定定義
8.3 基於gRPC 的語音服務實現
8.4 本章小結

Appendix A 參考文獻

 

序/導讀



近年來,隨著深度學習技術的不斷發展,語音辨識準確率獲得了大幅提升,由此帶來了基於語音互動應用的豐富想像力,這些技術越來越多地影響著人們生產和生活的各方面。其中,消費級應用包括智慧喇叭、手機語音助理、車載智慧座艙、語音輸入法與翻譯機等;企業級應用包括智慧客服、語音品管、智慧教育、智慧醫療等。各類智慧語音應用的蓬勃發展使得越來越多的人加入語音領域的研究和落地,共同推動整個語音產業的發展。

得益於語音辨識技術的蓬勃發展和辨識率的節節攀升,業界湧現出眾多優秀的點對點語音工具套件,如Wenet,ESPNet,SpeechBrain 等。儘管如此,2009 年約翰霍普金斯大學夏季研討會孵化出的Kaldi 工具箱,以其穩定的演算法效果,活躍的社區氣氛,獲得了廣泛應用,極大地降低了語音辨識的上手門檻,也培養了大量的相關人才。目前,仍然有很多公司在使用基於Kaldi 的專案。

由於語音互動技術涉及的演算法與技術鏈較長,因此已有的語音演算法相關圖書主要集中在各類語音演算法的原理與訓練上,缺乏從語音互動角度出發,介紹語音互動所需的語音前後端各項演算法和整體解決方案的相關圖書。在語音應用的落地上,學術界也缺乏產業界的專案應用實作經驗。本書將致力於拉近學術界與產業界的距離,在系統地介紹語音互動流程中涉及的語音前端處理、語音辨識和語者自動分段標記等演算法原理的同時,詳細介紹如何基於WebRTC,Kaldi 和gRPC,從零建構產業界穩定、高性能、可商用的語音服務。

在前端演算法的相關章節中,本書系統地介紹了語音活動檢測、語音降噪、回音消除、波束形成等常用的語音前端處理演算法的原理,還針對各種演算法在實際場景中的專案實現方法,提供了大量的經驗複習。除了介紹傳統訊號的處理方法,本書還介紹了深度學習方法在語音前端領域中的發展和應用現狀。

在語音後端演算法方面,本書詳細介紹了語音辨識中的特徵提取、聲學模型、語言模型、解碼器和點對點語音辨識,以及語者自動分段標記中的聲紋Embedding 提取和聚類演算法。同時,還介紹了如何基於Kaldi 訓練語音辨識及語者自動分段標記模型。針對訓練模型時的很多細節問題,提供了詳細的解釋。

在語音演算法專案化方面,本書介紹了如何利用WebRTC 和Kaldi 最佳化處理流程,形成語音演算法SDK。基於流行的用於微服務建構的RPC 遠端呼叫框架和SDK,進一步介紹了如何實現一套方便使用者快捷連線的語音演算法的微服務。

本書由楊學銳、晏超、劉雪松合作撰寫。三位作者長期在最前線從事語音演算法工作,書中內容彙集了他們在產業界模型訓練和應用實作的思考與經驗複習,希望能給學術界的研究人員與產業界的從業人員帶來一絲啟發和幫助。其中楊學銳負責第1、4、5 章的撰寫及全書內容的審核校對,晏超負責第6、7、8 章的撰寫及工程程式的實現偵錯,劉雪松負責第2、3 章及第1章部分內容的撰寫和校對。

最後,感謝電子工業出版社李淑麗老師的辛苦工作,感謝吳伯庸和王金超對本書的貢獻,感謝陳勇的審稿與校對,感謝成書過程中給予過幫助的所有相關人士。

由於作者水準有限,書中如有任何錯誤與不足,懇請讀者們批評指正並提出寶貴意見。


作者

 

配送方式

  • 台灣
    • 國內宅配:本島、離島
    • 到店取貨:
      金石堂門市 不限金額免運費
      7-11便利商店 ok便利商店 萊爾富便利商店 全家便利商店
  • 海外
    • 國際快遞:全球
    • 港澳店取:
      ok便利商店 順豐 7-11便利商店

詳細資料

詳細資料

    • 語言
    • 中文繁體
    • 裝訂
    • 紙本平裝
    • ISBN
    • 9786267146484
    • 分級
    • 普通級
    • 頁數
    • 464
    • 商品規格
    • 23*17
    • 出版地
    • 台灣
    • 適讀年齡
    • 全齡適讀
    • 注音
    • 級別

商品評價

訂購/退換貨須知

加入金石堂 LINE 官方帳號『完成綁定』,隨時掌握出貨動態:

加入金石堂LINE官方帳號『完成綁定』,隨時掌握出貨動態
金石堂LINE官方帳號綁定教學

提醒您!!
金石堂及銀行均不會請您操作ATM! 如接獲電話要求您前往ATM提款機,請不要聽從指示,以免受騙上當!

退換貨須知:

**提醒您,鑑賞期不等於試用期,退回商品須為全新狀態**

  • 依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」,以下商品購買後,除商品本身有瑕疵外,將不提供7天的猶豫期:
    1. 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮食品)
    2. 依消費者要求所為之客製化給付。(客製化商品)
    3. 報紙、期刊或雜誌。(含MOOK、外文雜誌)
    4. 經消費者拆封之影音商品或電腦軟體。
    5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書、電子雜誌、下載版軟體、虛擬商品…等)
    6. 已拆封之個人衛生用品。(如:內衣褲、刮鬍刀、除毛刀…等)
  • 若非上列種類商品,均享有到貨7天的猶豫期(含例假日)。
  • 辦理退換貨時,商品(組合商品恕無法接受單獨退貨)必須是您收到商品時的原始狀態(包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等),請勿直接使用原廠包裝寄送,或於原廠包裝上黏貼紙張或書寫文字。
  • 退回商品若無法回復原狀,將請您負擔回復原狀所需費用,嚴重時將影響您的退貨權益。
※ 網友掛保證,絕不踩雷書單如下 ↓↓↓
預計 2025/10/03 出貨 購買後進貨 
金石堂門市 全家便利商店 ok便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing