圖像處理、分析與機器視覺(第4版)

圖像處理、分析與機器視覺(第4版)

圖像處理、分析與機器視覺(第4版)。 本書是在第3版中文翻譯的基礎上,按照直譯的原則進行翻譯的,與英文版形成完全的對照。

作者簡介

作者:Milan Sonka,Vaclav Hlavac,Roger Boyle 著 興軍亮 艾海舟 等譯

內容簡介

本書是英文第4版的中文翻譯,大約有五分之一的內容更新。主要更新的內容包括:增加了一些最新的算法,增加了習題部分,重寫了部分內容。更為具體的內容更新請參考作者序。 本書是在第3版中文翻譯的基礎上,按照直譯的原則進行翻譯的,與英文版形成完全的對照。對於英文版中明顯存在的排印或疏忽類的錯誤,都進行了更正。由於這些錯誤一般都很明顯,因此譯文中沒有專門聲明,讀者如果對照英文版,不難看出其出處。

目錄

第1章引言 1

1.1動機 1

1.2計算機視覺為什麼是困難的 2

1.3圖像表達與圖像分析的任務 4

1.4總結 7

1.5習題 7

1.6參考文獻 8

第2章圖像及其表達與性質 9

2.1圖像表達若干概念 9

2.2圖像數位化 11

2.2.1採樣 11

2.2.2量化 12

2.3數字圖像性質 13

2.3.1數字圖像的度量和拓撲性質 13

2.3.2直方圖 17

2.3.3熵 18

2.3.4圖像的視覺感知 18

2.3.5圖像品質 20

2.3.6圖像中的噪聲 21

2.4彩色圖像 22

2.4.1色彩物理學 22

2.4.2人所感知的色彩 23

2.4.3彩色空間 26

2.4.4調色板圖像 28

2.4.5顏色恆常性 28

2.5攝像機概述 29

2.5.1光敏感測器 29

2.5.2黑白攝像機 30

2.5.3彩色攝像機 32

2.6總結 32

2.7習題 33

2.8參考文獻 35

第3章圖像及其數學與物理背景 37

3.1概述 37

3.1.1線性 37

3.1.2狄拉克(Dirac)分布和卷積 37

3.2積分線性變換 38

3.2.1作為線性系統的圖像 39

3.2.2積分線性變換引言 39

3.2.31D傅立葉變換 39

3.2.42D傅立葉變換 43

3.2.5採樣與香農約束 45

3.2.6離散餘弦變換 47

3.2.7小波變換 48

3.2.8本徵分析 52

3.2.9奇異值分解 53

3.2.10主分量分析 54

3.2.11Radon變換 56

3.2.12其他正交圖像變換 56

3.3作為隨機過程的圖像 57

3.4圖像形成物理 59

3.4.1作為輻射測量的圖像 59

3.4.2圖像獲取與幾何光學 60

3.4.3鏡頭像差和徑向畸變 63

3.4.4從輻射學角度看圖像獲取 65

3.4.5表面反射 67

3.5總結 69

3.6習題 70

3.7參考文獻 71

第4章圖像分析的數據結構 73

4.1圖像數據表示的層次 73

4.2傳統圖像數據結構 74

4.2.1矩陣 74

4.2.2鏈 76

4.2.3拓撲數據結構 76

4.2.4關係結構 77

4.3分層數據結構 78

4.3.1金字塔 78

4.3.2四叉樹 79

4.3.3其他金字塔結構 80

4.4總結 81

4.5習題 82

4.6參考文獻 83

第5章圖像預處理 85

5.1像素亮度變換 85

5.1.1位置相關的亮度校正 85

5.1.2灰度級變換 86

5.2幾何變換 88

5.2.1像素坐標變換 88

5.2.2亮度插值 89

5.3局部預處理 91

5.3.1圖像平滑 91

5.3.2邊緣檢測運算元 97

5.3.3二階導數過零點 100

5.3.4圖像處理中的尺度 104

5.3.5Canny邊緣提取 105

5.3.6參數化邊緣模型 107

5.3.7多光譜圖像中的邊緣 107

5.3.8頻域的局部預處理 108

5.3.9用局部預處理運算元作線檢測 112

5.3.10角點(興趣點)檢測 113

5.3.11最大穩定極值區域檢測 116

5.4圖像復原 117

5.4.1容易復原的退化 118

5.4.2逆濾波 118

5.4.3維納濾波 118

5.5總結 120

5.6習題 121

5.7參考文獻 126

第6章分割Ⅰ 130

6.1閾值化 130

6.1.1閾值檢測方法 132

6.1.2最優閾值化 133

6.1.3多光譜閾值化 135

6.2基於邊緣的分割 136

6.2.1邊緣圖像閾值化 137

6.2.2邊緣鬆弛法 138

6.2.3邊界跟蹤 139

6.2.4作為圖搜尋的邊緣跟蹤 143

6.2.5作為動態規劃的邊緣跟蹤 149

6.2.6Hough變換 152

6.2.7使用邊界位置信息的邊界

???檢測 157

6.2.8從邊界構造區域 157

6.3基於區域的分割 159

6.3.1區域歸併 160

6.3.2區域分裂 161

6.3.3分裂與歸併 162

6.3.4分水嶺分割 165

6.3.5區域增長後處理 167

6.4匹配 167

6.4.1模版匹配 168

6.4.2模版匹配的控制策略 170

6.5分割的評測問題 170

6.5.1監督式評測 171

6.5.2非監督式評測 173

6.6總結 174

6.7習題 176

6.8參考文獻 178

第7章分割Ⅱ 185

7.1均值移位分割 185

7.2活動輪廓模型——蛇行 190

7.2.1經典蛇行和氣球 191

7.2.2擴展 193

7.2.3梯度矢量流蛇 194

7.3幾何變形模型——水平集和測地

??活動輪廓 198

7.4模糊連線性 203

7.5面向基於3D圖的圖像分割 208

7.5.1邊界對的同時檢測 208

7.5.2次優的表面檢測 211

7.6圖割分割 212

7.7最優單和多表面分割 217

7.8總結 227

7.9習題 228

7.10參考文獻 229

第8章形狀表示與描述 237

8.1區域標識 239

8.2基於輪廓的形狀表示與描述 241

8.2.1鏈碼 241

8.2.2簡單幾何邊界表示 242

8.2.3邊界的傅立葉變換 245

8.2.4使用片段序列的邊界描述 246

8.2.5B樣條表示 249

8.2.6其他基於輪廓的形狀描述

???方法 250

8.2.7形狀不變數 251

8.3基於區域的形狀表示與描述 253

8.3.1簡單的標量區域描述 254

8.3.2矩 257

8.3.3凸包 259

8.3.4基於區域骨架的圖表示 262

8.3.5區域分解 266

8.3.6區域鄰近圖 267

8.4形狀類別 268

8.5總結 268

8.6習題 270

8.7參考文獻 272

第9章物體識別 278

9.1知識表示 278

9.2統計模式識別 281

9.2.1分類原理 282

9.2.2最近鄰 283

9.2.3分類器設定 285

9.2.4分類器學習 287

9.2.5支持向量機 288

9.2.6聚類分析 291

9.3神經元網路 293

9.3.1前饋網路 294

9.3.2非監督學習 295

9.3.3Hopfield神經元網路 296

9.4句法模式識別 297

9.4.1語法與語言 298

9.4.2句法分析與句法分類器 300

9.4.3句法分類器學習與語法推導 301

9.5作為圖匹配的識別 302

9.5.1圖和子圖的同構 303

9.5.2圖的相似度 305

9.6識別中的最佳化技術 306

9.6.1遺傳算法 307

9.6.2模擬退火 308

9.7模糊系統 309

9.7.1模糊集和模糊隸屬函式 310

9.7.2模糊集運算 311

9.7.3模糊推理 312

9.7.4模糊系統設計與訓練 314

9.8模式識別中的Boosting方法 315

9.9隨機森林 317

9.9.1隨機森林訓練 318

9.9.2隨機森林決策 321

9.9.3隨機森林擴展 322

9.10總結 322

9.11習題 325

9.12參考文獻 330

第10章圖像理解 335

10.1圖像理解控制策略 336

10.1.1並行和串列處理控制 336

10.1.2分層控制 337

10.1.3自底向上的控制 337

10.1.4基於模型的控制 337

10.1.5混合的控制策略 338

10.1.6非分層控制 341

10.2SIFT:尺度不變特徵轉換 342

10.3RANSAC:通過隨機抽樣一致來

???擬合 344

10.4點分布模型 347

10.5活動表觀模型 355

10.6圖像理解中的模式識別方法 362

10.6.1基於分類的分割 362

10.6.2上下文圖像分類 364

10.6.3梯度方向直方圖-HOG 367

10.7Boosted層疊分類器用於快速物體

???檢測 370

10.8基於隨機森林的圖像理解 372

10.9場景標註和約束傳播 377

10.9.1離散鬆弛法 378

10.9.2機率鬆弛法 379

10.9.3搜尋解釋樹 381

10.10語義圖像分割和理解 382

10.10.1語義區域增長 383

10.10.2遺傳圖像解釋 384

10.11隱馬爾可夫模型 390

10.11.1套用 394

10.11.2耦合的HMM 394

10.11.3貝葉斯信念網路 395

10.12馬爾科夫隨機場 397

?10.12.1圖像和視覺的套用 398

10.13高斯混合模型和期望最大化 399

10.14總結 404

10.15習題 407

10.16參考文獻 410

第11章3D幾何,對應,從亮度到3D 419

11.13D視覺任務 419

11.1.1Marr理論 421

11.1.2其他視覺範疇:主動和

有目的的視覺 422

11.2射影幾何學基礎 423

11.2.1射影空間中的點和超平面 424

11.2.2單應性 426

11.2.3根據對應點估計單應性 427

11.3單透視攝像機 430

11.3.1攝像機模型 430

11.3.2齊次坐標系中的投影和

反投影 432

11.3.3從已知場景標定一個

攝像機 432

11.4從多視圖重建場景 433

11.4.1三角測量 433

11.4.2射影重建 434

11.4.3匹配約束 435

11.4.4光束平差法 436

11.4.5升級射影重建和自標定 437

11.5雙攝像機和立體感知 438

11.5.1極線幾何學——基本矩陣 438

11.5.2攝像機的相對運動——本質

矩陣 440

11.5.3分解基本矩陣到攝像機

矩陣 441

11.5.4從對應點估計基本矩陣 441

11.5.5雙攝像機矯正結構 442

11.5.6矯正計算 444

11.6三攝像機和三視張量 445

11.6.1立體對應點算法 446

11.6.2距離圖像的主動獲取 451

11.7由輻射測量到3D信息 453

11.7.1由陰影到形狀 453

11.7.2光度測量立體視覺 455

11.8總結 456

11.9習題 457

11.10參考文獻 459

第12章3D視覺的套用 464

12.1由X到形狀 464

12.1.1由運動到形狀 464

12.1.2由紋理到形狀 468

12.1.3其他由X到形狀的技術 469

12.2完全的3D物體 471

12.2.13D物體、模型以及相關

問題 471

12.2.2線條標註 472

12.2.3體積表示和直接測量 474

12.2.4體積建模策略 475

12.2.5表面建模策略 476

12.2.6為獲取完整3D模型的面元

標註與融合 478

12.33D場景的2D視圖表達 482

12.3.1觀察空間 482

12.3.2多視圖表達和示象圖 482

12.4從無組織的2D視圖集合進行

3D重建,從運動到結構 483

12.5重建場景幾何 485

12.6總結 487

12.7習題 487

12.8參考文獻 488

第13章數學形態學 493

13.1形態學基本概念 493

13.2形態學四原則 494

13.3二值膨脹和腐蝕 495

13.3.1膨脹 495

13.3.2腐蝕 497

13.3.3擊中擊不中變換 498

13.3.4開運算和閉運算 499

13.4灰度級膨脹和腐蝕 499

13.4.1頂面、本影、灰度級膨脹和

腐蝕 500

13.4.2本影同胚定理和膨脹、腐蝕

及開、閉運算的性質 502

13.4.3頂帽變換 502

13.5骨架和物體標記 503

13.5.1同倫變換 503

13.5.2骨架、中軸和最大球 503

13.5.3細化、粗化和同倫骨架 505

13.5.4熄滅函式和最終腐蝕 506

13.5.5最終腐蝕和距離函式 508

13.5.6測地變換 509

13.5.7形態學重構 510

13.6粒度測定法 511

13.7形態學分割與分水嶺 513

13.7.1粒子分割、標記和分水嶺 513

13.7.2二值形態學分割 513

13.7.3灰度級分割和分水嶺 515

13.8總結 516

13.9習題 517

13.10參考文獻 518

第14章圖像數據壓縮 520

14.1圖像數據性質 521

14.2圖像數據壓縮中的離散圖像變換 521

14.3預測壓縮方法 523

14.4矢量量化 525

14.5分層的和漸進的壓縮方法 525

14.6壓縮方法比較 526

14.7其他技術 527

14.8編碼 527

14.9JPEG和MPEG圖像壓縮 528

14.9.1JPEG——靜態圖像壓縮 528

14.9.2JPEG-2000壓縮 529

14.9.3MPEG——全運動的視頻

壓縮 531

14.10總結 532

14.11習題 533

14.12參考文獻 535

第15章紋理 537

15.1統計紋理描述 539

15.1.1基於空間頻率的方法 539

15.1.2共生矩陣 540

15.1.3邊緣頻率 541

15.1.4基元長度(行程) 542

15.1.5Laws紋理能量度量 543

15.1.6局部二值模式(LBPs) 544

15.1.7分形紋理描述 547

15.1.8多尺度紋理描述——小波

域方法 549

15.1.9其他紋理描述的統計方法 551

15.2句法紋理描述方法 552

15.2.1形狀鏈語法 553

15.2.2圖語法 554

15.2.3分層紋理中的基元分組 555

15.3混合的紋理描述方法 556

15.4紋理識別方法的套用 557

15.5總結 557

15.6習題 559

15.7參考文獻 561

第16章運動分析 566

16.1差分運動分析方法 568

16.2光流 571

16.2.1光流計算 571

16.2.2全局和局部光流估計 573

16.2.3局部和全局相結合的光流

估計 575

16.2.4運動分析中的光流 575

16.3基於興趣點對應關係的分析 578

16.3.1興趣點的檢測 578

16.3.2Lucas-Kanade點跟蹤 578

16.3.3興趣點的對應關係 580

16.4特定運動模式的檢測 582

16.5視頻跟蹤 585

16.5.1背景建模 585

16.5.2基於核函式的跟蹤 588

16.5.3目標路徑分析 592

16.6輔助跟蹤的運動模型 596

16.6.1卡爾曼濾波器 596

16.6.2粒子濾波器 600

16.6.3半監督跟蹤——TLD 603

16.7總結 605

16.8習題 607

16.9參考文獻 608

辭彙 613

相關詞條

熱門詞條

聯絡我們