數據標註工程——概念、方法、工具與案例

聶明,齊紅威

  • 出版商: 電子工業
  • 出版日期: 2021-01-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 296
  • 裝訂: 平裝
  • ISBN: 7121286343
  • ISBN-13: 9787121286346
  • 相關分類: Text-mining
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

相關主題

商品描述

本書是人工智能技術應用核心課程系列教材之一,通過對人工智能數據標註的概念、方法、工具與案例的系統介紹,結合對圖像、視頻、語音、文本和3D點雲等類別數據的具體標註案例的分析與操作,使初學者可以快速掌握數據標註的基礎知識和常用方法,使從業者在提升數據標註技術水平的同時,掌握工程化數據標註的項目組織、管理和質量控制的技術與方法。
本書適合作為高校人工智能相關專業的教材,也可供人工智能、機器學習與深度學習愛好者閱讀,還可作為人工智能改造升級項目的規劃與實施者、人工智能數據服務從業者以及數據標註技術工程管理人員閱讀和參考。

作者簡介

聶明,男,1964年生人,中共黨員,博士,三級教授, 現任南京信息職業技術學院人工智能學院(籌)院長,是全國工信和信息化職業教育教學指導委員會計算機專指委委員、江蘇省"333工程”中青年學術帶頭人、江蘇省"六大人才高峰”高層次人才培養對象。
編著出版過《移動增值應用開發導論》、《Java Web應用開發項目教程》、《VC++程序設計技能教程與實訓》和《計算機應用技術導論》等多本專著和教材。

目錄大綱

第1章 人工智能概述 1
1.1 人工智能發展概況 1
1.1.1 人工智能的發展歷程 1
1.1.2 人工智能的影響力 3
1.1.3 人工智能的國際競爭 5
1.2 人工智能的典型技術 7
1.2.1 人工智能技術的分類 7
1.2.2 語音合成 10
1.2.3 語音識別 11
1.2.4 自然語言處理 12
1.2.5 圖像識別 13
1.2.6 3D點雲 13
1.2.7 多模態數據處理 14
1.3 人工智能是新一代信息技術的核心 15
1.3.1 5G與人工智能的關係 16
1.3.2 雲計算與人工智能的關係 16
1.3.3 大數據與人工智能的關係 17
1.3.4 物聯網與人工智能的關係 18
1.4 本章小結 18
1.5 作業與練習 19

第2章 數據標註的概念、工具與方法 20
2.1 數據標註的概念及其對人工智能發展的意義 20
2.1.1 全球數據的快速增長催生大數據產業 20
2.1.2 數據產業推動人工智能應用技術的發展 21
2.1.3 數據標註對於人工智能應用的意義 21
2.2 數據標註對象 22
2.2.1 數據集 22
2.2.2 語音數據集 24
2.2.3 圖像數據集 25
2.2.4 文本數據集 26
2.2.5 視頻數據集 27
2.3 數據標註工具與平台 28
2.3.1 語音數據標註工具 28
2.3.2 圖像數據標註工具 30
2.3.3 視頻數據標註工具 31
2.3.4 文本數據標註工具 33
2.3.5 3D點雲標註工具 34
2.4 典型數據標註技術 35
2.4.1 語音轉寫技術 35
2.4.2 人臉檢測和關鍵點檢測 36
2.4.3 圖像分割 36
2.4.4 視頻類標註 37
2.5 數據標註工程 37
2.5.1 數據採集 37
2.5.2 數據處理 40
2.5.3 數據標註 42
2.5.4 數據質檢 46
2.5.5 數據交付 46
2.5.6 數據驗收 47
2.6 本章小結 47
2.7 作業與練習 48

第3章 圖像數據標註 49
3.1 圖像數據標註簡介 49
3.1.1 圖像數據標註的目的與發展 49
3.1.2 圖像數據標註規範 50
3.1.3 場景分類型圖像數據標註 52
3.1.4 圖像數據標註形式分類 52
3.1.5 圖像任務和數據標註的關係 55
3.1.6 圖像數據標註的術語 56
3.2 關鍵點標註方法 56
3.2.1 關鍵點標註項目的應用及發展前景 56
3.2.2 關鍵點的標註內容 57
3.2.3 標註數據結果格式 58
3.2.4 關鍵點標註工具簡介 59
3.2.5 關鍵點標註案例分析 61
3.2.6 關鍵點標註難點及分析 63
3.3 標註框標註方法 63
3.3.1 框標註適合的場景 63
3.3.2 框標註工具簡介 65
3.3.3 標註方案及案例分析 67
3.3.4 標註框標註難點及分析 69
3.4 圖像區域標註方法 69
3.4.1 圖像區域標註適合的場景 69
3.4.2 圖像區域標註工具簡介 70
3.4.3 標註方案及案例分析 72
3.4.4 圖像區域標註難點及分析 74
3.5 本章小結 74
3.6 作業與練習 74

第4章 視頻數據標註 76
4.1 視頻數據標註簡介 76
4.1.1 視頻數據標註的意義 76
4.1.2 視頻數據標註任務 77
4.1.3 視頻源數據管理 77
4.2 視頻數據標註工具 78
4.2.1 視頻數據標註工具簡介 78
4.2.2 視頻數據標註流程 80
4.2.3 典型視頻數據標註方法 83
4.3 視頻數據標註案例解析 85
4.3.1 矩形框標註案例―人體追踪屬性標註 85
4.3.2 矩形框標註案例―車輛標註 86
4.3.3 矩形框標註案例―商場監控視頻數據標註 88
4.4.4 視頻幀標註案例―足球視頻數據標註 92
4.5 本章小結 94
4.6 作業與練習 95

第5章 語音數據標註 96
5.1 語音數據標註簡介 96
5.1.1 語音數據標註相關背景 96
5.1.2 語音信號基礎知識 97
5.2 語音數據標註概述 99
5.2.1 標註任務分類 99
5.2.2 常見語音數據異常 100
5.2.3 基本標註規範 102
5.3 典型開源語音數據標註工具 104
5.3.1 Praat語音學軟件 104
5.3.2 語音數據標註平台 105
5.4 語音數據標註整體流程 110
5.4.1 項目背景與意義 110
5.4.2 語音項目整體規程 110
5.4.3 語音數據標註過程詳情 111
5.5 多樣化語音數據標註項目 115
5.5.1 智能家居兒童語音數據標註 115
5.5.2 智能音箱語音數據標註 117
5.5.3 智能客服語音拼音標註 119
5.5.4 演講語音數據標註 120
5.6 本章小結 122
5.7 作業與練習 122

第6章 文本數據標註 123
6.1 文本數據標註簡介 123
6.1.1 文本數據標註的發展與研究現狀 123
6.1.2 基本概念 124
6.1.3 流程介紹 127
6.1.4 交付格式 127
6.1.5 應用場景 127
6.2 文本數據標註工具 129
6.2.1 開源文本數據標註工具 129
6.2.2 專業文本數據標註工具及其標註場景 132
6.2.3 優秀的標註工具應具備的條件 142
6.3 序列標註方法舉例 142
6.3.1 外賣成分識別標註案例 142
6.3.2 單品推廣文案標註案例 144
6.3.3 多音字關鍵詞提取標註案例 145
6.4 關係標註方法舉例―中文閱讀理解分析案例 147
6.5 屬性標註方法案例 148
6.5.1 語音文本判別標註案例 148
6.5.2 文本情感分析判別標註案例 150
6.6 本章小結 152
6.7 作業與練習 152

第7章 3D點雲標註 153
7.1 3D點雲標註簡介 153
7.1.1 點雲的獲取方法 154
7.1.2 3D點雲應用 156
7.1.3 3D點雲的存儲方式及數據類型 158
7.1.4 3D點雲典型數據集 159
7.2 3D點雲標註工具 160
7.2.1 3D點雲標註工具的主要功能 161
7.2.2 界面佈局和操作 161
7.2.3 標註輸出格式 164
7.3 3D點雲標註項目 164
7.3.1 項目背景 164
7.3.2 自動駕駛3D點雲標註規範 164
7.3.3 3D點雲標註流程 166
7.4 本章小結 169
7.5 作業與練習 169

第8章 工程化數據標註的組織管理 171
8.1 數據標註項目實施流程 171
8.1.1 數據標註項目 171
8.1.2 一般項目實施流程 173
8.1.3 數據標註項目實施流程 174
8.2 數據標註團隊組織架構 176
8.2.1 數據標註團隊組織類型 176
8.2.2 數據標註團隊組織架構 177
8.3 數據標註團隊角色分工 179
8.3.1 數據標註團隊角色分工之一 179
8.3.2 數據標註團隊角色分工之二 181
8.3.3 數據標註團隊角色分工總覽 182
8.4 數據標註團隊溝通和建設 184
8.4.1 項目相關方管理 184
8.4.2 數據標註團隊溝通 186
8.4.3 數據標註團隊建設 188
8.4.4 數據標註員培訓 189
8.5 國外數據產品生產組織方式案例 191
8.5.1 亞馬遜機械特克平台 191
8.5.2 澳鵬平台 192
8.6 本章小結 193
8.7 作業與練習 193

第9章 工程化數據標註的質量控制 194
9.1 質量控制 194
9.1.1 質量控制流程 194
9.1.2 控制流程細則 196
9.1.3 質量監控 198
9.1.4 質量檢驗方法 199
9.2 質量標準 200
9.2.1 語音數據標註 200
9.2.2 圖像數據標註 202
9.2.3 文本數據標註 203
9.3 質檢與驗收 204
9.3.1 質檢流程 204
9.3.2 驗收原則 205
9.3.3 驗收報告 205
9.4 質量總結 209
9.5 數據質檢與驗收案例 210
9.5.1 人臉68點標註質檢案例 210
9.5.2 客服語音數據標註質檢案例 214
9.5.3 3~5歲中國兒童朗讀文本數據標註質檢案例 215
9.6 本章小結 216
9.7 作業與練習 216

第10章 工程化數據標註的進度管理 217
10.1 項目進度管理的定義和實踐 217
10.1.1 物理架構 217
10.1.2 項目進度管理的實踐 218
10.2 項目活動分解排序和估算時間 221
10.2.1 定義活動 221
10.2.2 排列活動順序 222
10.2.3 估算活動持續時間 224
10.3 制訂項目進度計劃 225
10.3.1 制訂項目進度計劃的常用技術 225
10.3.2 數據標註項目進度計劃實例 228
10.4 監控進度計劃實施 230
10.4.1 監控進度計劃實施的流程 230
10.4.2 監控進度計劃實施的時機和方法 231
10.4.3 數據標註項目進度監控實例 233
10.5 本章小結 236
10.6 作業與練習 236

第11章 工程化數據標註的系統平台 238
11.1 數據標註系統概述 238
11.1.1 典型數據標註平台系統架構 239
11.1.2 典型標註工具 240
11.2 數據標註平台實例介紹 246
11.2.1 數加加Pro標註平台的適用範圍 246
11.2.2 數加加Pro標註平台的產品特性 246
11.2.3 數加加Pro標註平台的產品架構 247
11.2.4 數加加Pro標註平台的產品優勢 248
11.3 本章小結 250
11.4 作業與練習 250

第12章 數據標註的發展趨勢 251
12.1 人工智能總體發展趨勢 251
12.1.1 主要國家和地區高度重視AI發展 251
12.1.2 有監督學習仍是人工智能的主流 252
12.2 人工智能數據發展趨勢 254
12.2.1 人工智能數據需求 254
12.2.2 人工智能數據市場規模 258
12.2.3 人工智能數據需求特點 259
12.3 數據標註發展趨勢 259
12.3.1 定制化精細化發展 259
12.3.2 高度自動化發展 260
12.3.3 智能化流程化發展 262
12.3.4 重視安全與隱私保護 263
12.4 本章小結 264
12.5 作業與練習 264

附錄A 典型數據產品介紹 266
附錄B 開源數據集介紹與獲取 269
附錄C 人工智能的網絡學習資源 273
附錄D 人工智能的產業生態與技術圖譜 276
參考文獻 280