概率數據結構與算法:面向大數據應用 Probabilistic Data Structures and Algorithms for Big Data Applications
Andrii Gakhov
- 出版商: 機械工業
- 出版日期: 2022-08-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- 頁數: 183
- 裝訂: 平裝
- ISBN: 7111710541
- ISBN-13: 9787111710547
-
相關分類:
大數據 Big-data
- 此書翻譯自: Probabilistic Data Structures and Algorithms for Big Data Applications
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$398多模態生物特徵識別-基於人臉與人耳信息
-
$580$458 -
$505情感分析 : 挖掘觀點、情感和情緒 (Sentiment Analysis: Mining Opinions, Sentiments, and Emotions)
-
$352基於深度學習的自然語言處理/智能科學與技術叢書
-
$301分佈式對象存儲 : 原理、架構及 Go語言實現
-
$594$564 -
$306現代 API : 通往架構師之門
-
$680$530 -
$708$673 -
$602$566 -
$650$553 -
$414$393 -
$534$507 -
$594$564 -
$348$331 -
$834$792 -
$662敏捷測試 : 以持續測試促進持續交付
-
$880$695 -
$654$621 -
$774$735 -
$714$678 -
$301邊緣計算技術與應用
-
$880$695 -
$403雷達極化技術
-
$654$621
相關主題
商品描述
本書共6章。
每章都專門針對大數據應用中的一個特定問題,
首先對該問題進行深入的解釋,然後介紹可用於有效解決該問題的數據結構和算法。
第1章簡要概述了概率數據結構中廣泛使用的散列函數和散列表。
第2章專門介紹近似成員查詢,這是概率數據結構最著名的用例之一。
第3章討論了用來輔助估算元素基數的概率數據結構。
第4章和第5章討論流式場景下與頻數和排序相關的重要指標的計算。
第6章包含用於解決相似性問題的數據結構和算法,尤其是近鄰搜索問題。
目錄大綱
譯者序
前言
第1章 散列1
1.1 加密散列函數2
1.2 非加密散列函數5
1.3 散列表7
1.4 總結13
本章參考文獻13
第2章 成員查詢15
2.1 布隆過濾器16
2.2 計數布隆過濾器24
2.3 商數過濾器27
2.4 布穀過濾器38
2.5 總結46
本章參考文獻46
第3章 基數49
3.1 線性計數51
3.2 概率計數55
3.3 LogLog和HyperLogLog63
3.4 總結74
本章參考文獻74
第4章 頻數77
4.1 多數投票算法80
4.2 頻繁算法82
4.3 Count Sketch86
4.4 CountMin Sketch96
4.5 總結105
本章參考文獻105
第5章 排序107
5.1 隨機採樣109
5.2 q-摘要116
5.3 t-摘要125
5.4 總結135
本章參考文獻136
第6章 相似性139
6.1 局部敏感散列149
6.2 MinHash153
6.3 SimHash165
6.4 總結174
本章參考文獻174