网络数据爆发式增长,现有的网络测量方法在内存资源和计算资源两方面受到了限制,从而导致测量结果不准确。对此,首先采用sketch结构将 海量数据一一压缩到狭小的内存空间中。但是sketch中存在大量哈希冲突,所以提出了heavy cukoo算法通过二次散列的方式来提高准确率。接 着,利用网络流量的偏态分布对数据流进行分类存储提高了内存利用率。最后,使用SIMD指令集来并行执行sketch中的哈希运算大大加快了数据 包的处理速度。
fhgreenery/PipeSketch
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|