当前位置:首页 > 报告详情

3-4-李瑞远-浮点时序数据压缩.pdf

上传人: 茫然 编号:731462 2025-07-14 36页 3.50MB

1、浮点时序数据压缩主讲人:李瑞远 副教授重庆大学时空实验室2025年7月Floating-Point Compression is Crucial Explosion of Floating-Point Time Series Data in a Streaming Fashion10k+records/s500GBdata/flight1Ttrajectories/day Efficient,Compact,Error-Bounded/Lossless Floating-Point Compression is VitalReduce bandwidth/storage cost,improv

2、e transmission/query efficiencyAvoid much information loss(e.g.,small errors lead to big problems)Network TransmissionData ManagementScientific CalculationComplex Floating-Point Layout Normal Numbers:i,j 1,11,ei=0 and ej=1IEEE 754 Double-Precision Floating-Point Layout Zero:i 1,11,ei=0 and j 1,52,mj

3、=0Normal NumbersSubnormal Numbers Infinity:i 1,11,ei=1 and j 1,52,mj=0 NaN:i 1,11,ei=1 and j 1,52,mj=1 Subnormal Number:i 1,11,ei=0 and j 1,52,mj=1Can be easily extended to these three TypesFocus on these two typesClassification of Floating-Point Compression朱明辉,李政,李瑞远*,陈超,郑宇.浮点时序数据压缩综述.软件学报,2025Floa

4、ting-Point CompressionLosslessError-BoundedTypeStreamingBatchedModeNetwork Transmission Data ManagementApplicationFramework of Our WorksFloating-Point CompressionLosslessError-BoundedStreamingBatchedTypeModeOur WorkElf(VLDB 2023)Ruiyuan Li,Zheng Li,Yi Wu,Chao Chen,Yu Zheng.Elf:Erasing-based Lossless

5、 Floating-Point CompressionC/in The 49th International Conference on Very Large Data Bases,PVLDB,16(7):1763-1776,2023.(VLDB 2023,CCF A)Shortcomings of Existing Solutions Existing SolutionsGeneral-purpose methods,e.g.,Gzip,Zstd,Xz,SnappyLossy floating-point methods,e.g.,ZFP,MDZLossless floating-point

6、 methods,e.g.,Gorilla,ChimpBatched,Low EfficiencyLoss Some InformationUnsatisfactory Effects Lossless XORing-Based Time Series Compression MethodCompression:vt vt-1=xort,then encode xort(e.g.,#lead+#trail+Center Bits)Decompression:decode xort,then xort vt-1=vtvtand vt-1vary little,so#lead is large.B

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要内容是关于浮点时序数据的压缩方法研究。以下是关键点: 1. 浮点时序数据压缩的重要性:随着数据量的激增,高效、紧凑且误差可控的浮点压缩至关重要,以降低带宽和存储成本,提高数据传输和处理效率。 2. 现有方法的不足:通用压缩方法如Gzip、Zstd等在压缩比和效率上不够理想;传统的时序压缩方法在处理浮点数据时存在信息丢失的问题。 3. Elf方法:提出了一种基于消除位的无损浮点压缩方法(Elf),通过设置 mantissa 位的末尾为零来提高压缩比,同时保持数据的可恢复性。 4. Elf+优化:对Elf方法进行改进,通过优化编码策略和计算mantissa的算法,进一步提高压缩比和效率。 5. Serf方法:针对流式传输环境下的误差受限浮点压缩问题,提出了Serf方法,通过量化和小数位交换技术,实现了在保证误差范围内的压缩。 6. 性能数据:Elf+相比于Chimp128,压缩比提高了12.4%,处理时间相似;Elf*相比于Xz,在压缩比上具有竞争力,处理时间仅需6.8%。 7. 实验室成果:重庆大学时空实验室在浮点时序数据压缩领域取得了一系列研究成果,包括Elf、Elf+和Serf等方法。 综上所述,文章聚焦于浮点时序数据的压缩问题,提出并优化了多种压缩方法,旨在提高数据处理的效率和经济性。
"浮点数据压缩,你了解多少?" "如何高效压缩时序数据?秘诀在这里!" "边缘计算资源有限,浮点压缩如何应对?"
客服
商务合作
小程序
服务号
折叠