社区活动专版
直播中

Cool

12年用户 1028经验值
擅长:嵌入式技术 处理器/DSP 控制/MCU RF/无线
私信 关注

【「时间序列与机器学习」阅读体验】全书概览与时间序列概述

本帖最后由 1653149838.791300 于 2024-8-12 20:18 编辑




收到《时间序列与机器学习》这本书,很是欣喜,书籍内容很详实也是自己很感兴趣的,书籍封面如下。下面对全书概览并对第一章时间序列概述进行细度。

1_封面.jpg

一. 全书概览
      全书分为8章,每章的简介如下:
●第1章“时间序列概述”:介绍时间序列分析的基础知识、发展历程、应用现状、分类及其与其他领域(如自然语言处理、计算机视觉等)的关联。
●第2章“时间序列的信息提取”:介绍特征工程的核心概念及其在时间序列分析中的广用,比如对原始数据进行归一化、缺失值填充等转换;以及如何通过特征工程从时间序列数据中提取有用的特征,例如时间序列的统计特征、特征和降维特征等,以及如何判断时间序列的单调性。
●第3章“时间序列预测”:介绍常用的时间序列预测方法,包括自回归模型、移动平均模型、自回归差分移动平均模型、指数平滑方法、Prophet,以及神经网络,例如循环神经网络长短期记忆网络、Transformer、Informer 等。
●第4章“时间序列异常检测”:介绍时间序列异常检测算法的技术与框架,如何识别异常的时间点,包括基于概率密度的方法(如 3-Sigma、核密度估计)、基于重构的方法(如变分自编码器、Donut)、基于距离的方法(如孤立森林、RRCF)、基于有监督的方法和基于弱监督的方法等。
●第5章“时间序列的相似度与聚类”:介绍时间序列的相似性度量方法,如欧氏距离、动态时间规整算法等,用于衡量两个或多个时间序列在形状和模式上的相似程度;聚类算法,如K-Means、DBSCAN等,可以将相似的时间序列分组,以便进一步理解时间序列数据中的结构和模式。
●第6章“多维时间序列”:介绍多维时间序列在广告分析和业务运维领域的应用,包括如何利用OLAP技术对多维时间序列进行有效处理,以及如何通过根因分析技术获得导致故障的维度和元素,包括基于时间序列异常检测算法的根因分析、基于熵的根因分析、基于树模型的根因分析、规则学习等。
●第7章“智能运维的应用场景”:介绍智能运维领域的应用,包括指标监控、容量预估弹性伸缩、告警关联、告警收敛和告警系统评估等,以及监控中出现的节假日效应、持续异常等实际情况。
●第8章“金融领域的应用场景”:介绍量化交易的概念、发展历程,如何通过因子挖掘从时间序列数据中提取特征并将其转化为交易策略,以及机器学习在其他金融领域(包括资产定价、资产配置、波动率预测)的应用。

      全书彩版印刷,内容结构严整,条理清晰,循序渐进,由浅入深,是很好的时间序列学习、参考书籍。
二.时间序列概述
      时间序列分析方法大致可以分为两类:频域分析方法和时域分析方法。
频域分析方法关注时间序列数据频率特征的提取和分析。频域分析旨在将时间序列数据从时间维度转变为频率维度,描述数据在各个频率上的成分。像我们熟知的傅里叶变换、拉普拉斯变换等属于此类。
时域分析方法主要关注时间序列数据在时间维度上的表现。它基于一个假设,即时间的演进具有一定的惯性。这种方法通过引入统计模型来描述和捕捉时间序列中的自相关性。
      时间序列有基于线性场景,也有一些非线性性质周期性和不对称性、波动的聚集性、波动中出现的跳跃现象,以及时间的不可逆性。机器学习已经是目前非线性时序分析的主攻方向之一。
      时间序列的应用也很广泛,用机器学习为时间分析带来新的可能性。人们往往可以通过过往的时间序列数据来预测未来,在各行各业中都有很好的应用与发展前景。

      时间序列分类:
1.单维时间序列
单维时间序列指的是一组有顺序的数组,并且每个取值都有一个相应的时间戳。
      在时间序列的研究领域,常见的研究方向包括但不限于以下几个。
时间序列异常检测:这是为了发现在某个时间戳下,时间序列是否出现了不同于平常的状况,也就是出现了异常。

●时间序列单调性:这是为了判断时间序列是处于单调上升的状态、单调下降的状态,还是处于平稳波动的状态。
●时间序列趋势预测:这是为了判断未来时间序列走势的范围和趋势
●时间序列聚类:这是为了把一批相似的时间序列聚集到一起。
●时间序列相似性:这是为了判断哪些时间序列与某条时间序列比较相似。时间序列周期性:这是为了判断时间序列是否具有周期性,以及时间序列的具体周期
      时间序列(time Series)与自然语言处理(Natural Language Processing,NLP)别属于不同的研究领域,但是二者有着一定的相似之处,见下表。时间序列分析与自然语言处理、计算机视觉在许多方面都有联系。它们都试图从数据中获取信息、发现模式,并某种程度上预测未来的数据。

2_时间序列(Time Series)与自然语言处理比较.jpg

2.多维时间序列
      多维时间序列是指在同一时间点上收集的多个相关变量的观测值。
      多维时间序列分析的难点在于理解和建模不同变量之间的复杂关系。同时,多维时间序列分析与日志分析也有紧密的联系。日志分析(LogAnalysis),是对计算机生成的日志(或日志文件)进行系统的检查和解读的过程。日志文件记录了特定系统网络或者 App 中的各种活动和事件,通常包括时间戳、事件类型、来源、目标等信息。日志文件可以帮助我们理解系统的运行情况,如检测系统性能问题、网络安全事故、系统故障等。
      日志分析与多维时间序列的关系主要体现在以下几个方面。
●时间戳:日志文件中的每个条目都有一个时间戳,记录了事件发生的时间。这使得日志数据自然地形成一个或多个时间序列,我们可以对其进行分析以查找模式和趋势。
●多种数据:日志文件中通常会记录多种类型的事件和数据,这些数据形成了多元时间序列,可以用于系统性能监控故障预测等。
●故障预测:多维时间序列分析方法可以应用于日志数据,以预测系统的未来行为数据形成了多元时间序列,可以用来识别性能问题的模式、预测未来的性能趋势,或者设定阈值进行自动化的性能报警。
●异常检测:多维时间序列分析方法可以应用于日志数据,以检测异常事件。
      在使用多维时间序列分析进行日志分析时,也存在很多的挑战。例如数据清洗和预处理(包括解析日志文件、处理缺失值和异常值等),选取合适的模型来处理可能存在的非线性和复杂的依赖关系,以及解释和呈现结果。正确应用多维时间序列分析方法可以帮助我们从日志数据中提取有价值的信息。


      通过对全书概览与时间序列概述的阅读,对概述整体轮廓有初步了解把握,对时间序列概念及应用有了进一步深入理解,是一个良好的开端。







回帖(1)

Cool

2024-8-10 16:29:58
排版总是排不好,官方可以弄一个预览功能么。。。。。。
举报

更多回帖

×
20
完善资料,
赚取积分