立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 1518|回复: 5

[分享] 本人研一,研究方向是时间序列预测,科研小白找不到什么创新点,有没有大佬能指点一下?

[复制链接]
发表于 2024-12-25 17:49 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-12-25 17:49 | 显示全部楼层
时间序列可以做的内容还是比较多的,无论是时间序列异常检测、时间序列预测、时间序列分类,都有发挥的空间。
数学人生:《时间序列与机器学习》的再次启航
亲爱的读者朋友们,
当我们沉浸在数字世界的海洋里,数据如同一粒粒沙砾,记录着时间的印迹和人类活动的痕迹。《时间序列与机器学习》这本书,就是我们的一次尝试,用以抓住那些通过时间滑行的细微颗粒,解读其背后隐藏的语言和故事。
2024年5月份,这本书与世界初次见面,它带着一腔热血和无数夜晚灯火下的思考,出发寻找理解它的读者。如今,时间的车轮又滚滚向前,我们再次迎来了这本书的加印,目睹了它受到的欢迎和认可。我们深感荣幸,并由衷感谢每一位给予这本书机会的朋友。
在这本书中,我们不仅探讨了时间序列分析的理论基础,还展示了如何将这些理论应用于实际问题,如智能设备的异常检测、股市波动的分析,乃至于金融领域更深层次的应用。通过每一个章节,每一个案例,我们希望能够帮助你开启一扇窗,透过这扇窗,以全新的视角观察并理解世界的运行机制。
书页如同编织时间的织机,我们在这里,用文字作为线,逻辑作为纬,编织了一幅幅复杂数据的图景。《时间序列与机器学习》不仅仅是技术的展示,更是对话和思考的邀请。每当夜深人静,我们常思考,数据和模型背后,是不是也藏着时间的秘密和智慧的火花?


本书共包括8个章节,涵盖了时间序列分析的各个方面:
第 1 章“时间序列概述”:介绍时间序列分析的基础知识、发展历程、应用现状、分类及其与其他领域(如自然语言处理、计算机视觉等)的关联。
第 2 章“时间序列的信息提取”:介绍特征工程的核心概念及其在时间序列分析中的应用,比如对原始数据进行归一化、缺失值填充等转换;以及如何通过特征工程从时间序列数据中提取有用的特征,例如时间序列的统计特征、熵特征和降维特征等,以及如何判断时间序列的单调性。
第 3 章“时间序列预测”:介绍常用的时间序列预测方法,包括自回归模型、移动平均模型、自回归差分移动平均模型、指数平滑方法、Prophet,以及神经网络,例如循环神经网络、长短期记忆网络、Transformer、Informer 等。
第 4 章“时间序列异常检测”:介绍时间序列异常检测算法的技术与框架,如何识别异常的时间点,包括基于概率密度的方法(如3-Sigma、核密度估计)、基于重构的方法(如变分自编码器、Donut)、基于距离的方法(如孤立森林、RRCF)、基于有监督的方法和基于弱监督的方法等。
第 5 章“时间序列的相似度与聚类”:介绍时间序列的相似性度量方法,如欧氏距离、动态时间规整算法等,用于衡量两个或多个时间序列在形状和模式上的相似程度;聚类算法,如K-Means、DBSCAN等,可以将相似的时间序列分组,以便进一步理解时间序列数据中的结构和模式。
第 6 章“多维时间序列”:介绍多维时间序列在广告分析和业务运维领域的应用,包括如何利用OLAP 技术对多维时间序列进行有效处理,以及如何通过根因分析技术获得导致故障的维度和元素,包括基于时间序列异常检测算法的根因分析、基于熵的根因分析、基于树模型的根因分析、规则学习等。
第 7 章“智能运维的应用场景”:介绍智能运维领域的应用,包括指标监控、容量预估、弹性伸缩、告警关联、告警收敛和告警系统评估等,以及监控中出现的节假日效应、持续异常等实际情况。
第 8 章“金融领域的应用场景”:介绍量化交易的概念、发展历程,如何通过因子挖掘从时间序列数据中提取特征并将其转化为交易策略,以及机器学习在其他金融领域(包括资产定价、资产配置、波动率预测)的应用。
如果你错过了前两次印刷的机会,不要担心,第三次的印刷已经在路上。我们诚挚邀请你,加入这场关于时间与智慧的探索旅程。让我们一起在数据的海洋中找寻那些被时间打磨的宝石,解锁它们的秘密,用智慧创造未来。
期待在这个旅程中与你相遇。
——《时间序列与机器学习》作者们,致以时间的敬意与思考的温度。
回复 支持 反对

使用道具 举报

发表于 2024-12-25 17:50 | 显示全部楼层
看论文少的话,其实是很难找到一些创新点的。
先把论文看起来,尤其是最近的时间序列的顶会文章,选择自己方向你觉得最好的文章,最solid的文章,带代码的。一步一步复现,调到特别熟悉,然后疯狂看这个方向的其他论文,一点一点就找到创新点了。

不知道时间序列的文章去哪里找,可以看看这个库,里面整理了很多时间序列的顶会文章。
awesome-time-series-papers
回复 支持 反对

使用道具 举报

发表于 2024-12-25 17:51 | 显示全部楼层
现在的时间序列预测,比较容易创新的就是现代信号处理+机器学习/深度学习,至于有没有实用效果,那就不说了,仁者见仁,智者见智了。
现代信号处理涉及到降噪,平滑等等,容易创新的点比较多
看一下相关的时序特征

  • 基于统计域的时序特征包含:最大值(Maximum)、最小值(Minimum)、均值(Mean)、中位数(Median)、偏度(Skewness)、峰度(Kurtosis)、直方图(Histogram)、四分位距(Interquartile Range)、绝对误差均值(Mean Absolute Deviation)、绝对误差中位数(Median Absolute Deviation)、均方根(Root Mean Square)、标准差(Standard Deviation)、方差(Variance)、经验分布函数百分位数(Empirical Distribution Function Percentile Count)、经验分布函数斜率(ECDF Slope)等;
  • 基于谱域的时序特征包含:快速傅里叶变换(Fast Fourier Transform)、傅里叶变换平均系数(FFT Mean Coefficient)、小波变换(Wavelet Transform)、小波绝对均值(Wavelet Absolute Mean)、小波标准差(Wavelet Standard Deviation)、小波方差(Wavelet Variance)、谱距离(Spectral Distance)、频谱基频(Spectral Fundamental Frequency)、频谱最大频率(Spectral Maximum Frequency)、频谱中频(Spectral Median Frequency)、频谱最大峰值(Spectral Maximum Peaks)等;
  • 基于时域的时序特征包含:自相关(Autocorrelation)、质心(Centroid)、差分均值(Mean Differences)、差分绝对值均值(Mean Absolute Differences)、差分中位数(Median Differences)、差分绝对值中位数(Median Absolute Differences)、差分绝对值之和(Sum of Absolute Differences)、熵(Entropy)、波峰与波谷距离(Peak to Peak Distance)、曲线覆盖面积(Area Under the Curve)、最大峰值个数(The Number of Maximum Peaks)、最小峰值个数(The Number of Minimum Peaks)、跨零率(Zero Crossing Rate)等。
  • 参考链接https://www.zhihu.com/question/24021704/answer/2245867156
关于时间序列的现代信号处理方法,给几个例子供参考创新
基于一维改进高斯-拉普拉斯滤波器的平滑和降噪




基于优化Morlet小波的一维信号瞬态特征提取




基于K-SVD的时间序列瞬态特征提取


脉冲小波及其稀疏表示




时间序列波形分解






机器学习/深度学习就不怎么说了,各种魔改transformer模型,太多了
回复 支持 反对

使用道具 举报

发表于 2024-12-25 17:51 | 显示全部楼层
一、通用异常检测:对不同类型的时序数据的鲁棒性。
二、周期识别:自动识别时序的周期。
三、间断时间序列预测
四、多时序联合异常检测
五、针对具体的业务场景,比如说对磁盘做异常检测,提出一些trick,识别出慢盘。
这些是我在工业场景落地是觉得还有很大的进步空间的一些小方向,仅供参考。
回复 支持 反对

使用道具 举报

发表于 2024-12-25 17:51 | 显示全部楼层
之前做过一段金融相关的时间序列预测,目前我看到的比较有新意的方向有:
更简单高效的时序预测:现在的时间序列预测动不动就是深度学习模型,但是最近的一篇文章发现这些深度学习模型的预测效果很多时候还没有最简单的统计学模型好,比如arima这些。那么能不能设计出简单高效的时间序列预测模型呢,还是基于神经网络的,但是通过简单的结构达到sota的效果。几个思路:采样的改进(长短区间采样,事件驱动的采样……)、模型结构的改进(尽可能的挖掘时序上的关联)
基于符号的时序预测:类似于遗传规划GA、以搜索符号表达式为目的,得到一段时间序列的符号表达式,这样的结果具有较好的可解释性
基于深度学习的时许预测:这方面还有一定的探索空间。举个例子,transformer架构最近在时序预测上也有很多应用,比如reformer、logformer、informer等,但是这些模型都主要关注注意力运算的二次复杂度上,而不是如何对注意力机制进行适应化的改进以达到更好的预测效果。怎么样叫做适应化改进呢,拿金融序列来说:金融序列的特点就是信噪比低,那么可不可以通过集成学习的思想增加模型的抗噪能力呢?
能做的其实有很多,给出问题情景后比较好寻找更多的创新点。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表