时间序列预测全攻略,6大模型代码实操
bigegpt 2025-06-23 14:57 1 浏览
如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,
欢迎移步宝藏公众号「小火龙说数据」,无广告、无软文、纯干货,更多精彩原创文章与你分享!
00 前言
对于数据分析师而言,日常工作中预测相关内容不在少数,这里分享给大家几种常见预测方式及其实操代码。
01 ARIMA(自回归差分移动平均)
适用场景:平稳时间序列预测,适合具有明显趋势和季节性的数据。
import pandas as pd
from statsmodels.tsa.arima.model import ARIMA
# 生成示例数据
data = pd.Series([i + i*0.1 + np.random.normal(0,1) for i in range(100)])
# 训练模型 (p,d,q)=(2,1,1)
model = ARIMA(data, order=(2,1,1))
results = model.fit()
# 预测未来5步
print(results.forecast(steps=5))
02 Prophet
适用场景:带节假日效应的周期数据,自动处理缺失值和异常点。
import Prophet
import pandas as pd
df = pd.DataFrame({
'ds': pd.date_range(start='2025-01-01', periods=365),
'y': [50 + 2*i + 10*abs(np.sin(i/30)) for i in range(365)]
})
model = Prophet(yearly_seasonality=True)
model.fit(df)
future = model.make_future_dataframe(periods=30)
forecast = model.predict(future)
print(forecast[['ds', 'yhat']].tail())
详细介绍及代码可参考以下链接:
「经验」时间序列预测神器-Prophet『理论篇』
「经验」时间序列预测神器-Prophet『实现篇』
03 指数平滑
适用场景:短期趋势预测,包含水平、趋势、季节三个分量,适合规律性强的数据。
from statsmodels.tsa.holtwinters import ExponentialSmoothing
data = [i*0.5 + np.random.rand() for i in range(100)]
model = ExponentialSmoothing(
data,
trend='add',
seasonal='add',
seasonal_periods=12
).fit()
print(model.forecast(5)) # 预测未来5期
04 LSTM神经网络
适用场景:复杂非线性序列,需将数据标准化。
from numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
# 创建滑动窗口数据
def create_dataset(data, look_back=3):
X, y = [], []
for i in range(len(data)-look_back):
X.append(data[i:(i+look_back)])
y.append(data[i+look_back])
return np.array(X), np.array(y)
data = np.sin(np.arange(0, 20, 0.1))
X, y = create_dataset(data)
model = Sequential([
LSTM(50, input_shape=(3, 1)),
Dense(1)
])
model.compile(loss='mse', optimizer='adam')
model.fit(X.reshape(-1,3,1), y, epochs=100)
# 预测下一个值
print(model.predict(np.array([data[-3:]]).reshape(1,3,1)))
05 TCN(时序卷积网络)
适用场景:长序列依赖捕获,通过空洞卷积扩大感受野,比LSTM训练更快。
from tensorflow.keras import Sequential
from tensorflow.keras.layers import TCN, Dense
model = Sequential([
TCN(input_shape=(None, 1),
nb_filters=64,
kernel_size=3,
dilations=[1, 2, 4]),
Dense(1)
])
model.compile(optimizer='adam', loss='mse')
# 训练数据需形如(samples, timesteps, features)
X = np.random.randn(100, 30, 1)
y = np.random.randn(100, 1)
model.fit(X, y, epochs=10)
06 Transformer时序预测
适用场景:超长序列建模,需配合位置编码使用,适合GPU集群训练。
from tensorflow.keras.layers import Input, MultiHeadAttention
from tensorflow.keras.models import Model
inputs = Input(shape=(None, 64))
x = MultiHeadAttention(num_heads=4, key_dim=64)(inputs, inputs)
x = GlobalAveragePooling1D()(x)
outputs = Dense(1)(x)
model = Model(inputs, outputs)
model.compile(loss='mse', optimizer='adam')
# 输入数据需先经过Embedding或CNN预处理
07 总结
总结一下在日常实操中的模型选择。
其一:数据量相对较小(<5k),优先使用Prophet或者指数平滑,Prophet小火龙最为推荐。
其二:有明显时间周期,ARIMA是个不错的原则。
其三:长序列预测中,TCN是首选。
其四:多变量输入时,LSTM/Transformer可以选择。
最后,推荐一本数据分析进阶书籍《数据分析实践:专业知识和职场技巧》
侧重案例讲解,对于初、中级数据分析师的帮助极大!!!
相关推荐
- AI「自我复制」能力曝光,RepliBench警示:大模型正在学会伪造身份
-
科幻中AI自我复制失控场景,正成为现实世界严肃的研究课题。英国AISI推出RepliBench基准,分解并评估AI自主复制所需的四大核心能力。测试显示,当前AI尚不具备完全自主复制能力,但在获取资源...
- 【Python第三方库安装】介绍8种情况,这里最全看这里就够了!
-
**本图文作品主要解决CMD或pycharm终端下载安装第三方库可能出错的问题**本作品介绍了8种安装方法,这里最全的python第三方库安装教程,简单易上手,满满干货!希望大家能愉快地写代码,而不要...
- pyvips,一个神奇的 Python 库!(pythonvip视频)
-
大家好,今天为大家分享一个神奇的Python库-pyvips。在图像处理领域,高效和快速的图像处理工具对于开发者来说至关重要。pyvips是一个强大的Python库,基于libvips...
- mac 安装tesseract、pytesseract以及简单使用
-
一.tesseract-OCR的介绍1.tesseract-OCR是一个开源的OCR引擎,能识别100多种语言,专门用于对图片文字进行识别,并获取文本。但是它的缺点是对手写的识别能力比较差。2.用te...
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
-
号称“OpenAI迄今为止最强模型”,o3/o4-mini真实能力究竟如何?就在发布后的几小时内,网友们的第一波实测已新鲜出炉。最强推理模型o3,即使遇上首位全职提示词工程师RileyGoodsid...
- 使用Python将图片转换为字符画并保存到文件
-
字符画(ASCIIArt)是将图片转换为由字符组成的艺术作品。利用Python,我们可以轻松实现图片转字符画的功能。本教程将带你一步步实现这个功能,并详细解释每一步的代码和实现原理。环境准备首先,你...
- 5分钟-python包管理器pip安装(python pip安装包)
-
pip是一个现代的,通用、普遍的Python包管理工具。提供了对Python包的查找、下载、安装、卸载的功能,是Python开发的基础。第一步:PC端打开网址:选择gz后缀的文件下载第二步:...
- 网络问题快速排查,你也能当好自己家的网络攻城狮
-
前面写了一篇关于网络基础和常见故障排查的,只列举了工具。没具体排查方式。这篇重点把几个常用工具的组合讲解一下。先有请今天的主角:nslookup及dig,traceroute,httping,teln...
- 终于把TCP/IP 协议讲的明明白白了,再也不怕被问三次握手了
-
文:涤生_Woo下周就开始和大家成体系的讲hadoop了,里面的每一个模块的技术细节我都会涉及到,希望大家会喜欢。当然了你也可以评论或者留言自己喜欢的技术,还是那句话,希望咱们一起进步。今天周五,讲讲...
- 记一次工控触摸屏故障的处理(工控触摸屏维修)
-
先说明一下,虽然我是自动化专业毕业,但已经很多年不从事现场一线的工控工作了。但自己在单位做的工作也牵涉到信息化与自动化的整合,所以平时也略有关注。上一周一个朋友接到一个活,一家光伏企业用于启动机组的触...
- 19、90秒快速“读懂”路由、交换命令行基础
-
命令行视图VRP分层的命令结构定义了很多命令行视图,每条命令只能在特定的视图中执行。本例介绍了常见的命令行视图。每个命令都注册在一个或多个命令视图下,用户只有先进入这个命令所在的视图,才能运行相应的命...
- 摄像头没图像的几个检查方法(摄像头没图像怎么修复)
-
背景描述:安防监控项目上,用户的摄像头运行了一段时间有部分摄像头不能进行预览,需要针对不能预览的摄像头进行排查,下面列出几个常见的排查方法。问题解决:一般情况为网络、供电、设备配置等情况。一,网络检查...
- 小谈:必需脂肪酸(必需脂肪酸主要包括)
-
必需脂肪酸是指机体生命活动必不可少,但机体自身又不能合成,必需由食物供给的多不饱和脂肪酸(PUFA)。必需脂肪酸主要包括两种,一种是ω-3系列的α-亚麻酸(18:3),一种是ω-6系列的亚油酸(18:...
- 期刊推荐:15本sci四区易发表的机械类期刊
-
虽然,Sci四区期刊相比收录在sci一区、二区、三区的期刊来说要求不是那么高,投稿起来也相对容易一些。但,sci四区所收录的期刊中每本期刊的投稿难易程度也是不一样的。为方便大家投稿,本文给大家推荐...
- be sick of 用法考察(be in lack of的用法)
-
besick表示病了,做谓语.本身是形容词,有多种意思.最通常的是:生病,恶心,呕吐,不适,晕,厌烦,无法忍受asickchild生病的孩子Hermother'sverysi...
- 一周热门
- 最近发表
-
- AI「自我复制」能力曝光,RepliBench警示:大模型正在学会伪造身份
- 【Python第三方库安装】介绍8种情况,这里最全看这里就够了!
- pyvips,一个神奇的 Python 库!(pythonvip视频)
- mac 安装tesseract、pytesseract以及简单使用
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
- 使用Python将图片转换为字符画并保存到文件
- 5分钟-python包管理器pip安装(python pip安装包)
- 网络问题快速排查,你也能当好自己家的网络攻城狮
- 终于把TCP/IP 协议讲的明明白白了,再也不怕被问三次握手了
- 记一次工控触摸屏故障的处理(工控触摸屏维修)
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)