百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

【技术教程】一个python库让时间序列预测更简单

bigegpt 2025-01-02 14:41 8 浏览

多数人进行机器学习少不了利用scikit-learn,本文介绍一种开展时间序列预测更简单更好用的数据库——dart

darts库的GitHub链接:

https://github.com/unit8co/darts

darts库的文档:

https://unit8co.github.io/darts/quickstart/00-quickstart.html#Training-forecasting-models-and-making-predictions


1. darts库如何安装:

pip install darts


2. 导入darts库和数据集

像scikit-learn一样,dart也附带了一些标准数据集,不需要从外部网站下载任何文件。

#从darts库导入类timeseries

From darts import TimeSeries

#导入航空乘客数据集

From darts.datasets import AirPassengersDataset

TimeSeries是dart中的主要数据类。TimeSeries表示具有适当时间索引的单变量或多变量时间序列。


3. 加载时间序列数据并画图

#加载导入的数据

Series= AirPassengersDataset().load()

#画出这个数据集

Series.plot()

x轴代表年份,y轴代表乘客人数。


4. 其他操作

(1)数据切分

有两个命令进行数据切分:split_after(split_point)split_before(split_point),他们都可以将数据分成两部分,下图代码展示了将数据分成75%和25%两部分。


(2)数据切片

可以根据索引对时间序列数据进行切片。

(3)进行运算



(4)映射

运算使用Numpy库进行映射计算

import numpy as np

Series1.map(np.log).plot

(5)基于国家代码增加节假日

add_holidays方法向当前序列添加了一个二元变量,该组件在与所选国家的假日对应的每个索引处等于1,否则等于0。

(6)填充缺失值

dart包含一个filling_missing_values函数,它能够在时间序列数据中填充缺失的值,代码如下:

结果输出:

(7)划分训练集和测试集

代码中划分的训练集是直到1958年1月(不包括)的TimeSeries值,测试集余值的TimeSeries。

(8)使用NaiveSeasonal进行预测

在分割数据集之后,建立由dart库提供的第一个预测模型。dart中存在一组“原始”基线模型,这对于了解期望的最低精度非常有用。例如,naivesasional (K)模型总是“重复”K个时间步之前发生的值。在最原始的形式中,当K=1时,该模型总是简单地重复训练序列的最后一个值,代码如下:

输出如下:

使用dart库非常容易拟合和预测时间序列数据,fit()用于训练集,而predict()用于得到预测值。

(9)季节性

可以看到数据每年都显示季节性,可以通过使用stats.utils.statistics中check_seasonality来检查数据中的季节性。代码及结果如下:

可以在x = 12处看到一个峰值,它代表了年度季节性趋势(红线)。使用k = 12,重新运行Na?ve季节性模型,模型及结果如下:

模型中实现季节变化值后,它显示了更好的预测,但仍然不准确。在他们的官方文档中所述,还有另一个捕获趋势的朴素基线模型,称为NaiveDrift。该模型产生线性预测,其斜率由训练集的第一个和最后一个值决定。

(10)计算误差矩阵

可以使用stats .metrics中的map函数必须最小化的误差值,代码如下:

在k=12的Na?ve模型,显示了大约13%的误差。对这些数据执行NaiveDrift,检查它是否减少了些许误差。



相关推荐

数据中台与业务中台总体技术架构设计方案

《数据中台与业务中台总体技术架构设计方案》提出**“开放、稳定、滋养”三原则**,强调通过统一技术架构与框架破除烟囱式系统,构建**“业务中台+数据中台”闭环体系**。方案主张从单体架...

三分钟摸清楚什么叫前后端分离(什么是前后端分离架构?)

什么叫前后端分离?其实,前后端分离的初衷是为了分离前后端开发人员的职责,解决开发模式的问题。说到底,前后端分离就是将前端视图和后端数据进行分离,这样,后端只需要提供接口(后端数据)给前端,而前端也可以...

刚刚,给学妹普及了登录的两大绝学

今天跟大家聊一个比较基础的话题,就是实现登录的方式有哪些?适合刚入行的朋友。华山之Session绝学Session我们称之为会话控制,是一种在服务器端保持会话状态的解决方案。通俗点来讲就是客户...

6种微服务RPC框架,你知道几个?(grpc是微服务框架吗)

开源RPC框架有哪些呢?一类是跟某种特定语言平台绑定的,另一类是与语言无关即跨语言平台的。跟语言平台绑定的开源RPC框架主要有下面几种。Dubbo:国内最早开源的RPC框架,由阿里巴巴公司...

微服务中,Spring Cloud 有哪些注册中心?

SpringCloud是微服务架构中经常使用的一个框架,它提供了一系列工具来帮助开发者构建和管理分布式系统,而服务注册中心又是微服务架构中一个关键组件。那么,SpringCloud支持哪些注册...

Eureka的自我保护机制(eureka自我保护机制原理)

最近遇到一个问题,服务之间调用报错,显示无法路由到指定服务,但是对应的服务是启动的,查询eureka,结果eureka上显示如下,所有实例均消失,我个人对注册中心并没有什么研究,进行正好借此机会简单总...

eureka、zookepeer、nacos的区别(eureka和nacos哪个更好)

前言随着微服务被各大企业应用在项目中,微服务的框架也被更多人学习和使用,但是大部分情况下都是停留在应用层。一、演变过程1.1服务注册和发现基本概念服务注册:将某个或者某些服务的信息(模块的ip和...

40K+Star!Mall电商实战项目开源,附源码、教程合集

最近看了下我的Github,发现mall项目已经突破40K+Star,有点小激动!记得去年8月的时候mall项目刚过20K+Star,时隔1年多已经增长到了40K+Star。今天跟大家聊聊mall项目...

SpringCloud 常见注册中心的比较(springcloud注册过程)

一、概述springcloud是一个非常优秀的微服务框架,要管理众多的服务,就需要对这些服务进行治理,也就是我们说的服务治理,服务治理的作用就是在传统的rpc远程调用框架中,管理每个服务与每个服务之间...

简单介绍Nacos服务注册中心(nacos注册中心有什么用)

Nacos是阿里开源的一个新框架,在分布式的架构中,Nacos同时扮演着服务注册中心和配置中心的角色。今天主要讲的是Nacos作为服务注册中心。分布式中著名的CAP理论,任何一种服务注册中心都只能实现...

入门注册中心——consul(注册中心怎么注册)

基础概念什么是注册中心随着微服务理论发展的成熟,越来越多互联网公司采用微服务架构来支持业务发展。各个微服务之间都需要通过注册中心来实现自动化的注册和发现。注册中心主要有三种角色:服务提供者(RPCS...

08 Eureka的基础知识(eureka replication)

Eureka是Netflix开发的服务发现框架,SpringCloud将它集成在自己的子项目spring-cloud-netflix中,实现SpringCloud的服务发现功能。上图简要描述了Eur...

微服务架构中的服务注册与发现有哪些?Zookeeper、Eu

“大家好,我是码哥,《Redis高手心法》作者,本章节选自《Java面试高手心法58讲》专栏。随着单体应用的拆分,我们面临的首要问题就是采用哪种方式实现服务间的调用,像之前单体应用可能直接在配...

Eureka 都挂了,微服务还能调通吗?

如果你做过微服务开发,这个面试题应该能够立马答出来,如果你没做过微服务开发,但是学过一些SpringCloud组件的用法,这个问题可能要稍微想一下,但是也应该能够答出来。今天就来和大家说说这个问...

ZooKeeper、Eureka、Consul 、Nacos微服务注册中心对比

注册中心前言服务注册中心本质上是为了解耦服务提供者和服务消费者。对于任何一个微服务,原则上都应存在或者支持多个提供者,这是由微服务的分布式属性决定的。更进一步,为了支持弹性扩缩容特性,一个微服务的提供...