Oracle学习日记——时间日期范围处理
bigegpt 2024-10-12 05:39 5 浏览
1.定位连续值的范围
create or replace view v(proj_id,proj_start,proj_end) as
select 1,date'2005-01-01',date'2005-01-02' from dual union all
select 2,date'2005-01-02',date'2005-01-03' from dual union all
select 3,date'2005-01-03',date'2005-01-04' from dual union all
select 4,date'2005-01-04',date'2005-01-05' from dual union all
select 5,date'2005-01-06',date'2005-01-07' from dual union all
select 6,date'2005-01-16',date'2005-01-17' from dual union all
select 7,date'2005-01-17',date'2005-01-18' from dual union all
select 8,date'2005-01-18',date'2005-01-19' from dual union all
select 9,date'2005-01-19',date'2005-01-20' from dual union all
select 10,date'2005-01-21',date'2005-01-22' from dual union all
select 11,date'2005-01-26',date'2005-01-27' from dual union all
select 12,date'2005-01-27',date'2005-01-28' from dual union all
select 13,date'2005-01-28',date'2005-01-29' from dual union all
select 14,date'2005-01-29',date'2005-01-30' from dual ;
需求:把连续的数据查询出来
方案1:自关联
select v1.proj_id as 工程号,v1.proj_start as 开始时间,v1.proj_end as 结束时间
from v v1,v v2 where v1.proj_start = v2.proj_end
方案2:使用lead() over() 进行过滤
select * from
(select v1.proj_id as 工程号,v1.proj_start as 开始时间,v1.proj_end as 结束时间,
lead(v1.proj_start)over(order by proj_id) as 下一期工程开始时间
from v v1 )
where 结束时间 = 下一期工程开始时间
在上面的两种写法中,自关联需要扫描两次视图“V”,而使用分析函数只需要一次就可以,根据这个特性,大部分情况下可以通过分析函数优化查询性能。
2.定位连续值范围的开始点和结束点
需求:现在要求把连续的项目合并,返回合并后的起止时间,如前四个项目合并后起止时间就是1号到5号。
如果是取最小开始时间和最大结束时间,则比较容易操作
select min(proj_start) as 开始,max(proj_end) as 结束 from v;
但是远远不能满足我们的需求。
分析:
(1)提取上一工程的结束日期
create or replace view x0 as
select proj_id as 编号,
proj_start as 开始日期,
proj_end as 结束日期,
lag(proj_end) over(order by proj_id) as 上一工程结束日期
from v
select * from x0
(2)标定工程的连续状态
create or replace view x1 as
select 编号,
开始日期,
结束日期,
上一工程结束日期,
case when 开始日期 = 上一工程结束日期 then 0 else 1 end as 连续状态
from x0;
select * from x1
可以看到,在每一个连续分组的开始位置,我们都生成了一个“1”作为标识。
(3)对这个位置状态进行累加,得到分组依据
create or replace view x2 as
select 编号,
开始日期,
结束日期,
上一工程结束日期,
连续状态,
sum(连续状态) over(order by 编号) as 分组依据
from x1;
select * from x2;
可以看到,通过提取数据(上一行日期)、生成标识、累加标识这些操作后,得到了5个连续分组,有分组依据后就容易完成下面的操作。
select 分组依据,min(开始日期) as 开始日期,max(结束日期) as 结束日期
from x2
group by 分组依据
order by 1
把上面各步骤整理在一起的语句如下:
select 分组依据,min(开始日期) as 开始日期,max(结束日期) as 结束日期
from (select 编号,
开始日期,
结束日期,
sum(连续状态) over(order by 编号) 分组依据
from (select proj_id as 编号,
proj_start as 开始日期,
proj_end as 结束日期,
case when lag(proj_end) over(order by proj_id) = proj_start then 0 else 1 end 连续状态 from v))
group by 分组依据
order by 1;
3.合并时间段
create or replace Timesheets(tast_id,start_date,end_date) as
select 1,date'1997-01-01',date'1997-01-03' from dual union all
select 2,date'1997-01-02',date'1997-01-04' from dual union all
select 3,date'1997-01-04',date'1997-01-05' from dual union all
select 4,date'1997-01-06',date'1997-01-09' from dual union all
select 5,date'1997-01-09',date'1997-01-09' from dual union all
select 6,date'1997-01-09',date'1997-01-09' from dual union all
select 7,date'1997-01-12',date'1997-01-15' from dual union all
select 8,date'1997-01-13',date'1997-01-13' from dual union all
select 9,date'1997-01-15',date'1997-01-15' from dual union all
select 10,date'1997-01-17',date'1997-01-17' from dual
select * from Timesheets
id7与id9是连续的,但中间id8和id9不连续,所以用lag取上一行来判断肯定不对。
(1)这时可以用另一个开窗方式来处理:获取当前行之前的最大“end_date”
select start_date,
end_date,
max(end_date) over(order by start_date rows between unbounded preceding and 1 preceding) as max_end_date
from timesheets b;
between unbounded preceding and 1 preceding :就是between ... and ....子句,意思是:从第一行到上一行
该分析函数就是order by start_date后“第一行到上一行”范围内的“max(end_date)”
有了这个数据后再来判断,就可以把id(7、8、9)判断为连续范围了。
相关推荐
- 得物可观测平台架构升级:基于GreptimeDB的全新监控体系实践
-
一、摘要在前端可观测分析场景中,需要实时观测并处理多地、多环境的运行情况,以保障Web应用和移动端的可用性与性能。传统方案往往依赖代理Agent→消息队列→流计算引擎→OLAP存储...
- warm-flow新春版:网关直连和流程图重构
-
本期主要解决了网关直连和流程图重构,可以自此之后可支持各种复杂的网关混合、多网关直连使用。-新增Ruoyi-Vue-Plus优秀开源集成案例更新日志[feat]导入、导出和保存等新增json格式支持...
- 扣子空间体验报告
-
在数字化时代,智能工具的应用正不断拓展到我们工作和生活的各个角落。从任务规划到项目执行,再到任务管理,作者深入探讨了这款工具在不同场景下的表现和潜力。通过具体的应用实例,文章展示了扣子空间如何帮助用户...
- spider-flow:开源的可视化方式定义爬虫方案
-
spider-flow简介spider-flow是一个爬虫平台,以可视化推拽方式定义爬取流程,无需代码即可实现一个爬虫服务。spider-flow特性支持css选择器、正则提取支持JSON/XML格式...
- solon-flow 你好世界!
-
solon-flow是一个基础级的流处理引擎(可用于业务规则、决策处理、计算编排、流程审批等......)。提供有“开放式”驱动定制支持,像jdbc有mysql或pgsql等驱动,可...
- 新一代开源爬虫平台:SpiderFlow
-
SpiderFlow:新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。-精选真开源,释放新价值。概览Spider-Flow是一个开源的、面向所有用户的Web端爬虫构建平台,它使用Ja...
- 通过 SQL 训练机器学习模型的引擎
-
关注薪资待遇的同学应该知道,机器学习相关的岗位工资普遍偏高啊。同时随着各种通用机器学习框架的出现,机器学习的门槛也在逐渐降低,训练一个简单的机器学习模型变得不那么难。但是不得不承认对于一些数据相关的工...
- 鼠须管输入法rime for Mac
-
鼠须管输入法forMac是一款十分新颖的跨平台输入法软件,全名是中州韵输入法引擎,鼠须管输入法mac版不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、...
- Go语言 1.20 版本正式发布:新版详细介绍
-
Go1.20简介最新的Go版本1.20在Go1.19发布六个月后发布。它的大部分更改都在工具链、运行时和库的实现中。一如既往,该版本保持了Go1的兼容性承诺。我们期望几乎所...
- iOS 10平台SpriteKit新特性之Tile Maps(上)
-
简介苹果公司在WWDC2016大会上向人们展示了一大批新的好东西。其中之一就是SpriteKitTileEditor。这款工具易于上手,而且看起来速度特别快。在本教程中,你将了解关于TileE...
- 程序员简历例句—范例Java、Python、C++模板
-
个人简介通用简介:有良好的代码风格,通过添加注释提高代码可读性,注重代码质量,研读过XXX,XXX等多个开源项目源码从而学习增强代码的健壮性与扩展性。具备良好的代码编程习惯及文档编写能力,参与多个高...
- Telerik UI for iOS Q3 2015正式发布
-
近日,TelerikUIforiOS正式发布了Q32015。新版本新增对XCode7、Swift2.0和iOS9的支持,同时还新增了对数轴、不连续的日期时间轴等;改进TKDataPoin...
- ios使用ijkplayer+nginx进行视频直播
-
上两节,我们讲到使用nginx和ngixn的rtmp模块搭建直播的服务器,接着我们讲解了在Android使用ijkplayer来作为我们的视频直播播放器,整个过程中,需要注意的就是ijlplayer编...
- IOS技术分享|iOS快速生成开发文档(一)
-
前言对于开发人员而言,文档的作用不言而喻。文档不仅可以提高软件开发效率,还能便于以后的软件开发、使用和维护。本文主要讲述Objective-C快速生成开发文档工具appledoc。简介apple...
- macOS下配置VS Code C++开发环境
-
本文介绍在苹果macOS操作系统下,配置VisualStudioCode的C/C++开发环境的过程,本环境使用Clang/LLVM编译器和调试器。一、前置条件本文默认前置条件是,您的开发设备已...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- httperror403.14-forbidden (63)
- logstashinput (65)
- hadoop端口 (65)
- dockernetworkconnect (63)
- esxi7 (63)
- vue阻止冒泡 (67)
- c#for循环 (63)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- java大写转小写 (63)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)