百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

关于SQL Server 数据库归档的一些思考和改进

bigegpt 2024-08-04 11:39 8 浏览

一.需求背景

SQL Server开源的归档工具不多,DBA一般都是通过计划任务来触发执行,执行的脚本多是SP或者是SSIS包。SSIS包的性能稍好一些,但是维护更新成本高些。所以更常见的是通过SP脚本来实现归档操作。

当数据库规模较小时,可以方便的直接在数据库上进行脚本的编写部署。但是随着数据库越来越多,管理维护成本就会越来越大,越来越不方便。现在我们实行的方式是通过中央管理器来管理众多的数据库备份(这是在拥有专门的备份程序前的一个过渡方案)。我们将归档基础配置信息、归档运行历史记录、异常报错等数据统一维护在中央数据库上。如此,可以方便统一的查看、管理和维护。

二.主要架构

三.主要关联表

2.1 归档基础配置表

表字段含义,请耐心查看字段说明。

CREATE TABLE [dbo].[DBData_ArchiveConfig](
 [ID] [int] IDENTITY(1,1) NOT NULL,
 [IP] [varchar](50) NULL,
 [DBName] [varchar](50) NULL,
 [DataTable] [varchar](50) NULL,
 [TargetIP] [varchar](50) NULL,
 [TargetDB] [varchar](50) NULL,
 [TargetTable] [varchar](50) NULL,
 [Prerequisite] [varchar](300) NULL,
 [DelMaxQTY] [int] NULL,
 [IsCheckOrderID] [int] NULL,
 [SP_Name] [int] NULL,
 [StartTime] [datetime] NULL,
 [EndTime] [datetime] NULL
) ON [PRIMARY]
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'Server IP(数据位于中央管理器中,所以归档数据库库所在的IP要维护,可维修虚拟的IP)' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'IP'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'要归档的数据库' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'DBName'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'要归档的表' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'DataTable'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'备份指向的IP' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'TargetIP'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'备份指向的数据库' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'TargetDB'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'备份指向的表' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'TargetTable'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'归档条件' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'Prerequisite'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'循环中一次归档删除的数据量' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'DelMaxQTY'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'此为 备用字段,考虑可能有些表,会和其他表关联' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'IsCheckOrderID'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'为提高并发度,一个DB对应的归档SP可能是多个,通过此列,进行分组。' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'SP_Name'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'此为拓展字段,原计划根据 开始时间、结束时间,每天可以多个时间段内执行' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'StartTime'
GO
EXEC sys.sp_addextendedproperty @name=N'MS_Description', @value=N'此为拓展字段,原计划根据 开始时间、结束时间,每天可以多个时间段内执行' , @level0type=N'SCHEMA',@level0name=N'dbo', @level1type=N'TABLE',@level1name=N'DBData_ArchiveConfig', @level2type=N'COLUMN',@level2name=N'EndTime'
GO

2.2 归档运行的Log表

CREATE TABLE [dbo].[DBData_ArchiveLog](
 [ID] [int] IDENTITY(1,1) NOT NULL,
 [IP] [varchar](30) NULL,
 [DBName] [varchar](30) NULL,
 [DataTable] [varchar](80) NULL,
 [BakQTY] [varchar](30) NULL,
 [BakStartDate] [datetime] NULL,
 [BakEndDate] [datetime] NULL
) ON [PRIMARY]
GO

2.3 异常错误信息表

执行的过程中会外包一层 try...catch,将操作过程中的错误信息保存在表 DBData_ArchiveErrLog。表结构如下:

CREATE TABLE [dbo].[DBData_ArchiveErrLog](
 [ID] [int] IDENTITY(1,1) NOT NULL,
 [IP] [varchar](30) NULL,
 [DBName] [varchar](60) NULL,
 [DataTable] [varchar](80) NULL,
 [TargetIP] [varchar](30) NULL,
 [TargetDB] [varchar](60) NULL,
 [TargetTable] [varchar](80) NULL,
 [Errormsg] [nvarchar](max) NULL,
 [TransDateTime] [varchar](30) NULL
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
GO

四. 存储过程相应的主要代码

SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
-- =============================================
-- Author: <Author,,Name>
-- Create date: <Create Date,,>
-- Description: <Description,,>
-- =============================================
CREATE PROCEDURE [dbo].[SP_XXXXX_DataArchive]
AS
 SET NOCOUNT ON;
 DECLARE @sql1 VARCHAR(MAX) 
 DECLARE @sql VARCHAR(MAX) 
 DECLARE @sql2 VARCHAR(MAX)
 DECLARE @IP VARCHAR(MAX) 
 DECLARE @DBName VARCHAR(MAX) 
 DECLARE @DataTable VARCHAR(MAX) 
 DECLARE @TargetIP VARCHAR(MAX) 
 DECLARE @TargetDB VARCHAR(MAX) 
 DECLARE @TargetTable VARCHAR(MAX) 
 DECLARE @Prerequisite VARCHAR(MAX) 
 DECLARE @DelMaxQTY INT
 DECLARE @StartTime DATETIME
 DECLARE @EndTime DATETIME
 DECLARE @qty INT 
 DECLARE @ISCHECKORDERID INT 
----Carson 2018-12-17 备份数据的时间往往比删除的时间长3倍,因此,如果考虑将备份的操作转移到辅助库,将会对线上的操作影响降至更低
 DECLARE @BakDateIP VARCHAR(30) 
 set @BakDateIP='[XXX.XXX.XXX.XXX].'-------后面一定要有一个点
--------------------------------------------------归档操作---------------------------------
 DECLARE DBName CURSOR
 FOR
 SELECT IP ,
 DBName ,
 DataTable ,
 TargetIP ,
 TargetDB ,
 TargetTable ,
 Prerequisite ,
 DelMaxQTY ,
 ISCHECKORDERID ,
 StartTime ,
 EndTime
 FROM [中央管理器].[中央管理数据库].[dbo].[DBData_ArchiveConfig]
 WHERE DataTable <> ''
 AND TargetTable <> ''
 AND DBNAME = 'XXXXXXXXX' and SP_Name='?????'
 OPEN DBName 
 FETCH NEXT FROM DBName INTO @IP, @DBName, @DataTable, @TargetIP, @TargetDB,
 @TargetTable, @Prerequisite, @DelMaxQTY, @ISCHECKORDERID,
 @StartTime, @EndTime 
 WHILE ( @@fetch_status = 0 )
 BEGIN 
 DECLARE @datetime DATETIME
 IF @ISCHECKORDERID <> '1' AND @DataTable <> ''
 BEGIN
 SET @datetime = CONVERT(VARCHAR(10), GETDATE() - 30, 120) 
 SET @sql = 'Insert into [' + @TargetIP + '].'
 + @TargetDB + '.' + 'dbo.' + @TargetTable + '
 select * FROM ' + @BakDateIP + @DBName + '.' + 'dbo.' + @DataTable + ' 
 with(nolock) where ' + @Prerequisite + ''
 
 SET @sql1 = 'DECLARE @icount INTEGER 
 SELECT @icount = COUNT(1) 
 FROM ' + @BakDateIP + @DBName + '.' + 'dbo.' + @DataTable + '
 where ' + @Prerequisite + ' 
 insert into [中央管理器].[中央管理数据库].dbo.DBData_ArchiveLog (IP, DBName, DataTable, BakQTY, BakStartDate, BakEndDate)
 select ''' + @IP + ''',''' + @DBName + ''',''' + @DataTable
 + ''',@icount,getdate(),null
 WHILE @icount > 0 
 BEGIN 
 
 DELETE TOP (' + CAST(@DelMaxQTY AS VARCHAR(10)) + ') 
 FROM ' + @DBName + '.' + 'dbo.' + @DataTable + ' 
 where ' + @Prerequisite + '
 
 SET @icount = @icount -('
 + CAST(@DelMaxQTY AS VARCHAR(10)) + ') 
 WAITFOR DELAY ''00:00:01'' 
 END ' 
 BEGIN TRY
 EXEC (@sql)
 EXEC (@sql1) 
 END TRY
 BEGIN CATCH
 DECLARE @Errmsg AS nvarchar(MAX)
 SELECT @Errmsg=ERROR_MESSAGE()
 ------0001 BEGIN SAVE ERR LOG IN TABLE
 INSERT INTO [中央管理器].[中央管理数据库].[dbo].DBData_ArchiveErrLog ([IP] ,[DBName],[DataTable],[TargetIP],[TargetDB],[TargetTable],[Errormsg] ,[TransDateTime])
 VALUES(@IP, @DBName, @DataTable, @TargetIP, @TargetDB, @TargetTable,@Errmsg,convert(VARCHAR(25),GETDATE(), 120)) 
 ------0001 END
 -------------0002 BEGIN SEND EMAIL MESSAGE---------------- 
 DECLARE @Subject AS nvarchar(200)
 DECLARE @Body AS nvarchar(MAX)
 DECLARE @SPName AS nvarchar(MAX)
 
 SET @Subject = '数据库归档异常 -重要!;ServerIP:' + @IP + ' DB:' + @DBName
 SET @SPName = ''
 SET @Body = '<html><body>Dear All,<br> <br> ServerIP:' +@IP + ' ; DataBase:' + @DBName+ '上的Table归档异常,请及时检查!!!
 <br> You can get detail information from the table. <br><br><table border=1 bgcolor=#aaff11>' 
 SET @Body = @Body+ '<tr bgcolor=#ff3311><td>ServerIP</td><td>DBName</td><td>TableName</td><td>TargetIP</td><td>TargetDB</td><td>Errmsg</td><td>TransDateTime</td></tr>'
 SELECT @SPName = @SPName + '<tr bgcolor=#ffaa11><td>'+ CAST(@IP AS NVARCHAR(50))+ '</td><td>' + CAST(@DBName AS NVARCHAR(50)) + '</td><td>'+CAST(@DataTable AS NVARCHAR(50))+ '</td>
 <td>'+ CAST(@TargetIP AS NVARCHAR(20))+ '</td><td>'+ CAST(@TargetDB AS NVARCHAR(50))+ '</td><td>'+ SUBSTRING(@Errmsg,1, 100)+ '</td><td>'+ CONVERT(varchar(100), GETDATE(), 21)+ '</td></tr>'
 SET @Body = @Body + @SPName + '</table>'
 SET @BODY=REPLACE(@BODY,'''','')
 IF REPLACE(@BODY,' ','')<>''
 BEGIN
 DECLARE @AllEmailToAddress varchar(3000)=''
 DECLARE @AllEmailCcAddress varchar(3000)=''
 DECLARE @Allprofile_name varchar(100)=''
 SELECT @AllEmailToAddress=''
 SELECT @AllEmailCcAddress=''
 SELECT TOP 1 @Allprofile_name=NAME FROM msdb.dbo.sysmail_profile 
 ORDER BY profile_id
 EXEC msdb..sp_send_dbmail @profile_name = @Allprofile_name -- profile 名称 
 ,@recipients = @AllEmailToAddress -- 收件人邮箱 
 ,@copy_recipients=@AllEmailCcAddress
 ,@subject = @Subject -- 邮件标题 
 ,@body = @BODY -- 邮件内容 
 ,@body_format = 'HTML' -- 邮件格式 
 ,@file_attachments=''
 ,@Importance = 'High'
 END 
 ------------- 0002 end ------------ 
 END CATCH 
 END
 FETCH NEXT FROM DBName INTO @IP, @DBName, @DataTable, @TargetIP,
 @TargetDB, @TargetTable, @Prerequisite, @DelMaxQTY,
 @ISCHECKORDERID, @StartTime, @EndTime 
 END
 
 CLOSE DBName 
 DEALLOCATE DBName
 DECLARE DELETETABLE CURSOR
 FOR
 SELECT IP ,
 DBName ,
 DataTable ,
 TargetTable ,
 Prerequisite ,
 DelMaxQTY 
 FROM [中央管理器].[中央管理数据库].[dbo].[DBData_ArchiveConfig]
 WHERE DataTable <> ''
 AND TargetTable = ''
 AND DBNAME = 'XXXXXXXXX' and SP_Name='????'
 OPEN DELETETABLE 
 FETCH NEXT FROM DELETETABLE INTO @IP, @DBName, @DataTable,
 @TargetTable, @Prerequisite, @DelMaxQTY
 WHILE ( @@fetch_status = 0 )
 BEGIN
 SET @sql1 = 'DECLARE @icount INTEGER 
 SELECT @icount = COUNT(1) 
 FROM ' + @DBName + '.' + 'dbo.' + @DataTable + '
 where ' + @Prerequisite + ' 
 WHILE @icount > 0 
 BEGIN 
 
 DELETE TOP (' + CAST(@DelMaxQTY AS VARCHAR(10)) + ') 
 FROM ' + @DBName + '.' + 'dbo.' + @DataTable + ' 
 where ' + @Prerequisite + '
 
 SET @icount = @icount -('
 + CAST(@DelMaxQTY AS VARCHAR(10)) + ') 
 WAITFOR DELAY ''00:00:01'' 
 END '
 PRINT @sql1
 EXEC (@sql1)
 FETCH NEXT FROM DELETETABLE INTO @IP, @DBName, @DataTable,@TargetTable, @Prerequisite, @DelMaxQTY
 END 
 CLOSE DELETETABLE 
 DEALLOCATE DELETETABLE
GO

五.补充数据

1.数据库归档,一般都是先将当前库的历史数据归档到历史库,再将当前库的历史数据删除。这两个阶段,一般是前者耗时较多(一般都在2:1以上),虽然可以在select 过程加上nolock,但是或者I/O或者网络等原因,其实这个阶段对应用程序的影响还是比较大的。所以,建议将这两个阶段物理分开,即如果有配置AlwaysOn,请将第一个阶段在辅助数据库中执行。上面的SP示例,就是通过参数 @BakDateIP 来实现了这一作用。

2.存储过程中包含了try...catch,所以运行此sp就会很少报错,某一个表的异常不会相互影响。例如,我们常见的当前库、历史库由于表结构变更而导致的不一致,此情况出现后,try..catch可以捕捉到异常,将异常记录在档,并将此信息以邮件的形式发送给指定人,但整个SP不会执行失败。并且还会跳过这一个异常,继续执行下一个备份归档表的归档。

本文版权归作者所有

好文要顶 关注我 收藏该文

作者:东山絮柳仔

原文:https://www.cnblogs.com/xuliuzai/p/10168858.html

相关推荐

方差分析简介(方差分析通俗理解)

介绍方差分析(ANOVA,AnalysisofVariance)是一种广泛使用的统计方法,用于比较两个或多个组之间的均值。单因素方差分析是方差分析的一种变体,旨在检测三个或更多分类组的均值是否存在...

正如404页面所预示,猴子正成为断网元凶--吧嗒吧嗒真好吃

吧嗒吧嗒,绘图:MakiNaro你可以通过加热、冰冻、水淹、模塑、甚至压溃压力来使网络光缆硬化。但用猴子显然是不行的。光缆那新挤压成型的塑料外皮太尼玛诱人了,无法阻挡一场试吃盛宴的举行。印度政府正...

Python数据可视化:箱线图多种库画法

概念箱线图通过数据的四分位数来展示数据的分布情况。例如:数据的中心位置,数据间的离散程度,是否有异常值等。把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)...

多组独立(完全随机设计)样本秩和检验的SPSS操作教程及结果解读

作者/风仕在上一期,我们已经讲完了两组独立样本秩和检验的SPSS操作教程及结果解读,这期开始讲多组独立样本秩和检验,我们主要从多组独立样本秩和检验介绍、两组独立样本秩和检验使用条件及案例的SPSS操作...

方差分析 in R语言 and Excel(方差分析r语言例题)

今天来写一篇实际中比较实用的分析方法,方差分析。通过方差分析,我们可以确定组别之间的差异是否超出了由于随机因素引起的差异范围。方差分析分为单因素方差分析和多因素方差分析,这一篇先介绍一下单因素方差分析...

可视化:前端数据可视化插件大盘点 图表/图谱/地图/关系图

前端数据可视化插件大盘点图表/图谱/地图/关系图全有在大数据时代,很多时候我们需要在网页中显示数据统计报表,从而能很直观地了解数据的走向,开发人员很多时候需要使用图表来表现一些数据。随着Web技术的...

matplotlib 必知的 15 个图(matplotlib各种图)

施工专题,我已完成20篇,施工系列几乎覆盖Python完整技术栈,目标只总结实践中最实用的东西,直击问题本质,快速帮助读者们入门和进阶:1我的施工计划2数字专题3字符串专题4列表专题5流程控制专题6编...

R ggplot2常用图表绘制指南(ggplot2绘制折线图)

ggplot2是R语言中强大的数据可视化包,基于“图形语法”(GrammarofGraphics),通过分层方式构建图表。以下是常用图表命令的详细指南,涵盖基本语法、常见图表类型及示例,适合...

Python数据可视化:从Pandas基础到Seaborn高级应用

数据可视化是数据分析中不可或缺的一环,它能帮助我们直观理解数据模式和趋势。本文将全面介绍Python中最常用的三种可视化方法。Pandas内置绘图功能Pandas基于Matplotlib提供了简洁的绘...

Python 数据可视化常用命令备忘录

本文提供了一个全面的Python数据可视化备忘单,适用于探索性数据分析(EDA)。该备忘单涵盖了单变量分析、双变量分析、多变量分析、时间序列分析、文本数据分析、可视化定制以及保存与显示等内容。所...

统计图的种类(统计图的种类及特点图片)

统计图是利用几何图形或具体事物的形象和地图等形式来表现社会经济现象数量特征和数量关系的图形。以下是几种常见的统计图类型及其适用场景:1.条形图(BarChart)条形图是用矩形条的高度或长度来表示...

实测,大模型谁更懂数据可视化?(数据可视化和可视化分析的主要模型)

大家好,我是Ai学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。实测,大模型LaTeX公式识别,出乎预料前文,我用Kimi、Qwen-3-235B...

通过AI提示词让Deepseek快速生成各种类型的图表制作

在数据分析和可视化领域,图表是传达信息的重要工具。然而,传统图表制作往往需要专业的软件和一定的技术知识。本文将介绍如何通过AI提示词,利用Deepseek快速生成各种类型的图表,包括柱状图、折线图、饼...

数据可视化:解析箱线图(box plot)

箱线图/盒须图(boxplot)是数据分布的图形表示,由五个摘要组成:最小值、第一四分位数(25th百分位数)、中位数、第三四分位数(75th百分位数)和最大值。箱子代表四分位距(IQR)。IQR是...

[seaborn] seaborn学习笔记1-箱形图Boxplot

1箱形图Boxplot(代码下载)Boxplot可能是最常见的图形类型之一。它能够很好表示数据中的分布规律。箱型图方框的末尾显示了上下四分位数。极线显示最高和最低值,不包括异常值。seaborn中...