百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

PostgreSQL这样优化,运维就能省心多了

bigegpt 2025-02-03 11:27 11 浏览

数据库优化是一个综合工程,不仅仅是需要DBA参与,更重要的是研发设计人员针对PG数据库的特点来进行相关的优化设计。不过对于DBA来说,一旦接到上线和运维任务,基本上都是木已成舟,软件设计方面留下的坑已经挖好,DBA的作为已经十分有限了。不过既然要干运维,那么少不了就要参与优化。PG的优化工作该如何开展呢?今天我从几个主要的方面聊聊PG优化的几个常见的角度。针对PG数据库,只要做好了下面几个方面的优化工作,那么运维起来也就比较省心了。


  • 硬件资源问题:如果数据库服务器硬件资源不足,例如 CPU、内存、磁盘 IO 等,会导致系统性能下降,响应时间变慢。


  • 操作系统配置不合理:如果操作系统没有针对PG数据库进行优化,那么PG数据库也无法发挥最佳的效能,因此针对PG数据库的优化,从操作系统参数调整入手永远是不会错的。


  • 文件系统配置不合理:对于一些负载较高的大型数据库来说,如果无法发挥后端存储的IO能力,或者说让后端磁盘出现了性能问题,那么就会严重影响PG数据库的性能甚至稳定性。对于大型数据库来说,文件系统设计与配置一定要十分用心。


  • SQL不够优化:如果应用没有经过优化,可能会导致查询效率低下,索引设计不合理,缺少必要的索引,过多的单列索引以及索引类型使用不合理等都会带来性能问题。最后不合理多表的 JOIN、WHERE 子句和大表并行扫码都可能成为性能杀手。


  • 数据库结构设计不合理:如果数据库结构设计不合理,可能会导致查询效率低下,例如表过度归一化、大表未分区或者分区设置不合理,表或者索引的的FILL FACTOR参数设置不合理导致的热块冲突。索引设计不合理产生的不必要的写成本过高。应该存储到对象存储中的非结构化数据存储到PG数据库中等。表分区设计不合理,时序数据没有使用timescaledb的自动分区与自动压缩特性也会导致时序数据访问的性能不佳。


  • 数据库参数设置不合理:如果 PostgreSQL 数据库参数设置不合理,可能会导致数据库性能低下,例如 shared_buffers、work_mem、WAL/Checkpoint 等参数的设置等。


  • 并发控制不合理:如果数据库并发控制不合理,可能会导致性能下降,这方面包含事务隔离级别设置不合理,并发度相关参数设置不合理等。


  • 缓存命中率低:如果缓存命中率低,会导致频繁的磁盘 IO 操作,从而降低数据库性能。


  • 访问冷数据的性能不足:PG数据库是采用DOUBLE CACHE机制的,冷数据是指在SHARED BUFFERS和OS CACHE中都不存在的数据,这些数据一旦要访问,要产生大量的物理IO,访问性能较差。


  • 自动化任务冲突:如果数据库中存在大量的自动化任务,例如备份、VACUUM、定时任务等,可能会导致任务之间的冲突,从而影响系统性能。


硬件资源不足的问题我们就不多加讨论了,这种情况一般会出现在CPU、IO等方面,在分析这方面问题的时候,需要关注R队列的长度是否超过CPU逻辑核数的2倍以上,对于IO来说,不仅仅要看IOPS/IO吞吐量等指标,更重要的是要看IO延时是否合理。


操作系统配置不合理是绝大多数PG数据库都存在的问题,这方面实际上是有一些最佳实践的。


[sysctl]

vm.swappiness = 1

vm.dirty_background_ratio = 10

vm.dirty_ratio = 40

vm.dirty_expire_centisecs = 3000

vm.dirty_writeback_centisecs = 500

kernel.shmmax = 18446744073692700000

kernel.shmall = 18446744073692700000

kernel.shmmni = 4096

kernel.sem = 250 512000 100 2048

fs.file-max = 312139770

fs.aio-max-nr = 1048576

net.ipv4.ip_local_port_range = 2048 65499

# Permits sockets in the time-wait state to be reused for new connections:

net.ipv4.tcp_tw_reuse = 1

net.core.netdev_budget = 1024

net.core.netdev_max_backlog = 2048

net.core.rmem_default = 262144

net.core.rmem_max = 4194304

net.core.wmem_default = 262144

net.core.wmem_max = 1048576

kernel.panic_on_oops = 1

# We don't need NUMA balancing in this box:

kernel.numa_balancing = 0

# Used if not defined by the service:

net.core.somaxconn = 4096

# Other parameters to override throughput-performance template

net.ipv4.tcp_rmem = 4096 87380 16777216

net.ipv4.tcp_wmem = 4096 65536 16777216

net.ipv4.tcp_window_scaling = 1

net.netfilter.nf_conntrack_max = 250000

net.ipv4.tcp_max_syn_backlog=4096

[vm]

transparent_hugepages=never


上面是一个红帽公司对于PG数据库RHEL参数优化的建议,大家可以参考,对于绝大多数高负载的系统来说,都是有效的。大家要注意的是,关于脏块回写的设置,对于不同的写IO负载以及不同的底层IO硬件,可能调整会有不同,甚至会有截然相反的配置策略。要注意的是,绝对不能因为不合理的脏块刷新策略导致了OS IO负载的过载。在此前提下,缩短IO写盘的周期对于提高并发负载是有帮助的。


文件系统的设计对于大型系统来说十分关键,除了使用XFS与EXT4等带日志的文件系统并且打开日志功能外,设置文件系统的mount参数对性能也有很大影响。文件系统的条带大小、块大小要与PG数据库匹配,MOUNT时也要加入nobarrier、noatime,nodiratime等参数,并做好扇区对齐,除此之外就是文件存储方面的性能优化了。


很多DBA都只会设置一个$PGDATA,整个数据库都放在同一个文件系统上,这需要对文件系统底层的卷做十分细致的优化,确保整个卷的IO能力是优秀的,这一点总是无法做到的。因此在数据库设计的时候就通过WAL与数据文件分离,热数据与冷数据分离,通过表空间隔离热点IO等方式规划PG数据库的文件存储。如果应用系统已经无法通过表空间来隔离IO热点,那么通过软连接将部分库的目录迁移到其他文件系统也是一个可行的方案。


对于数据库参数来说,实际上不同的应用场景下的最佳调整方案是不同的,一般来说,设置合理的shared_buffers,以及优化好相关的而bgwriter,WAL,checkpoint,work_mem,VACUUM等相关的参数,就能够满足大多数应用的需求了。在这里我们就不做过多的讨论了。在这方面我以前写过十多篇文章,有兴趣的朋友可以到公众号通过搜索“性能优化”或者通过公众号的菜单去查找。


并发控制不合理方面的问题是比较容易被忽视的问题,事务隔离级别用错对于性能的影响极大,不过一般情况下我们都是使用read committed,不要轻易去修改数据库级的事务隔离级别。


并发的另外一个方面是系统中的各类并发访问的控制,特别是并行执行的设置。max_worker_processes、max_parallel_workers、
max_parallel_maintenance_workers和
max_parallel_workers_per_gather等参数对数据库的并发度控制都至关重要。


如果并发相关的设置过小,那么当活跃会话数量不高的时候,无法充分发挥服务器硬件的资源优势,造成巨大的浪费。PG数据库可以支撑巨大的数据库与极高的并发,因此如果服务器的配置足够好,系统资源使用率不高,但是应用性能无法达到设计要求,那么我们就应该关注一下是否并发控制相关的参数设置过低了。默认的PG参数里,max_worker_processes是偏小的,仅仅是8,对于有上百甚至上千个逻辑核数的服务器来说是完全不够用的。


当然如果因为并发控制参数设置的过高而导致了CPU等资源出现了不足,因为IOPS过大或者IO吞吐量过大,底层存储能力不足导致的IO延时过大等现象,那么适当调低这些参数对数据库的整体性能提升是有帮助的。


PG的SHARED_BUFFERS设置不合理可能会导致缓冲区命中率不高,从而影响SQL的执行性能。不过PG数据库是使用DOUBLE BUFFER机制的,要想为你的应用调整好缓冲区并不容易。再怎么调整都无法满足不同场景的应用,有些时候DBA真的很难通过调整来优化这方面的性能。对于一些定期的报表等应用,在跑批之前做数据预热可能是DBA能够控制的优化方法,也是最为有效的提升统计报表性能的方法。


最后一点,自动化任务冲突是所有数据库都会遇到的性能问题,如果数据库备份,大批量统计作业与大数据量导入导出同时发生,再好的硬件也可能撑不住,因此在设计这些定期任务的时候,一定要通过算法将这些作业分开,千万不要让这些大型操作存在最大公约数。否则哪怕现在你的系统没问题,几年后,还是会出问题的。


作者丨白鳝

来源丨公众号:白鳝的洞穴 (ID:baishan755)

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn


活动推荐

第八届DAMS-中国数据智能管理峰会将于2023年3月31日在上海举办与大家一起探索大数据与云原生强强联合的方式、挖掘由此激发的软件发展和技术进步。

报名链接:2023年DAMS中国数据智能管理峰会-上海站 ?-?百格活动

演讲嘉宾所在单位:阿里、腾讯、京东、美团、华为云、字节、蚂蚁、网易、新浪、携程、哔哩哔哩、小红书、vivo、快狗打车、货拉拉、工商银行、建设银行、中国银行、平安银行、光大银行、汇丰银行、微众银行、复旦大学等产学研界技术领跑单位。

演讲议题聚焦:

  • 大数据&数据资产管理:数据治理丨存算分离丨云原生OLAP丨湖仓一体丨智能分析
  • 数据库:云原生分布式丨时间序列丨服务自治丨中间件丨跨云多活
  • 运维:AIOps丨故障分析丨性能优化丨离在线混部丨高可用建设
  • 金融科技:规模化监控丨实时数仓丨分布式改造丨国产化替代丨数字化转型丨混沌工程

相关推荐

或者这些Joplin插件也可以帮助你的笔记应用再一次强大

写在前面距离上次分享《搭建私有全平台多端同步笔记,群晖NAS自建JoplinServer服务》已过去一段时间,大家是否开始使用起来了呢?如果你和我一样已经使用过Joplin有一段时间了,那或许你也会...

Three.JS教程4 threejs中的辅助类

一、辅助类简介Three.js提供了一些辅助类(Helpers)以帮助我们更容易地调试、可视化场景中的元素。ArrowHelepr:创建箭头辅助器;AxisHelper:创建坐标轴辅助器;BoxH...

第2章 还记得点、线、面吗(二)(第二章还能敲钟吗)

glbgltf模型(webvrmodel)-gltf模型下载定制,glb模型下载定制,三维项目电商网站在线三维展示,usdz格式,vr模型网,网页VR模型下载,三维模型下载,webgl网页模型下载我...

如何检查Linux系统硬件信息?从CPU到显卡,一网打尽!

你可能会问:“我为什么要关心硬件信息?”答案很简单:硬件是Linux系统的根基,了解它可以帮你解决很多实际问题。比如:性能调优:知道CPU核心数和内存大小,才能更好地调整程序运行参数。故障排查:系统卡...

SpriteJS:图形库造轮子的那些事儿

从2017年到2020年,我花了大约4年的时间,从零到一,实现了一个可切换WebGL和Canvas2D渲染的,跨平台支持浏览器、SSR、小程序,基于DOM结构和支持响应式的,高...

平时积累的FPGA知识点(6)(fpga经典应用100例)

平时在FPGA群聊等积累的FPGA知识点,第六期:1万兆网接口,发三十万包,会出现掉几包的情况,为什么?原因:没做时钟约束,万兆网接口的实现,本质上都是高速serdes,用IP的话,IP会自带约束。...

芯片逻辑调度框架设计 都需要那些那些软件工具

设计芯片逻辑调度框架通常需要使用以下软件工具:1.逻辑设计工具:例如Vivado、Quartus、SynopsysDesignCompiler等,用于设计和实现逻辑电路。2.仿真工具:例如Mo...

ZYNQ与DSP之间EMIF16通信(正点原子领航者zynq之fpga开发指南v3)

本文主要介绍说明XQ6657Z35-EVM高速数据处理评估板ZYNQ与DSP之间EMIF16通信的功能、使用步骤以及各个例程的运行效果。[基于TIKeyStone架构C6000系列TMS320C6...

好课推荐:从零开始大战FPGA(从零开始的冒险4399)

从零开始大战FPGA引子:本课程为“从零开始大战FPGA”系列课程的基础篇。课程通俗易懂、逻辑性强、示例丰富,课程中尤其强调在设计过程中对“时序”和“逻辑”的把控,以及硬件描述语言与硬件电路相对应的“...

业界第一个真正意义上开源100 Gbps NIC Corundum介绍

来源:内容由「网络交换FPGA」编译自「FCCM2020」,谢谢。FCCM2020在5月4日开始线上举行,对外免费。我们有幸聆听了其中一个有关100G开源NIC的介绍,我们对该文章进行了翻译,并对其中...

高层次综合:解锁FPGA广阔应用的最后一块拼图

我们为什么需要高层次综合高层次综合(High-levelSynthesis)简称HLS,指的是将高层次语言描述的逻辑结构,自动转换成低抽象级语言描述的电路模型的过程。所谓的高层次语言,包括C、C++...

Xilinx文档编号及其内容索引(部分)

Xilinx文档的数量非常多。即使全职从事FPGA相关工作,没有几年时间不可能对器件特性、应用、注意事项等等有较为全面的了解。本文记录了我自使用Xilinx系列FPGA以来或精读、或翻阅、或查询过的文...

Xilinx Vivado联合Modelsim软件仿真

引言:Xilinx公司Vivado开发软件自带仿真工具,可以实现一般性能的FPGA软件仿真测试,其测试执行效率以及性能都不如第三方专用仿真软件Modelsim强。本文我们介绍下如何进行Vivado20...

体育动画直播是怎么做出来的?从数据到虚拟赛场的科技魔法!

你是否见过这样的比赛直播?没有真实球员,却能看梅西带球突破?足球比赛变成动画版,但数据100%真实?电竞比赛用虚拟形象直播,选手操作实时同步?这就是体育动画直播——一种融合实时数据、游戏引擎和AI的...

Dialogue between CPC and political parties of neighboring countries held in Beijing

BEIJING,May26(Xinhua)--TheCommunistPartyofChina(CPC)inDialoguewithPoliticalPartiesof...