百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

深入解析MySQL:连接查询的原理和应用

bigegpt 2025-02-18 10:38 9 浏览

概述

MySQL最强大的功能之一就是能在数据检索的执行中连接(join)表。大部分的单表数据查询并不能满足我们的需求,这时候我们就需要连接一个或者多个表,并通过一些条件过滤筛选出我们需要的数据。

了解MySQL连接查询之前我们先来理解下笛卡尔积的原理。

数据准备

依旧使用上节的表数据(包含classes 班级表和students 学生表):

 1 mysql> select * from classes;
 2 +---------+-----------+
 3 | classid | classname |
 4 +---------+-----------+
 5 |       1 | 初三一班  |
 6 |       2 | 初三二班  |
 7 |       3 | 初三三班  |
 8 |       4 | 初三四班  |
 9 +---------+-----------+
10 4 rows in set
11 
12 mysql> select * from students;
13 +-----------+-------------+-------+---------+
14 | studentid | studentname | score | classid |
15 +-----------+-------------+-------+---------+
16 |         1 | brand       | 97.5  |       1 |
17 |         2 | helen       | 96.5  |       1 |
18 |         3 | lyn         | 96    |       1 |
19 |         4 | sol         | 97    |       1 |
20 |         7 | b1          | 81    |       2 |
21 |         8 | b2          | 82    |       2 |
22 |        13 | c1          | 71    |       3 |
23 |        14 | c2          | 72.5  |       3 |
24 |        19 | lala        | 51    |       0 |
25 +-----------+-------------+-------+---------+
26 9 rows in set 

笛卡尔积

笛卡尔积:也就是笛卡尔乘积,假设两个集合A和B,笛卡尔积表示A集合中的元素和B集合中的元素任意相互关联产生的所有可能的结果。

比如A中有m个元素,B中有n个元素,A、B笛卡尔积产生的结果有m*n个结果,相当于循环遍历两个集合中的元素,任意组合。

笛卡尔积在SQL中的实现方式既是交叉连接(Cross Join)。所有连接方式都会先生成临时笛卡尔积表,笛卡尔积是关系代数里的一个概念,表示两个表中的每一行数据任意组合。

所以上面的表就是 4(班级表)* 9(学生表) = 36条数据;

笛卡尔积语法格式:

1 select cname1,cname2,... from tname1,tname2,...;
2 or
3 select cname from tname1 join tname2 [join tname...];

图例表示:

上述两个表实际执行结果如下:

 1 mysql> select * from classes a,students b order by a.classid,b.studentid;
 2 +---------+-----------+-----------+-------------+-------+---------+
 3 | classid | classname | studentid | studentname | score | classid |
 4 +---------+-----------+-----------+-------------+-------+---------+
 5 |       1 | 初三一班  |         1 | brand       | 97.5  |       1 |
 6 |       1 | 初三一班  |         2 | helen       | 96.5  |       1 |
 7 |       1 | 初三一班  |         3 | lyn         | 96    |       1 |
 8 |       1 | 初三一班  |         4 | sol         | 97    |       1 |
 9 |       1 | 初三一班  |         7 | b1          | 81    |       2 |
10 |       1 | 初三一班  |         8 | b2          | 82    |       2 |
11 |       1 | 初三一班  |        13 | c1          | 71    |       3 |
12 |       1 | 初三一班  |        14 | c2          | 72.5  |       3 |
13 |       1 | 初三一班  |        19 | lala        | 51    |       0 |
14 |       2 | 初三二班  |         1 | brand       | 97.5  |       1 |
15 |       2 | 初三二班  |         2 | helen       | 96.5  |       1 |
16 |       2 | 初三二班  |         3 | lyn         | 96    |       1 |
17 |       2 | 初三二班  |         4 | sol         | 97    |       1 |
18 |       2 | 初三二班  |         7 | b1          | 81    |       2 |
19 |       2 | 初三二班  |         8 | b2          | 82    |       2 |
20 |       2 | 初三二班  |        13 | c1          | 71    |       3 |
21 |       2 | 初三二班  |        14 | c2          | 72.5  |       3 |
22 |       2 | 初三二班  |        19 | lala        | 51    |       0 |
23 |       3 | 初三三班  |         1 | brand       | 97.5  |       1 |
24 |       3 | 初三三班  |         2 | helen       | 96.5  |       1 |
25 |       3 | 初三三班  |         3 | lyn         | 96    |       1 |
26 |       3 | 初三三班  |         4 | sol         | 97    |       1 |
27 |       3 | 初三三班  |         7 | b1          | 81    |       2 |
28 |       3 | 初三三班  |         8 | b2          | 82    |       2 |
29 |       3 | 初三三班  |        13 | c1          | 71    |       3 |
30 |       3 | 初三三班  |        14 | c2          | 72.5  |       3 |
31 |       3 | 初三三班  |        19 | lala        | 51    |       0 |
32 |       4 | 初三四班  |         1 | brand       | 97.5  |       1 |
33 |       4 | 初三四班  |         2 | helen       | 96.5  |       1 |
34 |       4 | 初三四班  |         3 | lyn         | 96    |       1 |
35 |       4 | 初三四班  |         4 | sol         | 97    |       1 |
36 |       4 | 初三四班  |         7 | b1          | 81    |       2 |
37 |       4 | 初三四班  |         8 | b2          | 82    |       2 |
38 |       4 | 初三四班  |        13 | c1          | 71    |       3 |
39 |       4 | 初三四班  |        14 | c2          | 72.5  |       3 |
40 |       4 | 初三四班  |        19 | lala        | 51    |       0 |
41 +---------+-----------+-----------+-------------+-------+---------+
42 36 rows in set 

这样的数据肯定不是我们想要的,在实际应用中,表连接时要加上限制条件,才能够筛选出我们真正需要的数据。

我们主要的连接查询有这几种:内连接、左(外)连接、右(外)连接,下面我们一 一来看。

内连接查询 inner join

语法格式:

1 select cname from tname1 inner join tname2 on join condition;
2 或者
3 select cname from tname1 join tname2 on join condition;
4 或者
5 select cname from tname1,tname2 [where join condition];

说明:在笛卡尔积的基础上加上了连接条件,组合两个表,返回符合连接条件的记录,也就是返回两个表的交集(阴影)部分。如果没有加上这个连接条件,就是上面笛卡尔积的结果。

 1 mysql> select a.classname,b.studentname,b.score from classes a inner join students b on a.classid = b.classid;
 2 +-----------+-------------+-------+
 3 | classname | studentname | score |
 4 +-----------+-------------+-------+
 5 | 初三一班  | brand       | 97.5  |
 6 | 初三一班  | helen       | 96.5  |
 7 | 初三一班  | lyn         | 96    |
 8 | 初三一班  | sol         | 97    |
 9 | 初三二班  | b1          | 81    |
10 | 初三二班  | b2          | 82    |
11 | 初三三班  | c1          | 71    |
12 | 初三三班  | c2          | 72.5  |
13 +-----------+-------------+-------+
14 8 rows in set

从上面的数据可以看出 ,初三四班 classid = 4,因为没有关联的学生,所以被过滤掉了;lala 同学的classid=0,没法关联到具体的班级,也被过滤掉了,只取两表都有的数据交集

 1 mysql> select a.classname,b.studentname,b.score from classes a,students b where a.classid = b.classid and a.classid=1;
 2 +-----------+-------------+-------+
 3 | classname | studentname | score |
 4 +-----------+-------------+-------+
 5 | 初三一班  | brand       | 97.5  |
 6 | 初三一班  | helen       | 96.5  |
 7 | 初三一班  | lyn         | 96    |
 8 | 初三一班  | sol         | 97    |
 9 +-----------+-------------+-------+
10 4 rows in set 

查找1班同学的成绩信息,上面语法格式的第三种,这种方式简洁高效,直接在连接查询的结果后面进行Where条件筛选。

左连接查询 left join

left join on / left outer join on,语法格式:

1 select cname from tname1 left join tname2 on join condition;

说明: left join 是left outer join的简写,全称是左外连接,外连接中的一种。 左(外)连接,左表(classes)的记录将会全部出来,而右表(students)只会显示符合搜索条件的记录。右表无法关联的内容均为null。

 1 mysql> select a.classname,b.studentname,b.score from classes a left join students b on a.classid = b.classid;
 2 +-----------+-------------+-------+
 3 | classname | studentname | score |
 4 +-----------+-------------+-------+
 5 | 初三一班  | brand       | 97.5  |
 6 | 初三一班  | helen       | 96.5  |
 7 | 初三一班  | lyn         | 96    |
 8 | 初三一班  | sol         | 97    |
 9 | 初三二班  | b1          | 81    |
10 | 初三二班  | b2          | 82    |
11 | 初三三班  | c1          | 71    |
12 | 初三三班  | c2          | 72.5  |
13 | 初三四班  | NULL        | NULL  |
14 +-----------+-------------+-------+
15 9 rows in set

从上面结果中可以看出,初三四班无法找到对应的学生,所以后面两个字段使用null标识。

右连接查询 right join

right join on / right outer join on,语法格式:

1 select cname from tname1 right join tname2 on join condition;

说明:right join是right outer join的简写,全称是右外连接,外连接中的一种。与左(外)连接相反,右(外)连接,左表(classes)只会显示符合搜索条件的记录,而右表(students)的记录将会全部表示出来。左表记录不足的地方均为NULL。

 1 mysql> select a.classname,b.studentname,b.score from classes a right join students b on a.classid = b.classid;
 2 +-----------+-------------+-------+
 3 | classname | studentname | score |
 4 +-----------+-------------+-------+
 5 | 初三一班  | brand       | 97.5  |
 6 | 初三一班  | helen       | 96.5  |
 7 | 初三一班  | lyn         | 96    |
 8 | 初三一班  | sol         | 97    |
 9 | 初三二班  | b1          | 81    |
10 | 初三二班  | b2          | 82    |
11 | 初三三班  | c1          | 71    |
12 | 初三三班  | c2          | 72.5  |
13 | NULL      | lala        | 51    |
14 +-----------+-------------+-------+
15 9 rows in set

从上面结果中可以看出,lala同学无法找到班级,所以班级名称字段为null。

连接查询+聚合函数

使用连接查询的时候,经常会配合使用聚集函数来进行数据汇总。比如在上面的数据基础上查询出每个班级的人数和平均分数、班级总分数。

 1 mysql> select a.classname as '班级名称',count(b.studentid) as '总人数',sum(b.score) as '总分',avg(b.score) as '平均分' 
 2 from classes a inner join students b on a.classid = b.classid 
 3 group by a.classid,a.classname;
 4 +----------+--------+--------+-----------+
 5 | 班级名称 | 总人数 | 总分   | 平均分    |
 6 +----------+--------+--------+-----------+
 7 | 初三一班 |      4 | 387.00 | 96.750000 |
 8 | 初三二班 |      2 | 163.00 | 81.500000 |
 9 | 初三三班 |      2 | 143.50 | 71.750000 |
10 +----------+--------+--------+-----------+
11 3 rows in set 

这边连表查询的同时对班级(classid,classname)做了分组,并输出每个班级的人数、平均分、班级总分。

连接查询附加过滤条件

使用连接查询之后,大概率会对数据进行在过滤筛选,所以我们可以在连接查询之后再加上where条件,比如我们根据上述的结果只取出一班的同学信息。

 1 mysql> select a.classname,b.studentname,b.score from classes a inner join students b on a.classid = b.classid where a.classid=1;
 2 +-----------+-------------+-------+
 3 | classname | studentname | score |
 4 +-----------+-------------+-------+
 5 | 初三一班  | brand       | 97.5  |
 6 | 初三一班  | helen       | 96.5  |
 7 | 初三一班  | lyn         | 96    |
 8 | 初三一班  | sol         | 97    |
 9 +-----------+-------------+-------+
10 4 rows in set 

如上,只输出一班的同学,同理,可以附件 limit 限制,order by排序等操作。

总结

1、连接查询必然要带上连接条件,否则会变成笛卡尔乘积数据,使用不正确的联结条件,也将返回不正确的数据。

2、SQL规范推荐首选INNER JOIN语法。但是连接的几种方式本身并没有明显的性能差距,性能的差距主要是由数据的结构、连接的条件,索引的使用等多种条件综合决定的。

我们应该根据实际的业务场景来决定,比如上述数据场景:如果要求返回返回有学生的班级就使用 inner join;如果必须输出所有班级则使用left join;如果必须输出所有学生,则使用right join。

3、性能上的考虑,MySQL在运行时会根据关联条件处理连接的表,这种处理可能是非常耗费资源的,连接的表越多,性能下降越厉害。所以要分析去除那些不必要的连接和不需要显示的字段。

之前我的项目团队在优化旧的业务代码时,发现随着业务的变更,某些数据不需要显示,对应的某个连接也不需要了,去掉之后,性能较大提升。


为帮助开发者们提升面试技能、有机会入职BATJ等大厂公司,特别制作了这个专辑——这一次整体放出。

大致内容包括了: Java 集合、JVM、多线程、并发编程、设计模式、Spring全家桶、Java、MyBatis、ZooKeeper、Dubbo、Elasticsearch、Memcached、MongoDB、Redis、MySQL、RabbitMQ、Kafka、Linux、Netty、Tomcat等大厂面试题等、等技术栈!

欢迎大家关注公众号【Java烂猪皮】,回复【666】,获取以上最新Java后端架构VIP学习资料以及视频学习教程,然后一起学习,一文在手,面试我有。

每一个专栏都是大家非常关心,和非常有价值的话题,如果我的文章对你有所帮助,还请帮忙点赞、好评、转发一下,你的支持会激励我输出更高质量的文章,非常感谢!

相关推荐

Linux 系统启动完整流程

一、启动系统流程简介如上图,简述系统启动的大概流程:1:硬件引导UEFi或BIOS初始化,运行POST开机自检2:grub2引导阶段系统固件会从MBR中读取启动加载器,然后将控制权交给启动加载器GRU...

超专业解析!10分钟带你搞懂Linux中直接I/O原理

我们先看一张图:这张图大体上描述了Linux系统上,应用程序对磁盘上的文件进行读写时,从上到下经历了哪些事情。这篇文章就以这张图为基础,介绍Linux在I/O上做了哪些事情。文件系统什么是...

linux入门系列12--磁盘管理之分区、格式化与挂载

前面系列文章讲解了VI编辑器、常用命令、防火墙及网络服务管理,本篇将讲解磁盘管理相关知识。本文将会介绍大量的Linux命令,其中有一部分在“linux入门系列5--新手必会的linux命令”一文中已经...

Linux环境下如何设置多个交叉编译工具链?

常见的Linux操作系统都可以通过包管理器安装交叉编译工具链,比如Ubuntu环境下使用如下命令安装gcc交叉编译器:sudoapt-getinstallgcc-arm-linux-gnueab...

可算是有文章,把Linux零拷贝技术讲透彻了

阅读本文大概需要6.0分钟。作者:卡巴拉的树链接:https://dwz.cn/BaQWWtmh本文探讨Linux中主要的几种零拷贝技术以及零拷贝技术适用的场景。为了迅速建立起零拷贝的概念...

linux软链接的创建、删除和更新

大家都知道,有的时候,我们为了省下空间,都会使用链接的方式来进行引用操作。同样的,在系统级别也有。在Windows系列中,我们称其为快捷方式,在Linux中我们称其为链接(基本上都差不多了,其中可能...

Linux 中最容易被黑客动手脚的关键目录

在Linux系统中,黑客攻击后常会针对关键目录和文件进行修改以实现持久化、提权或隐藏恶意活动。本文介绍下黑客最常修改的目录及其手法。一、/etc目录关键文件有:/etc/passwd和/et...

linux之间传文件命令之Rsync傻瓜式教程

1.前言linux之间传文件命令用什么命令?本文介绍一种最常用,也是功能强大的文件同步和传输工具Rsync,本文提供详细傻瓜式教程。在本教程中,我们将通过实际使用案例和最常见的rsync选项的详细说...

Linux下删除目录符号链接的方法

技术背景在Linux系统中,符号链接(symlink)是一种特殊的文件,它指向另一个文件或目录。有时候,我们可能需要删除符号链接,但保留其指向的目标目录。然而,在删除符号链接时可能会遇到一些问题,例如...

阿里云国际站注册教程:aa云服务器怎么远程链接?

在全球化的今天,互联网带给我们无以计数的便利,而云服务器则是其中的重要基础设施之一。这篇文章将围绕阿里云国际站注册、aa云服务器如何远程链接,以及服务器安全防护如Ddos防火墙、网站应用防护waf防火...

Linux 5.16 网络子系统大范围升级 多个新适配器驱动加入

Linux在数据中心中占主导地位,因此每个内核升级周期的网络子系统变化仍然相当活跃。Linux5.16也不例外,周一最新与网络相关的更新加入了大量的驱动和新规范的支持。一个较新硬件的驱动是Realt...

搭建局域网文件共享服务(Samba),手机电脑都能看喜欢的影视剧

作为一名影视爱好者,为了方便地观看自己喜欢的影视作品,在家里搞一个专门用来存放电影的服务器是有必要的。蚁哥选则用一台Ubuntu系统的电脑做为服务器,共享影音文件,其他同一个局域网内的电脑或手机可以...

分享一个实用脚本—centos7系统巡检

概述这周闲得慌,就根据需求写了差不多20个脚本(部分是之前分享过的做了一些改进),今天主要分享一个给平时运维人员用的centos7系统巡检的脚本,或者排查问题检查系统情况也可以用..实用脚本#!/bi...

Linux 中创建符号链接的方法

技术背景在Linux系统里,符号链接(SymbolicLink),也被叫做软链接(SoftLink),是一种特殊的文件,它指向另一个文件或者目录。符号链接为文件和目录的管理带来了极大的便利,比...

一文掌握 Linux 符号链接

符号链接(SymbolicLink),通常被称为“软链接”,是Linux文件系统中一种强大而灵活的工具。它允许用户创建指向文件或目录的“快捷方式”,不仅简化了文件管理,还在系统配置、软件开发和日...