[Bài đọc] Câu lệnh JOIN

Tổng quan

Mệnh đề JOIN được sử dụng để kết hợp các hàng từ hai hay nhiều bảng, dựa trên cột liên quan giữa chúng. JOIN gồm 3 loại cơ bản INNER JOIN, LEFT JOIN, SELF JOIN.

INNER JOIN

Mệnh đề INNER JOIN khớp các hàng trong một bảng với các hàng trong các bảng khác và cho phép bạn truy vấn các hàng có chứa các cột từ cả hai bảng. Nó cũng là một phần tùy chọn của câu lệnh SELECT, xuất hiện ngay sau mệnh đề FROM.

Trước khi sử dụng mệnh đề INNER JOIN, bạn phải xác định các tiêu chí sau:

  • Xác định bảng chính xuất hiện trong mệnh đề FROM.
  • Chỉ định bảng kết hợp với bản chính sẽ xuất hiện trong mệnh đề INNER JOIN.
  • Chỉ định điều kiện nối. Điều kiện nối xuất hiện sau từ khóa ON của mệnh đề INNER JOIN và là quy tắc để kết hợp các hàng giữa bảng chính và các bảng khác.
Cú pháp:
SELECT column_name(s) FROM t1 
INNER JOIN t2 ON join_condition1
INNER JOIN t3 ON join_condition2
…
WHERE conditions

Với:

  • colum_name danh sách các cột sẽ hiển thị
  • t1, t2, t3 là các bảng
  • join_condition1, join_condition2 là các điều kiện kết nối.

Hãy đơn giản hóa cú pháp ở trên bằng cách giả sử dụng mệnh đề INNER JOIN để kết nối hai bảng t1, t2.

SELECT column_name(s) FROM t1
INNER JOIN t2 ON t1.column_name = t2.column_name

Đối với mỗi hàng trong bảng t1, mệnh đề INNER JOIN so sánh nó với mỗi hàng của bảng t2 để kiểm tra nếu cả hai thỏa mãn điều kiện nối. Khi điều kiện kết nối được khớp, nó sẽ trả lại hàng kết hợp các cột trong cả hai bảng t1 và t2.

Lưu ý rằng các hàng trong cả hai bảng t1 và t2 phải được kết hợp dựa trên điều kiện nối. Nếu không tìm thấy phù hợp, truy vấn sẽ trả về một tập kết quả trống. Logic này cũng được áp dụng nếu chúng ta tham gia nhiều hơn 2 bảng.

Sơ đồ Venn sau minh hoạ cách mệnh đề INNER JOIN hoạt động. Các hàng trong bộ kết quả phải xuất hiện trong cả hai bảng: t1 và t2.

Quan sát 2 bảng product và productlines.

Bây giờ, nếu bạn muốn lấy productcode, productname và buyprice từ bảng products, textdescription từ bảng productlines với điều kiện giá mua nằm trong khoảng từ 56.76 đến 95.59. Bạn cần chọn dữ liệu từ cả hai bảng và đối chiếu các hàng bằng cách so sánh cột productline từ bảng sản phẩm với cột productline từ bảng productlines dưới dạng truy vấn sau:

SELECT productCode,productName, buyprice, textDescription
FROM products
INNER JOIN productlines
ON products.productline = productlines.productline
WHERE buyprice > 56.76 AND buyprice < 95.59

Trong câu lệnh trên đối với mỗi hàng trong bảng products, mệnh đề inner join so sanh nó với mỗi hàng của bảng productlines để kiểm tra nếu cả hai thỏa mãn điều kiện nối (ON products.productline = productlines.productline). Khi điều kiện kết nối được khớp, nó sẽ trả lại hàng kết hợp các cột trong cả hai bảng products và productlines.

Mệnh để where để hạn chế dữ liệu trả về, toán tử and để kết hợp nếu hai điều kiện buyprice > 56.76 và buyprice < 95.59 cùng đúng. 

Kết quả trả về:

Tránh lỗi trùng cột lấy ra trong lệnh select.

Nếu bạn kết nối nhiều bảng có cùng tên cột, trước mỗi cột trong lệnh truy vấn bạn phải xác định cột đó được lấy ra từ bảng nào.

Ví dụ, nếu cả hai bảng T1 và T2 có cùng một cột có tên C trong mệnh đề SELECT, bạn phải tham khảo cột C sử dụng bảng phân loại như T1.C hoặc T2.C.

LEFT JOIN

Mệnh đề LEFT JOIN cho phép bạn truy vấn dữ liệu từ hai hay nhiều bảng trong cơ sở dữ liệu. Mệnh đề này là một phần tùy chọn của câu lệnh SELECT, xuất hiện sau mệnh đề FROM.

Giả sử rằng chúng ta sẽ truy vấn dữ liệu từ hai bảng t1 và t2. Câu lệnh sau mô tả cú pháp của mệnh đề LEFT JOIN nối hai bảng:

SELECT column_name(s) FROM t1 
LEFT JOIN t2 
ON t1.column_name = t2.column_name

Khi chúng ta nối bảng t1 vào bảng t2 bằng cách sử dụng mệnh đề LEFT JOIN, nếu một hàng từ bảng bên trái t1 khớp với một hàng từ bảng t2 bên phải dựa trên điều kiện nối (t1.column_name = t2.column_name), hàng này sẽ bao gồm trong tập kết quả.

Trong trường hợp hàng trong bảng bên trái không khớp với hàng trong bảng bên phải, hàng trong bảng bên trái cũng được chọn và kết hợp với hàng “giả” từ bảng bên phải. Hàng giả chứa các giá trị NULL cho tất cả các cột tương ứng trong mệnh đề SELECT.

Nói cách khác, mệnh đề LEFT JOIN cho phép bạn chọn các hàng từ cả hai bảng bên trái và bên phải khớp với tất cả các hàng từ bảng bên trái (t1) ngay cả khi không có kết quả tìm thấy trong bảng bên phải (t2).

Sơ đồ Venn sau đây giúp bạn hình dung mệnh đề LEFT JOIN hoạt động như thế nào. Giao điểm giữa hai vòng tròn là các hàng phù hợp trong cả hai bảng và phần còn lại của vòng tròn bên trái là các hàng trong bảng t1 không có bất kỳ hàng nào phù hợp trong bảng t2. Tất cả các hàng trong bảng bên trái được bao gồm trong tập hợp kết quả.

Quan sát 2 bảng customers và orders trong csdl classicmodels.

Trong sơ đồ cơ sở dữ liệu ở trên:

  • Mỗi đơn đặt hàng trong bảng đặt hàng phải thuộc về một khách hàng trong bảng khách hàng.
  • Mỗi khách hàng trong bảng khách hàng có thể có không hoặc nhiều đơn hàng trong bảng đặt hàng.

Để tìm tất cả các đơn hàng thuộc từng khách hàng, bạn có thể sử dụng mệnh đề LEFT JOIN như sau:

SELECT customers.customerNumber, customers.customerName, orders.orderNumber, orders.status
FROM customers
LEFT JOIN orders
ON customers.customerNumber = orders.customerNumber

 Kết quả trả về

SELF JOIN

Khi một bảng được nối với chính nó gọi là SELF JOIN. Sử dụng SELF JOIN khi bạn muốn kết hợp các hàng với các hàng khác trong cùng một bảng. Để thực hiện các hoạt động tự gia nhập, bạn phải sử dụng một “bí danh bảng” để giúp phân biệt bảng bên trái từ bảng bên phải của cùng một bảng. 

Cú pháp: 

SELECT column_name(s) FROM table1 t1, table1 t2 
WHERE condition

Hãy xem một ví dụ sau: Trong bảng nhân viên không chỉ lưu thông tin về nhân viên, cột reportsto được sử dụng để xác định mã người quản lý của nhân viên.

Để biết được nhân viên nào do ai quản lý thực hiệ truy vấn sau:

SELECT CONCAT(m.lastname,', ',m.firstname) AS 'Manager',
       CONCAT(e.lastname,', ',e.firstname) AS 'Direct report'
FROM employees e
INNER JOIN employees m ON m.employeeNumber = e.reportsto
ORDER BY manager;

Trong lệnh trên:

  • concat(s1, s2) là hàm để nối hai chuỗi thành một chuỗi.
  • e là bí danh thứ nhất của bảng employees
  • m là bí danh thứ hai của bảng employees

Kết quả trả về sau khi thực hiện truy vấn:

Vậy trong hướng dẫn này, bạn được biết về cách sử dụng toán tử mênh đề INNER JOIN, LEFT JOIN, SELF JOIN để kết hợp hai hay nhiều bảng.

Leave a Reply

Your email address will not be published.