SQL ist nicht ganz einfach zu verstehen, speziell wenn es darum geht mehrere Tabellen mit joins zusammenzufassen bzw zu verknüpfen. Im Folgenden wird dem SQL Einsteiger sehr einfach mit Venn Diagrammen sowie einfachen SQL queries erklärt wie die verschiedenen SQL joins funktionieren. Dazu werden zwei Beispieltabellen mit Daten benutzt und Joins beschrieben sowie deren Eingabedaten und Ergebnisse. Dateien zum Erstellen der Beispieldaten sowie die SQL queries können downloaded werden. Die Beispiele sind für mySQL und DB2.
Auf SQL durch Beispiele lernen befinden sich weitere Beispiele für komplexere Joins sowie andere SQL Funktionen wie views, count, max, subselect uvm.
Zur Einführung werden Venn Diagramme benutzt. Im streng mathematischen Sinne benutzt man Venn Diagramme nur für Mengen und deren Operationen wie Vereinigung, Schnitt, Differenz usw, aber sie sind auch sehr hilfreich um sql joins zu erklären und zu verstehen.
Genaugenommen gibt es vier verschiedene sql joins die man verstehen muss:
1) inner join
2) left/right outer join
3) full outer join
4) karthesisches Produkt
Wenn man Venn Diagramme benutzt um die Joins zu erklären gibt es noch zwei weitere Joins, die Entsprechungen in den Venn Diagrammen haben und das Verständnis von Joins fördern.
5) Left outer join where null
6) Full outer joinwhere null
In den folgenden Venn Diagrammen findet man immer zwei Tabellen TabelleA und TabelleB, die jeweils Zeilen enthalten, in denen Namen und weitere Informationen stehen. Der Join wird immer über die Namen gemacht, d.h. es werden Zeilen in beiden Tabellen gesucht, die gleiche Namen haben und deren Joinergebnisse betrachtet.
Bei den folgenden Beispielen enthalten die Tabellen A und B folgende Spalten und Inhalt:
Jede Tabelle hat einen Schlüssel id, eine Spalte name sowie eine Spalte nation mit der Nationalität der Person sowie eine Spalte table, die entweder A oder B enthält um zu kennzeichnen, in welcher Tabelle die Zeilenstehen, also Tabelle A oder Tabelle B.
Die sql Befehle um die Tabelle anzulegen und zu füllen können hier für mySQL und hier für DB2 runtergeladen werden. Die Queries um die Joins über die Tabelle auszuführen befinden sich hier für mySQL und hier für DB2 zum download.
Tabelle A:
mysql> select * from TableA;
+----+-----------+---------+-------+
| id | name | nation | table |
+----+-----------+---------+-------+
| 1 | Albert | Germany | A |
| 2 | Elizabeth | England | A |
| 3 | Paul | Spain | A |
| 4 | Julia | Denmark | A |
+----+-----------+---------+-------+
Tabelle B:
mysql> select * from TableB;
+----+--------+--------+-------+
| id | name | nation | table |
+----+--------+--------+-------+
| 1 | Marc | China | B |
| 2 | Albert | France | B |
| 3 | Peter | Japan | B |
| 4 | Paul | Poland | B |
+----+--------+--------+-------+
1) Inner join
Bei einem Inner join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind.
mysql> select * from TableA inner join TableB on TableA.name = TableB.name;
+----+--------+---------+-------+----+--------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+----+--------+---------+-------+----+--------+--------+-------+
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
+----+--------+---------+-------+----+--------+--------+-------+
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul.
2) Left outer join
Bei einem left outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus der linken Tabelle, die in diesem Falle Tabelle A ist.
+----+-----------+---------+-------+------+--------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+----+-----------+---------+-------+------+--------+--------+-------+
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| 2 | Elizabeth | England | A | NULL | NULL | NULL | NULL |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
| 4 | Julia | Denmark | A | NULL | NULL | NULL | NULL |
+----+-----------+---------+-------+------+--------+--------+-------+
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der Tabelle B stehen mit NULL gefüllt sind.
3) Full outer join
Bei einem full outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus den beiden Tabellen, diekeine gleichen Elemente haben.
mysql: (Da mysql kein full outer join anbietet wird der full outer join über eine Vereinigung von dem left und right outer join vorgenommen, der dasselbe Ergebnis liefert)
mysql> select * from TableA left join TableB on TableA.name = TableB.name
-> UNION
-> select * from TableA right join TableB on TableA.name = TableB.name;
DB2: (Richtiger full join)
select * from TableA full join TableB on TableA.name = TableB.name;
+------+-----------+---------+-------+------+--------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| 2 | Elizabeth | England | A | NULL | NULL | NULL | NULL |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
| 4 | Julia | Denmark | A | NULL | NULL | NULL | NULL |
| NULL | NULL | NULL | NULL | 1 | Marc | China | B |
| NULL | NULL | NULL | NULL | 3 | Peter | Japan | B |
+------+-----------+---------+-------+------+--------+--------+-------+
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia) sowie die Elemente aus Tabelle B, wo es kein gleichen Namen in Tabelle A gibt (Marc und Peter). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der anderen Tabelle nicht existieren mit NULL gefüllt sind.Bei dem Zusammenfügen (UNION) der beiden Tabellen ist zu berücksichtigen, dass dabei eigentlich die Zeilen, die gleiche Namen in beiden Tabellen haben, in der Ergebniszeile doppelt auftreten, da sie sowohl im left als auch right join enthalten sind. Allerdings entfernt die UNION diese doppelten Elemente. Im folgenden Beispiel wird durch UNION ALL diese Entfernung verhindert. Die Zeilen mit Albert und Paul tauchen zweimal auf.
mysql> select * from TableA left join TableB on TableA.name = TableB.name UNION ALL select * from TableA right join TableB on TableA.name = TableB.name;
+------+-----------+---------+-------+------+--------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| 2 | Elizabeth | England | A | NULL | NULL | NULL | NULL |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
| 4 | Julia | Denmark | A | NULL | NULL | NULL | NULL |
| NULL | NULL | NULL | NULL | 1 | Marc | China | B |
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| NULL | NULL | NULL | NULL | 3 | Peter | Japan | B |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
+------+-----------+---------+-------+------+--------+--------+-------+
4) Cross join - Karthesisches Produkt
In diesem Falle gibt es keine Join Bedingung. Deshalb werden bei diesem join jeweils alle Zeilen der linken Tabelle mit den jeweiligen Zeilen der rechten Tabelle zusammengeführt. D.h. die Ergebnistabelle enthält immer (Anzahl Zeilen TabelleA) * (Anzahl Zeilen TabelleB) Ergebniszeilen. Diese kann bei großen Ausgangstabellen sehr schnell riesige Ergebnistabellen ergeben deren Berechnung sehr zeit- und speicher aufwendig ist und sollte deshalb vermieden werden.
mysql> select * from TableA join TableB;
+----+-----------+---------+-------+----+--------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+----+-----------+---------+-------+----+--------+--------+-------+
| 1 | Albert | Germany | A | 1 | Marc | China | B |
| 2 | Elizabeth | England | A | 1 | Marc | China | B |
| 3 | Paul | Spain | A | 1 | Marc | China | B |
| 4 | Julia | Denmark | A | 1 | Marc | China | B |
| 1 | Albert | Germany | A | 2 | Albert | France | B |
| 2 | Elizabeth | England | A | 2 | Albert | France | B |
| 3 | Paul | Spain | A | 2 | Albert | France | B |
| 4 | Julia | Denmark | A | 2 | Albert | France | B |
| 1 | Albert | Germany | A | 3 | Peter | Japan | B |
| 2 | Elizabeth | England | A | 3 | Peter | Japan | B |
| 3 | Paul | Spain | A | 3 | Peter | Japan | B |
| 4 | Julia | Denmark | A | 3 | Peter | Japan | B |
| 1 | Albert | Germany | A | 4 | Paul | Poland | B |
| 2 | Elizabeth | England | A | 4 | Paul | Poland | B |
| 3 | Paul | Spain | A | 4 | Paul | Poland | B |
| 4 | Julia | Denmark | A | 4 | Paul | Poland | B |
+----+-----------+---------+-------+----+--------+--------+-------+
Man sieht also, dass das Ergebnis alle Zeilen aus der Tabelle A jeweils mit allen Elementen der Tabelle B zusammengefügt hat. Dabei tauchen keine Spalten mit NULL auf.
Eine Darstellung als Venn Diagramm gibt es dafür nicht.
5) Left outer join where null
Bei diesem join werden alle Zeilen aus der Tabelle A mit der Tabelle B zusammengeführt, wo es keine gleichen Elemente gibt. Es entspricht also auch dem left outer join wo der inner join entfernt wurde.
-> WHERE TableB.id is null;
+----+-----------+---------+-------+------+------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+----+-----------+---------+-------+------+------+--------+-------+
| 2 | Elizabeth | England | A | NULL | NULL | NULL | NULL |
| 4 | Julia | Denmark | A | NULL | NULL | NULL | NULL |
+----+-----------+---------+-------+------+------+--------+-------+
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
6) Full outer join where null
Bei diesem join werden alle Zeilen der beiden Tabellen zusammengeführt, wo es keine gleichen Elemente in der anderen Tabelle gibt. Er entspricht also dem full outer join wo der inner join entfernt wurde.
-> UNION
-> select * from TableA right join TableB on TableA.name = TableB.name where TableA.id is null;
+------+-----------+---------+-------+------+-------+--------+-------+
| id | name | nation | table | id | name | nation | table |
+------+-----------+---------+-------+------+-------+--------+-------+
| 2 | Elizabeth | England | A | NULL | NULL | NULL | NULL |
| 4 | Julia | Denmark | A | NULL | NULL | NULL | NULL |
| NULL | NULL | NULL | NULL | 1 | Marc | China | B |
| NULL | NULL | NULL | NULL | 3 | Peter | Japan | B |
+------+-----------+---------+-------+------+-------+--------+-------+
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren und für Namen aus der rechten Tabelle B keine Namen in der linken Tabelle A existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle A und B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
References:
*** Hinweis ***
Kommentare sind erwünscht. Aber um lästige Spamposts abweisen zu können gibt es ein paar Dinge die zu beachten sind: