1 \documentclass[a4paper,10pt]{article}
2 \usepackage[utf8]{inputenc}
6 \usepackage{amsmath, bbm}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
17 \usetikzlibrary{arrows,shapes}
20 \usepackage{mathtools}
22 \geometry{paper=a4paper,margin=25mm}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
47 \tikzstyle{vertex} = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp} = [draw,thick,-]
49 \tikzstyle{compup} = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge} = [draw,thick,-]
52 \tikzstyle{diredge} = [draw,thick,->]
53 \tikzstyle{prob} = [font=\tiny]
55 \tikzstyle{red box} = [draw,-,color=red, top color=red!2,bottom color=red!10]
56 \tikzstyle{blue box} = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
57 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
58 \tikzstyle{gray box} = [draw,-,color=black, top color=black!2,bottom color=black!10]
62 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
63 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
64 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
65 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
66 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
67 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
68 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
69 das hinbekomme bzw. Recht behalte.}
76 \section{Motivation und Einleitung}
78 \subsection{Motivation}\label{sect:motivation}
81 \item Sortiernetzwerke sind toll, weil $\ldots$
82 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
83 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
84 Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
87 \subsection{Einleitung}\label{sect:einleitung}
89 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
91 {\em Komparatoren} sind die Bausteine, die {\em Sortiernetzwerken} zugrunde
92 liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten können.
93 Ausserdem besitzt ein {\em Komparator} zwei Ausgänge, die im Gegensatz zu den
94 Eingängen unterscheidbar sind: Die grö"sere der beiden Zahlen wird immer auf
95 dem einen, die kleinere der beiden Zahlen immer auf dem anderen Ausgang
98 Wenn man nun mehrere {\em Komparatoren} miteinander kombiniert, also die
99 Ausgänge von {\em Komparatoren} mit dem Eingängen anderer {\em Komparatoren}
100 verbindet, erhält man ein {\em Komparatornetzwerk}.
104 \input{images/einfaches_komparatornetzwerk.tex}
106 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
108 \label{fig:einfaches_komparatornetzwerk}
111 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
112 Komparatornetzwerk aus fünf Komparatoren in der üblichen Darstellungsweise:
113 Die horizontalen Linien stellen Leitungen von den Eingängen auf der linken
114 Seite zu den Ausgängen auf er rechten Seite dar. Die vertikalen Pfeile
115 symbolisieren die Komparatoren, die die Werte "`auf den Leitungen"'
116 vergleichen und ggf. vertauschen. Nach einem Komparator befindet sich die
117 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
118 befindet sich auf der Leitung auf der der Pfeil seinen Ursprung hat.
120 Komparatornetzwerke, die für jede beliebige Eingabepermutation eine
121 Ausgabe erzeugen, die der Sortierung der Eingabe entspricht, heißen
122 {\em Sortiernetzwerke}. Das in
123 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
124 ist kein Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ würde zur Ausgabe
125 ${(2, 1, 3, 4)}$ führen -- die bestehenden Sortierung wird also sogar
128 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft
129 {\em nicht} hat, ist mit einem gegebenen Gegenbeispiel also einfach möglich.
130 Dieses Gegenbeispiel zu finden ist allerdings aufwendig.
132 \todo{Wie findet man die Gegenbeispiele? Die {\em Entscheidung}, ob ein
133 Netzwerk sortiert, ist doch NP-vollständig, also müsste doch das Finden eines
134 Gegenbeispiels im Allgemeinen auch exponentialle Laufzeit haben..?}
135 \todo{Wenn die {\em Entscheidung}, ob ein Netzwerk sortiert, NP-vollständig
136 ist, müsse man dann nicht einen Zeugen für die Sortiereigenschaft angeben
141 Um zu überprüfen, ob ein gegebenes Komparatornetzwerk die Sortiereigenschaft
142 besetzt, müssen nicht alle $n!$ Permutationen von $n$~unterschiedlichen Zahlen
143 ausprobieren. Stattdessen reicht es zu überprüfen, dass das Netzwerk alle
144 $2^n$~${0-1}$-Folgen sortiert.
148 \item Ein Komparator-Netzwerk ist $\ldots$
149 \item Ein Komparator-Netzwerk ist ein Sortiernetzwerk, wenn $\ldots$
150 \item Die Frage nach der Sortiereigenschaft ist NP-vollständig.
153 \subsubsection{Evolutionäre Algorithmen}
155 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
156 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
157 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
158 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
159 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
160 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
161 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
162 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
163 praktikablen Zeitkonstanten gefunden werden.
165 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
166 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
167 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
168 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
169 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
170 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
172 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
173 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
174 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
175 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
176 als {\em Individuum} bezeichnet.
178 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
179 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
180 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
181 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
182 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
183 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
184 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
185 werden bessere Lösungen bevorzugt. Zur Bewertung die die sogenannte {\em
188 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
189 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
190 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
191 es oft einfach ist {\em irgendeine} Lösung anzugeben. Zum anderen muss eine
192 Methode für die Rekombination existieren. Das insbesondere dann problematisch
193 wenn {\em Nebenbedingungen} eingehalten werden müssen.
196 \item Unter einem "`Evolutionären Algorithmus"' versteht man $\ldots$
197 \item Da die Sortiereigenschaft zu überprüfen NP-schwer ist, ist die
198 Mutation \textit{(vermutlich)} nicht (effizient) möglich.
201 \section{Bekannte konstruktive Sortiernetzwerke}
203 Übersicht über bekannte konstruktive Sortiernetzwerke.
205 \subsection{Odd-Even-Transpositionsort}
206 \label{sect:odd_even_transpositionsort}
208 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
209 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
210 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
211 Abbildung~\ref{fig:odd_even_transposition_08} zeigt das OET-Netzwerk für
216 \input{images/oe-transposition-8.tex}
218 \caption{Das {\em Odd-Even-Transpositionsort} Netzwerk für acht Eingänge.}
219 \label{fig:odd_even_transposition_08}
222 \subsection{Batcher's Mergesort}
224 Ein Netzwerk von K.~E.~Batcher. Siehe:
225 K.E. Batcher: Sorting Networks and their Applications. Proc. AFIPS Spring
226 Joint Comput. Conf., Vol. 32, 307-314 (1968)
229 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
231 Das Netzwerk basiert auf dem {\em bitonen Mischer}, einem Komparator-Netzwerk,
232 das eine beliebige bitone Folge in eine sortierte Listen umordnen kann. Eine
233 {\em bitone Folge} ist eine monoton steigende Folge gefolgt von einer monoton
234 fallenden Folge, oder ein zyklischer Shift davon.
235 Abbildung~\ref{fig:beispiel-biton} zeigt die vier prinipiellen Möglichkeiten
236 die durch zyklische Shifts entstehen können. Die wichtigsten Varianten für
237 Batcher's Mergesort-Netzwerk zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
238 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
239 eine absteigend sortierte Liste aneinanderhängt. Bei den
240 anderen beiden Formen ist wichtig zu beachten, dass das letzte Element nicht
241 größer (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
242 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
247 \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
248 \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
249 \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
250 \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
251 \caption{Beispiele bitoner Folgen.}
252 \label{fig:beispiel-biton}
257 \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
259 \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
260 \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
261 aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
262 der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
263 resultierenden Teilfolgen sind wiederum biton.}
264 \label{fig:bitonic-merge-schema}
267 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
268 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
269 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
270 sortiert, die Folge $V$ sei absteigend sortiert:
272 u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
273 v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
275 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
276 Positionen verglichen und ggf. vertauscht:
278 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
280 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
281 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
282 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
283 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
284 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
285 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
286 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
287 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass die entstehende Folge aus
288 zwei bitonen Folgen besteht, die rekursiv zusammengeführt werden können.
289 Abbildung~\ref{fig:bitonic-merge-normal} zeigt die Situationen vor und nach
290 diesem Schritt des Mischers.
292 Mit dem bitonen Mischer auch zwei aufsteigend sortierte Folgen sortiert
293 werden. Dazu ist lediglich das "`Umbenennen"' der Leitungen notwendig.
294 Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das Schema des bitonen
295 Mischers für zwei aufsteigend sortierte Foglen. Durch das Umbenennen verändert
296 sich das Muster der Komparatoren ein wenig: Statt an eine Treppe erinnert das
297 Muster nun an einen Trichter.
299 \subsubsection{Batcher's Bitonic-Mergesort-Netzwerk}
301 Das Sortiernetzwerk $S(n)$ mit $n$~Eingängen besteht aus zwei Instanzen von
302 $S(\frac{n}{2})$, dem Netzwerk mit $\frac{n}{2}$~Eingängen und dem bitonen
303 Mischer~$M(n)$. Die Rekursion bricht bei ${n = 1}$~ab --~eine einelementige
304 Liste ist immer sortiert.
305 Das konkrete Netzwerk~$S(8)$ ist in Abbildung~\ref{fig:batcher_08} zu sehen.
306 Eingezeichnet sind ebenfalls die beiden Instanzen des Netzwerks~$S(4)$ (rot)
307 sowie der bitone Mischer~$M(8)$ (blau).
313 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
315 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
316 %$S(n/2)$ und dem Mischer $M(n)$.}
317 %\label{fig:bms_rekursiver_aufbau}
322 \input{images/batcher-8.tex}
324 \caption{$S(8)$, Batcher's {\em bitone Mergesort-Netzwerk} für acht
325 Eingänge. Markiert sind die beiden Instanzen von $S(4)$ (rot), die beiden
326 bitonen Mischer~$M(4)$ (blau) und die Komparatoren, die im letzten rekursiven
327 Schritt hinzugefügt wurden (grün).}
328 \label{fig:batcher_08}
331 \subsection{Odd-Even-Mergesort}
333 Obwohl der Name ähnlich klingt, haben {\em Odd-Even-Mergesort} (OEM) und
334 {\em Odd-Even-Transpositionsort} (OET, siehe
335 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Auch dieses
336 Netzwerk ist von K.~Batcher gefunden worden und wird rekursiv durch einen
337 "`Mischer"' definiert.
339 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
341 Der {\em Odd-Even-Mischer} ist ein Komperatornetzwerk, dass zwei sortierte
342 Folgen zu einer sortierten Ausgabe zusammenfügen kann. Dabei kommt es mit
343 weniger Vergleichen aus als der {\em bitone Mischer}, der im
344 Abschnitt~\ref{sect:der_bitone_mischer} vorgestellt wurde.
346 Der {\em Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
347 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
348 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
349 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
350 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
352 w_i = \left\{ \begin{array}{ll}
361 \input{images/oe-merge.tex}
363 \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
364 bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
365 aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
369 Diese werden jetzt in insgesamt vier sortierte Folgen aufgeteilt, je eine
370 Liste der geraden Indizes und je eine Liste der ungeraden Indizes.
372 U_{\textrm{gerade}} &=& \left(u_0, u_2, u_4, \ldots\right) \\
373 U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
374 V_{\textrm{gerade}} &=& \left(v_0, v_2, u_4, \ldots\right) \\
375 V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
378 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
379 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
380 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
381 Ausgang der Mischer die Folgen
383 W_{\textrm{gerade}} &=& \left(w_0, w_2, w_4, \ldots\right) \\
384 W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
388 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
391 w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
393 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
394 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
396 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
397 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
398 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
399 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
402 \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
403 \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
404 einzelnen Komparator.
407 Dass die resultierende Folge sortiert ist, lässt sich mit dem
408 {\em 0-1-Prinzip} leicht zeigen:
409 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
410 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
411 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
412 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
413 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
414 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
416 \left|W_{\textrm{gerade}}\right|_0
417 &=& \left|U_{\textrm{gerade}}\right|_0
418 + \left|V_{\textrm{gerade}}\right|_0
419 = \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
420 + \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
421 \left|W_{\textrm{ungerade}}\right|_0
422 &=& \left|U_{\textrm{ungerade}}\right|_0
423 + \left|V_{\textrm{ungerade}}\right|_0
424 = \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
425 + \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
427 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
428 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
429 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
430 wenn $W_{\textrm{gerade}}$ $2$~Nullen mehr enthählt als
431 $W_{\textrm{ungerade}}$, muss eine Vertauschung stattfinden, um die Ausgabe zu
432 sortieren. Die jeweiligen Situationen sind in
433 Abbildung~\ref{fig:oe-post-recursive} dargestellt.
437 \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
439 \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
441 \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
442 \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
443 kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
444 Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
445 letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
447 \label{fig:oe-post-recursive}
450 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
452 Auch beim \emph{Odd-Even-Mergesort-Netzwerk} --~wie beim \emph{bitonen
453 Mergesort-Netzwerk}~-- entsteht das Sortiernetzwerk aus dem {\em
454 Odd-Even-Mischer} durch rekursives Anwenden auf einen Teil der Eingabe
455 (üblicherweise die Hälfte der Leitungen) und anschließendes zusammenfügen.
456 Abbildung~\ref{fig:odd_even_mergesort_08} zeigt das Netzwerk für $8$~Eingänge.
460 \input{images/oe-mergesort-8.tex}
462 \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge.}
463 \label{fig:odd_even_mergesort_08}
467 \item Odd-Even-Transpositionsort
468 \item Bitonic-Mergesort
469 \item Odd-Even-Mergesort
470 \item Pairwise sorting-network
473 \section{Transformation von Sortiernetzwerken}
475 \subsection{Komprimieren}
477 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
479 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
480 gleichzeitig ausgewertet werden, wie bereits in
481 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
482 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
483 von \emph{Schichten} verstanden.
485 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
486 Komparatornetzwerken interessant. \dots
488 \subsection{Normalisieren}
492 \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
493 \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
494 \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
495 transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
496 intuitiven Konstruktion und die normalisierte Variante.}
497 \label{fig:beispiel_normalisieren}
500 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
501 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
502 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
503 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
504 einen Algorithmus an.
506 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
507 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
508 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
509 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
510 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
511 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist.
512 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
515 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
516 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
519 \subsection{Zwei Netzwerke kombinieren}
522 \item Mit dem Bitonic-Merge
523 \item Mit dem Odd-Even-Merge
524 \item Nach dem Pairwise sorting-network Schema.
527 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
529 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
530 Sortiernetzwerk mit $(n-1)$~Leitungen verkleinern, indem man eine Leitung
531 entfernt. Zunächst wird angenommen, dass das Minimum oder das Maximum an einem
532 der Eingänge anliegt. Der Weg durch das Netzwerk zum entsprechenden Ausgang
533 ist dadurch fest vorgegeben, insbesondere welche Komparatoren dafür sorgen,
534 dass die Leitung gewechselt wird und welche nicht.
535 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
536 das {\em Odd-Even-Transpositionsort-Netzwerk}.
538 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
539 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
540 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
541 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
542 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
543 ersetzt. Das Resultat zeigt Abbildung~\ref{fig:oe-transposition-cut1}. Wenn
544 man die Maximum-Leitung entfernt (Abbildung~\ref{fig:oe-transposition-cut2}),
545 erhält man ein Sortiernetzwerk für $(n-1)$~Leitungen.
549 \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
550 \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
551 \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
552 \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
553 \caption{Eine Leitung wird aus dem {\em Odd-Even-Transpositionsort} Netzwerk
554 $\textrm{OET}(8)$ entfernt: Auf der rot markierten Leitung wird $\infty$
555 angelegt. Da der Wert bei jedem Komparator am unteren Ende herauskommt, ist
556 der Pfad fest vorgegeben. Da die restlichen Werte trotzdem noch richtig
557 sortiert werden müssen, kann dieser Pfad herausgetrennt werden. In der
558 letzten Abbildung ist $\textrm{OET}(7)$ markiert.}
561 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
562 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
563 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
564 Darstellung ergibt. Ausserdem ist das
565 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
566 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
567 Ausgabe und kann entfernt werden.
574 \section{Der evolutionäre Ansatz}
576 Um einen evolutionären Algorithmus für Sortiernetzwerke zu entwickeln, werden
577 die vorgestellten Methoden kombiniert.
579 \subsection{Bewertungsfunktion}
581 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
582 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
583 die interessant sind:
585 \item Möglichst wenige Komparatoren ("`klein"')
586 \item Möglichst wenige Schichten ("`schnell"')
589 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
590 kleinste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
591 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
594 Eine Gütefunktion, die die beiden Ziele "`klein"' und "`schnell"'
595 berücksichtigen kann, hat die folgende allgemeine Form:
597 \mathit{Guete}(S) = w_{\mathrm{Basis}}
598 + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
599 + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
601 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
602 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
603 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
604 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
605 jegliche Ergebnisse sind dann rein zufälliger Natur.
607 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
608 genommen werden. Ist er groß, wird der relative Unterschied der Güten
609 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
610 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
611 klein, in Abhängigkeit von den anderen beiden Parametern sind auch negative
612 Werte möglich, werden die relativen Unterschiede groß. Dadurch wird die {\em
613 Exploitation}, das Finden lokaler Optima, bevorzugt.
615 \subsection{Selektion}
619 \subsection{Rekombination}
621 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
622 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
623 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
624 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
625 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
626 Anschließend entfernen wir zufällig $n$~Leitungen wie in
627 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
629 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
632 \subsection{Mutation}
634 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
635 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
636 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
637 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
638 Eigenschaft zerstören.
640 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
641 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
642 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
643 Ausprobieren aller $2^n$~Bitmuster.
645 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
646 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
647 Population überprüft das Programm die Notwendigkeit jedes einzelnen
648 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
649 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
652 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
653 Schichten, kobiniert)
654 \item Rekombination: Merge Anhängen und Leitungen entfernen.
657 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
658 Abbildung~\ref{fig:evolutionary_08}.
662 \input{images/evolutionary-08.tex}
664 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
665 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
666 \label{fig:evolutionary_08}
671 \input{images/08-e2-1237993371.tex}
673 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
674 \label{fig:08-e2-1237993371}
679 \input{images/09-e2-1237997073.tex}
681 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
682 \label{fig:09-e2-1237997073}
687 \input{images/09-e2-1237999719.tex}
689 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
690 \label{fig:09-e2-1237999719}
695 \input{images/10-e2-1239014566.tex}
697 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
698 \label{fig:10-e2-1239014566}
704 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
705 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
708 \subsection{Vom evolutionären Algorithmus zu einer Markov-Kette}
711 \item Kombiniere immer das aktuelle Netzwerk mit sich selbst.
712 \item Kann die Mindestgüte immernoch erreicht werden? ({\em Ich denke schon.})
713 \item Anzahl der erreichbaren Sortiernetzwerke.
716 %\input{shmoo-aequivalenz.tex}
718 \section{Optimierung der Schnitte}
720 Der \emph{evolution-cut}-Algorithmus nimmt ein gegebenes Sortiernetzwerk mit
721 $n$~Leitungen und sucht die beste Sequenz von $c$~Min- und Max-Schnitten um
722 ein ${(n-c)}$-Sortiernetzwerk zu erhalten.
724 Bei diesem Algorithmus werden die \emph{Schnitt-Sequenzen} als Individuen
725 verwendet. Eine \emph{Schnitt-Sequenz} ist eine Liste mit $c$~Schnitten, die
726 jeweils durch die Start-Leitung und die Richtung \textit{Min} beziehungsweise
727 \textit{Max} gegeben ist. Der Algorithmus wendet jeden Schnitt einzeln an, so
728 dass eine Leitungsnummer mehrfach in einer Schnittsequenz vorkommen kann. Die
729 höchste zulässige Leitungsnummer ist abhängig von der Position des Schnitts in
730 der Sequenz. Der Schnitt an Position~$i$ darf höchstens die
731 Leitungsnummer~${n-i-1}$ enthalten.\footnote{Die niedrigste Leitungsnummer ist
732 $0$, die höchste Leitungsnummer eines $n$-Sortiernetzwerks ist $n-1$.}
734 Um zwei Individuen zu rekombinieren werden die ersten $r$~Schnitte der einen
735 Schnitt-Sequenz verwendet und die letzten ${c-r}$~Schnitte der zweiten
736 Sequenz. $r$ ist eine Zufallsvariable mit $0 \leqq r \leqq c$.
738 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
739 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
744 \input{images/16-ec-1277186619.tex}
746 \caption{{\tt images/16-ec-1277186619.tex}: Sortiernetzwerk mit 16~Leitungen
747 und 68~Komparatoren in 10~Schichten. Das Netzwerk wurde von dem Algorithmus
748 \emph{evolution-cut} aus dem Bitonic-Mergesort-Netzwerk $M(32)$ durch
749 16~Schnitte erzeugt.}
750 \label{fig:16-ec-1277186619}
753 Wendet man den \emph{evolution-cut}-Algorithmus auf das
754 Bitonic-Mergesort-Netzwerk $M(n)$ an und setzt die Anzahl der Schnitte~$c$ auf
755 $\frac{n}{2}$, so erhält man Sortiernetzwerke, die weniger Komparatoren
756 benötigen als $M(\frac{n}{2})$.
758 Das Sortiernetzwerk in Abbildung~\ref{fig:16-ec-1277186619} ist entstanden,
759 indem der Algorithmus \emph{evolution-cut} auf das $M(32)$-Sortiernetzwerk
760 angewendet wurde. Der Algorithmus fand eine Schnitt-Sequenz aus 16~Schnitten,
761 die ein Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in 10~Schichten
762 erzeugt. Das $M(16)$-Sortiernetzwerk besteht aus 80~Komparatoren in
765 Dieses Ergebnis deckt sich mit dem Sortiernetzwerk, dass
766 \emph{Moritz Mühlenthaler} und \emph{Rolf Wanka} in ihrer Veröffentlichung
767 „Improving Bitonic Sorting by Wire Elimination“ vorstellen. Sie verwenden
768 Schnitte, um Komparatoren beim bitonen $(n,n)$-Mischer enizusparen. Ein
769 sukzessive aus optimieren Mischern aufgebautes Sortiernetzwerk spart
770 --~verglichen mit dem Bitonic-Mergesort-Netzwerk~-- $\frac{1}{4}n(\log n - 1)$
771 Komparatoren ein. Bei einem Sortiernetzwerk mit 16~Leitungen also
772 12~Komparatoren -- 68 statt 80.
776 \input{images/32-ec-1277190372.tex}
778 \caption{{\tt images/32-ec-1277190372.tex}: Sortiernetzwerk mit 32~Leitungen
779 und 206~Komparatoren in 15~Schichten. Das Netzwerk wurde von dem Algorithmus
780 \emph{evolution-cut} aus dem Bitonic-Mergesort-Netzwerk $M(64)$ durch
781 32~Schnitte erzeugt.}
782 \label{fig:32-ec-1277190372}
785 Abbildung~\ref{fig:32-ec-1277190372} zeigt ein 32-Sortiernetzwerk, dass vom
786 \emph{evolution-cut}-Algorithmus aus dem $M(64)$-Netzwerk erzeugt wurde. Es
787 besteht aus 206~Komparatoren in 15~Schichten -- 34~Komparatoren weniger als
788 $M(32)$ und zwei Komparatoren weniger als das Netzwerk, das nach Mühlenthaler
789 und Wankas Methode konstruiert wird. Die Anzahl der Schichten ist bei allen
792 \textbf{TODO:} $M(128) \rightarrow n=64$: 584~Komparatoren in 21~Schichten
793 möglich (nach ca. 600k Iterationen). Moritz und Rolf: $672-80=592$
794 Komparatoren; $M(64)$: 672~Komparatoren.
862 % images/32-ec-1277190372.tex
864 \section{Empirische Beobachtungen}
867 \item So schnell konvergiert der Algorithmus.
873 Das würde mir noch einfallen$\ldots$
875 %\bibliography{references}
876 %\bibliographystyle{plain}
882 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :