Die digitale Datenverarbeitung wird auch für Lebenswissenschaftler immer wichtiger. Hier setzt dieser Schnellkurs an. Röbbe Wünschiers erklärt Ihnen, wie Sie mit Sequenz-, Struktur- und anderen Daten umgehen sollten. Er erläutert, wie Sie Linux als virtuelle Maschine installieren und wie Ihnen Linuxtools wie Sed oder die einfache Programmiersprache AWK bei der Datenanalyse helfen können. Außerdem führt er Sie knapp in weitere Bereiche ein, die Ihnen das digitale Leben erleichtern können: das Datenbanksystem MariaDB/MySQL, die Programmierumgebung R für statistisches Rechnen und Datenvisualisierung, die Textsatzsprache LaTeX und einiges mehr. Ausgearbeitete Beispiele aus den Lebenswissenschaften und Übungsaufgaben samt Lösungen helfen Ihnen Ihr Wissen zu festigen und zu überprüfen. Auf der Webseite datenmassen.de finden sich alle Daten und Abbildungen zum Download.
Robbe Wunschiers studierte Biologie in Marburg und promovierte ebenda. Er habilitierte sich 2006 in Koln und arbeitete bis 2009 bei der BASF. Seit 2009 ist er Professor fur Biochemie und Molekularbiologie an der Hochschule Mittweida.
Vorwort von Michael Bölker 13
Vorwort von Diethard Tautz 15
Vorwort des Autors 17
1 Einleitung 19
1.1 Was Sie über Bioinformatik wissen sollten 19
1.2 Meine Leser 27
1.3 Notwendiges Vorwissen 28
1.4 Ziel des Buches 29
1.5 README 34
1.6 Was bedeutet was 35
I Vorbereiten
2 Lebenswissenschaften und Daten 37
2.1 Sequenzdaten 38
2.2 Strukturdaten 42
2.3 Andere Daten 42
3 Daten und Linux 43
3.1 Wer oder was ist Linux? 43
3.2 Installation einer virtuellen Maschine 44
3.3 Die Bash-Kommandozeile 50
3.4 Heimarbeit = Fernverbindung 57
3.5 Textdateien editieren 60
3.6 Textdateien anzeigen und analysieren 65
3.7 Reguläre Ausdrücke 68
3.8 Datenströme mit Sed bearbeiten 70
3.9 Spielen mit Daten 72
3.10 Software/Pakete verwalten 72
3.11 Übersicht der Bash-Befehle 74
4 Programmierung 77
4.1 Was wollen wir erreichen? 77
4.2 Schnellstart mit AWK 77
4.3 Wie geht es weiter? 92
II Arbeiten
5 Forensische Mikrobiologie Was ist so schlimm an EHEC? 95
5.1 Hintergrund 95
5.2 Vorbereitung: Werkzeuge und Daten 96
5.3 Vorgehen 97
6 RNASeq und Biogas Identifikation Biogas-produzierender Bakterien 103
6.1 Hintergrund 103
6.2 Vorbereitung: Werkzeuge und Daten 104
6.3 Vorgehen 108
7 Vom Gen zum Methan Expressionsdaten auf Stoffwechselkarten projizieren 117
7.1 Hintergrund 117
7.2 Vorbereitung: Werkzeuge und Daten 118
7.3 Vorgehen 119
8 Bio(t)error Gefährliche Mutationen des H1N1-Schweinegrippevirus 127
8.1 Hintergrund 127
8.2 Vorbereitung: Werkzeuge und Daten 129
8.3 Vorgehen 136
9 Ebola Detektion von Variation durch Resequenzierung 145
9.1 Hintergrund 145
9.2 Vorbereitung: Werkzeuge und Daten 147
9.3 Vorgehen 154
III Veröffentlichen
10 Daten in die Datenbank 165
10.1 Warum nicht Excel? 165
10.2 MySQL und MariaDB 166
11 Daten beschreiben& darstellen mit R 187
11.1 Installation von R und RStudio 187
11.2 Erste Rechenübungen 189
11.3 Mit Graphiken interagieren 194
11.4 Graphiken in eine Datei schreiben 195
11.5 Daten aus und in Dateien laden 196
11.6 Daten aus MySQL importieren 199
11.7 Übersicht über die Daten gewinnen 201
11.8 Zeitreihen in Heatmaps 205
11.9 Statistik 209
11.10 R in der Bash 213
11.11 Regression 213
11.12 Pakete installieren 217
11.13 Zusammenfassung der R-Befehle 218
12 Es allen zeigen 221
12.1 Texte mit LATEX erstellen 221
12.2 Webseiten mit dynamischen Daten erstellen 225
IV Antworten und Literatur
13 Antworten 243
Literaturverzeichnis 247
Index 251
Whitespace 255