8. Pandas anstatt Excel

8. Pandas anstatt Excel#

Maschinelles Lernenist dazu gedacht, Muster in größeren Datenmengen zu finden. Der einfache Datenyp Liste reicht nicht aus, um größere Datenmengen effizient zu verwalten. Typischerweise liegen größere Datensätze in Form von Tabllen vor. Das verwendetet Datenformat variiert dabei. Manchnal liegen die Daten im Excel-Format vor, sehr oft jedoch auch im CSV-Format. Davei steht CSV als Abkürzung für Comma Separated Values, also Werte die durch ein Komma getrennt werden.

Um Daten in Tabellenform einzulesen und leicht zu verarbeiten könnnen, gibt es in Python das Pandas-Modul, das wir uns in diesem Kapitel näher ansehen werden.