Hallo zusammen,
ich beschäftige mich derzeit mit der Optimierung meiner Machine Learning Modelle und bin auf das Thema Feature Engineering gestoßen. Mir ist klar, dass gute Features entscheidend für die Modellleistung sind, aber ich frage mich, welche Schritte konkret am effektivsten sind, um bestehende Datensätze zu verbessern. Nutzt ihr hauptsächlich manuelle Methoden oder automatisierte Tools wie Featuretools? Wie findet ihr heraus, welche Features besonders relevant sind?
Außerdem würde mich interessieren, ob ihr Erfahrungen mit Feature-Transformationen wie Skalierung, Normalisierung oder Generierung von Interaktionsvariablen habt und wie sich das auf die Performance ausgewirkt hat. Gibt es Best Practices, um Overfitting durch zu viele oder irrelevante Features zu vermeiden?
Danke für eure Tipps und Meinungen! Ich freue mich auf einen regen Austausch.