Vanliga maskininlärningsalgoritmer
Linjär regression
- Predikterar ett kontinuerligt värde baserat på en oberoende variabel.
- Praktiska steg:
- Samla in data.
- Normalisera data (om nödvändigt).
- Dela upp data i tränings- och testuppsättningar.
- Träna modellen med träningsuppsättningen.
- Utvärdera modellen med testuppsättningen.
Logistisk regression
- Klassificerar data i två kategorier (binär klassificering).
- Praktiska steg:
- Följ samma steg som för linjär regression.
- Använd en sigmoidfunktion för att mappa utdata till en sannolikhet.
Beslutsträd
- Skapar ett trädliknande diagram som representerar beslutsprocessen.
- Praktiska steg:
- Samla in data.
- Normalisera data.
- Välj en splittningsfunktion.
- Bygg trädet rekursivt.
- Prune trädet (om nödvändigt).
Random forests
- Kombinerar flera beslutsträd till en ensemblemodell.
- Praktiska steg:
- Samla in data.
- Normalisera data.
- Skapa flera beslutsträd.
- Kombinera förutsägelserna från träden.
Support Vector Machines (SVM)
- Klassificerar data genom att rita hyperplan som separerar klasser.
- Praktiska steg:
- Samla in data.
- Normalisera data.
- Välj en kernefunktion.
- Träna modellen.
K-närmaste grannar (KNN)
- Klassificerar data baserat på likheten med de k närmaste datapunkterna.
- Praktiska steg:
- Samla in data.
- Välj ett värde för k.
- Beräkna avstånden mellan datapunkterna.
- Klassificera datapunkterna baserat på etiketterna för grannarna.
Python-exempel
import sklearn
# Linjär regression
model = sklearn.linear_model.LinearRegression()
model.fit(X_train, y_train)
# Logistisk regression
model = sklearn.linear_model.LogisticRegression()
model.fit(X_train, y_train)
# Beslutsträd
model = sklearn.tree.DecisionTreeClassifier()
model.fit(X_train, y_train)
# Random forests
model = sklearn.ensemble.RandomForestClassifier()
model.fit(X_train, y_train)
# SVM
model = sklearn.svm.SVC()
model.fit(X_train, y_train)
# KNN
model = sklearn.neighbors.KNeighborsClassifier()
model.fit(X_train, y_train)