Vanliga maskininlärningsalgoritmer

Linjär regression

Predikterar ett kontinuerligt värde baserat på en oberoende variabel.
Praktiska steg:
- Samla in data.
- Normalisera data (om nödvändigt).
- Dela upp data i tränings- och testuppsättningar.
- Träna modellen med träningsuppsättningen.
- Utvärdera modellen med testuppsättningen.

Logistisk regression

Klassificerar data i två kategorier (binär klassificering).
Praktiska steg:
- Följ samma steg som för linjär regression.
- Använd en sigmoidfunktion för att mappa utdata till en sannolikhet.

Beslutsträd

Skapar ett trädliknande diagram som representerar beslutsprocessen.
Praktiska steg:
- Samla in data.
- Normalisera data.
- Välj en splittningsfunktion.
- Bygg trädet rekursivt.
- Prune trädet (om nödvändigt).

Random forests

Kombinerar flera beslutsträd till en ensemblemodell.
Praktiska steg:
- Samla in data.
- Normalisera data.
- Skapa flera beslutsträd.
- Kombinera förutsägelserna från träden.

Support Vector Machines (SVM)

Klassificerar data genom att rita hyperplan som separerar klasser.
Praktiska steg:
- Samla in data.
- Normalisera data.
- Välj en kernefunktion.
- Träna modellen.

K-närmaste grannar (KNN)

Klassificerar data baserat på likheten med de k närmaste datapunkterna.
Praktiska steg:
- Samla in data.
- Välj ett värde för k.
- Beräkna avstånden mellan datapunkterna.
- Klassificera datapunkterna baserat på etiketterna för grannarna.

Python-exempel

import sklearn

# Linjär regression
model = sklearn.linear_model.LinearRegression()
model.fit(X_train, y_train)

# Logistisk regression
model = sklearn.linear_model.LogisticRegression()
model.fit(X_train, y_train)

# Beslutsträd
model = sklearn.tree.DecisionTreeClassifier()
model.fit(X_train, y_train)

# Random forests
model = sklearn.ensemble.RandomForestClassifier()
model.fit(X_train, y_train)

# SVM
model = sklearn.svm.SVC()
model.fit(X_train, y_train)

# KNN
model = sklearn.neighbors.KNeighborsClassifier()
model.fit(X_train, y_train)