PYTHON Tutorial

Vanliga maskininlärningsalgoritmer

Linjär regression

  • Predikterar ett kontinuerligt värde baserat på en oberoende variabel.
  • Praktiska steg:
    • Samla in data.
    • Normalisera data (om nödvändigt).
    • Dela upp data i tränings- och testuppsättningar.
    • Träna modellen med träningsuppsättningen.
    • Utvärdera modellen med testuppsättningen.

Logistisk regression

  • Klassificerar data i två kategorier (binär klassificering).
  • Praktiska steg:
    • Följ samma steg som för linjär regression.
    • Använd en sigmoidfunktion för att mappa utdata till en sannolikhet.

Beslutsträd

  • Skapar ett trädliknande diagram som representerar beslutsprocessen.
  • Praktiska steg:
    • Samla in data.
    • Normalisera data.
    • Välj en splittningsfunktion.
    • Bygg trädet rekursivt.
    • Prune trädet (om nödvändigt).

Random forests

  • Kombinerar flera beslutsträd till en ensemblemodell.
  • Praktiska steg:
    • Samla in data.
    • Normalisera data.
    • Skapa flera beslutsträd.
    • Kombinera förutsägelserna från träden.

Support Vector Machines (SVM)

  • Klassificerar data genom att rita hyperplan som separerar klasser.
  • Praktiska steg:
    • Samla in data.
    • Normalisera data.
    • Välj en kernefunktion.
    • Träna modellen.

K-närmaste grannar (KNN)

  • Klassificerar data baserat på likheten med de k närmaste datapunkterna.
  • Praktiska steg:
    • Samla in data.
    • Välj ett värde för k.
    • Beräkna avstånden mellan datapunkterna.
    • Klassificera datapunkterna baserat på etiketterna för grannarna.

Python-exempel

import sklearn

# Linjär regression
model = sklearn.linear_model.LinearRegression()
model.fit(X_train, y_train)

# Logistisk regression
model = sklearn.linear_model.LogisticRegression()
model.fit(X_train, y_train)

# Beslutsträd
model = sklearn.tree.DecisionTreeClassifier()
model.fit(X_train, y_train)

# Random forests
model = sklearn.ensemble.RandomForestClassifier()
model.fit(X_train, y_train)

# SVM
model = sklearn.svm.SVC()
model.fit(X_train, y_train)

# KNN
model = sklearn.neighbors.KNeighborsClassifier()
model.fit(X_train, y_train)