Kan du forklare forskjellen mellom maskinlæring, dyp læring og forsterkningslæring intuitivt, som å forklare et barn?


Svar 1:

Det er virkelig ikke mye forskjell mellom de tre, og det er sannsynligvis lettere å ikke svette forskjellene for mye.

Jeg bruker sjelden begrepet “dyp læring” og foretrekker i stedet å bruke enten “maskinlæring”, “statistisk modell” eller bare “modell”.

Men når det er sagt, avhengig av hvor gammelt barnet er og hvor interessert de er i emnet, kan du si noe som det følgende som antar at de ikke vet så mye om hvordan datamaskiner fungerer, men er noe interessert i emnet.

Maskinlæring

Nøyaktig hvordan det høres ut.

Akkurat som du kan lære nye ting ved å se på YouTube-videoer, eller lese bøker, er maskinlæring når datamaskiner lærer av seg selv ved å se på spesielle YouTube-videoer og lese spesielle bøker designet for datamaskiner.

Programmerere må fremdeles fortelle datamaskinen hvordan de skal lære, men de trenger ikke å fortelle datamaskinen hvordan de gjør hva de lærer, noe som ofte er mye vanskeligere.

Tenk deg at det for eksempel er mye lettere for meg å fortelle deg å studere japansk ved å se på YouTube-videoer enn det er for meg å faktisk lære deg japansk (hovedsakelig fordi jeg ikke snakker japansk).

Dyp læring

Dyp læring er en spesiell type maskinlæring.

Se for deg at du vil lære å slå et nivå i Mario. Det kan være lurt å måle fremgangen din ved å se på hvor mange poeng du klarer å samle i løpet av en løpetur.

Jo flere poeng du samler jo bedre gjorde du.

Målet er selvfølgelig å samle så mange poeng som mulig.

Dyp læring fungerer omtrent på samme måte. Datamaskinen prøver å lære seg å samle så mange poeng som mulig ved å prøve forskjellige ting.

Det er også noe som heter “evolusjonsalgoritmer” der datamaskinen også prøver å maksimere poengsummen, men den gjør det ved å tilfeldig gjette hvilke knapper de skal trykke på, og holde seg til det som fungerer.

Dyp læring er smartere og kan teoretisere om hva det skal gjøre annerledes for å slå sjefen.

Forsterkningslæring

Forsterkningslæring er også en type maskinlæring, og kan være litt annerledes avhengig av hvordan du bruker den.

Men vanligvis fungerer det mest som dyp læring i eksemplet over der du kontrollerer en karakter.

Dyp læring er mer generell og kan også brukes til ting som å finne ut hva som er i et bilde.

Disse forklaringene lider av forenkling og er bare halvsannheter som er nødvendig når man forenkler dette, men jeg mener at disse forklaringene har en viss bruk.

I de fleste tilfeller er de tre imidlertid sammen, og som jeg nevnte i begynnelsen av svaret, er det ikke veldig viktig hva du kaller det.