Volgens een senior datawetenschapper is een van de duidelijke voordelen van het gebruik van Stochastic Gradient Descent dat het de berekeningen sneller doet dan de gradiëntdaling en batchgradiëntdaling … Ook op enorme datasets, stochastische gradiëntafdaling kan sneller convergeren omdat het vaker updates uitvoert.
Waarvoor wordt stochastische gradiëntafdaling gebruikt?
Stochastische gradiëntafdaling is een optimalisatie-algoritme dat vaak in machine learning-toepassingen wordt gebruikt om de modelparameters te vinden die overeenkomen met de beste match tussen voorspelde en werkelijke output Het is een onnauwkeurige maar krachtige techniek. Stochastische gradiëntafdaling wordt veel gebruikt in machine learning-toepassingen.
Waarom moeten we stochastische gradiëntafdaling gebruiken in plaats van standaard gradiëntafdaling om een convolutioneel neuraal netwerk te trainen?
Stochastische gradiëntafdaling werkt de parameters voor elke waarneming bij, wat leidt tot meer updates. Het is dus een snellere aanpak die helpt bij snellere besluitvorming. Snellere updates in verschillende richtingen zijn te zien in deze animatie.
Waarom geven we de voorkeur aan gradiëntafdaling?
De belangrijkste reden waarom gradiëntafdaling wordt gebruikt voor lineaire regressie is de computationele complexiteit: het is rekenkundig goedkoper (sneller) om de oplossing te vinden met behulp van de gradiëntafdaling in sommige gevallen. Hier moet je de matrix X′X berekenen en deze vervolgens omkeren (zie opmerking hieronder). Het is een dure berekening.
Waarom wordt SGD gebruikt?
Stochastische gradiëntafdaling (vaak afgekort SGD) is een iteratieve methode voor het optimaliseren van een objectieve functie met geschikte gladheidseigenschappen (bijv. differentieerbaar of subdifferentieerbaar).