【數(shù)據(jù)挖掘知識(shí)分享】機(jī)器學(xué)習(xí)平臺(tái)——回歸算法簡介

回歸分析是最常用的統(tǒng)計(jì)學(xué)數(shù)值預(yù)測方法,它是在分析現(xiàn)象自變量和因變量之間相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,并將回歸方程作為預(yù)測模型,根據(jù)自變量在預(yù)測期的數(shù)量變化來預(yù)測因變量的值。
回歸分析主要解決以下幾個(gè)方面的問題:
- 確定幾個(gè)特定的變量之間是否存在相關(guān)關(guān)系, 如果存在的話, 找出它們之間合適的數(shù)學(xué)表達(dá)式。
- 根據(jù)一個(gè)或幾個(gè)變量的值, 預(yù)測或控制另一個(gè)變量的取值, 并且可以知道這種預(yù)測或控制能達(dá)到什么樣的精確度。
- 進(jìn)行因素分析。例如在對于共同影響一個(gè)變量的許多變量(因素)之間,找出哪些是重要因素,哪些是次要因素,這些因素之間又有什么關(guān)系等等。
回歸分析有很廣泛的應(yīng)用, 例如實(shí)驗(yàn)數(shù)據(jù)的一般處理, 經(jīng)驗(yàn)公式的求得, 因素分析, 產(chǎn)品質(zhì)量的控制, 氣象及地震預(yù)報(bào), 自動(dòng)控制中數(shù)學(xué)模型的制定等等。多元回歸分析是研究多個(gè)變量之間關(guān)系的回歸分析方法,按因變量和自變量的數(shù)量對應(yīng)關(guān)系可劃分為一個(gè)因變量對多個(gè)自變量的回歸分析(簡稱為“一對多”回歸分析)及多個(gè)因變量對多個(gè)自變量的回歸分析(簡稱為“多對多”回歸分析),按回歸模型類型可劃分為線性回歸分析和非線性回歸分析。
回歸結(jié)果一般用預(yù)測誤差來度量,常用的誤差有:
?均方誤差
?均方根誤差
?解釋方差
?平均絕對誤差
?R-平方系數(shù)
常見的回歸算法⇒線性回歸
⇒邏輯回歸
⇒多項(xiàng)式回歸
⇒逐步回歸
⇒嶺回歸
⇒套索回歸
⇒ElasticNet回歸
Tempo機(jī)器學(xué)習(xí)平臺(tái)內(nèi)集成的回歸方法包括線性回歸,決策樹回歸,隨機(jī)森林回歸,KNN回歸,支持向量機(jī)回歸等。
后續(xù)我們將會(huì)針對每個(gè)回歸算法做詳細(xì)的解釋。
[免責(zé)聲明]
原文標(biāo)題: 【數(shù)據(jù)挖掘知識(shí)分享】機(jī)器學(xué)習(xí)平臺(tái)——回歸算法簡介
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評;未經(jīng)許可,禁止轉(zhuǎn)載。




