備案號(hào):遼ICP備19007957號(hào)-1
聆聽您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號(hào)創(chuàng)業(yè)大廈A座18層1801室
預(yù)測(cè)建模是一種數(shù)學(xué)方法,用于通過(guò)分析給定輸入數(shù)據(jù)集的模式來(lái)預(yù)測(cè)未來(lái)事件或結(jié)果。它是預(yù)測(cè)分析的重要組成部分,是一種使用當(dāng)前和歷史數(shù)據(jù)來(lái)預(yù)測(cè)活動(dòng)、行為和趨勢(shì)的數(shù)據(jù)分析類型。
雖然預(yù)測(cè)建模的重點(diǎn)是預(yù)測(cè)未來(lái),但它也可以預(yù)測(cè)結(jié)果(例如,交易被欺詐的可能性)。 在這種情況下,事件已經(jīng)發(fā)生(欺詐行為已經(jīng)實(shí)施)。 在這種情況下,目標(biāo)是預(yù)測(cè)未來(lái)的分析是否會(huì)顯示交易是欺詐行為。預(yù)測(cè)建模還可用于預(yù)測(cè)未來(lái)的索賠或促進(jìn) "假設(shè) "分析。

預(yù)測(cè)模型的分類方法有很多種,在實(shí)踐中,可以將多種類型的模型結(jié)合起來(lái),以達(dá)到最佳效果。主要分為無(wú)監(jiān)督模型和有監(jiān)督模型。
a.無(wú)監(jiān)督模型使用傳統(tǒng)統(tǒng)計(jì)方法,利用邏輯回歸、時(shí)間序列分析和決策樹等技術(shù)直接對(duì)數(shù)據(jù)進(jìn)行分類。
b.有監(jiān)督模型則使用神經(jīng)網(wǎng)絡(luò)等較新的機(jī)器學(xué)習(xí)技術(shù)來(lái)識(shí)別隱藏在先前標(biāo)注數(shù)據(jù)中的模式。
這些方法的主要區(qū)別在于,使用監(jiān)督模型時(shí),必須更加注意事先正確標(biāo)注數(shù)據(jù)集。
在某些情況下,標(biāo)準(zhǔn)的統(tǒng)計(jì)回歸分析可以提供最佳的預(yù)測(cè)能力。而在其他情況下,更復(fù)雜的建模才是正確的方法。例如,在醫(yī)院中,標(biāo)準(zhǔn)統(tǒng)計(jì)技術(shù)可能足以識(shí)別重要的排班限制,但要優(yōu)化醫(yī)生的病人分配,可能需要神經(jīng)網(wǎng)絡(luò)(一種深度學(xué)習(xí)形式)。
收集樣本數(shù)據(jù)后,數(shù)據(jù)分析師必須選擇一個(gè)合適的模型。線性回歸是最簡(jiǎn)單的預(yù)測(cè)模型之一。線性模型采用兩個(gè)相關(guān)變量--一個(gè)自變量和一個(gè)因變量--并將一個(gè)變量繪制在 x 軸上,另一個(gè)變量繪制在 y 軸上。該模型應(yīng)用最適合所得數(shù)據(jù)點(diǎn)的直線。數(shù)據(jù)科學(xué)家可以用它來(lái)預(yù)測(cè)因變量的未來(lái)發(fā)生情況。
1.決策樹
決策樹算法采用數(shù)據(jù)(挖掘的、開源的、內(nèi)部的),并將其呈現(xiàn)為一個(gè)分支,以顯示不同決策的可能結(jié)果。決策樹根據(jù)之前的決策對(duì)響應(yīng)變量進(jìn)行分類并預(yù)測(cè)響應(yīng)變量,可用于不完整的數(shù)據(jù)集,并且易于解釋,數(shù)據(jù)科學(xué)家新手也可以使用。
2.時(shí)間序列分析
這是一種通過(guò)時(shí)間序列預(yù)測(cè)事件的技術(shù)。通過(guò)分析過(guò)去的趨勢(shì)并進(jìn)行推斷,可以預(yù)測(cè)未來(lái)的事件。
3.會(huì)計(jì)回歸
這是一種有助于準(zhǔn)備數(shù)據(jù)的統(tǒng)計(jì)分析方法。隨著輸入的數(shù)據(jù)越來(lái)越多,算法對(duì)數(shù)據(jù)進(jìn)行排序和分類的能力也會(huì)提高,從而可以進(jìn)行預(yù)測(cè)。
4.神經(jīng)網(wǎng)絡(luò)
這種技術(shù)通過(guò)觀察大量標(biāo)注數(shù)據(jù)來(lái)發(fā)現(xiàn)數(shù)據(jù)中變量之間的相關(guān)性。神經(jīng)網(wǎng)絡(luò)是當(dāng)今許多人工智能(AI)范例的基礎(chǔ),如圖像識(shí)別、智能助手和自然語(yǔ)言生成。
神經(jīng)網(wǎng)絡(luò)是最復(fù)雜的預(yù)測(cè)建模領(lǐng)域。這種類型的機(jī)器學(xué)習(xí)模型可以獨(dú)立檢查大量標(biāo)注數(shù)據(jù),尋找數(shù)據(jù)中變量之間的相關(guān)性。它甚至可以檢測(cè)到只有在檢查了數(shù)百萬(wàn)個(gè)數(shù)據(jù)點(diǎn)之后才會(huì)出現(xiàn)的微妙關(guān)聯(lián)。然后,該算法可以對(duì)與它所訓(xùn)練的數(shù)據(jù)集類型相同的無(wú)標(biāo)記數(shù)據(jù)文件進(jìn)行推斷。
隨機(jī)森林。這種算法結(jié)合了不相關(guān)的決策樹,使用分類和回歸來(lái)組織和標(biāo)記大量數(shù)據(jù)。
增強(qiáng)梯度模型。與隨機(jī)森林一樣,這種算法也使用多棵決策樹,但在這種方法中,每棵決策樹都會(huì)糾正前一棵決策樹的缺陷,從而構(gòu)建出更準(zhǔn)確的圖像。
K-means 算法。這種算法以類似于聚類模型的方式對(duì)數(shù)據(jù)點(diǎn)進(jìn)行分組,廣泛用于開發(fā)個(gè)性化零售產(chǎn)品。它能發(fā)現(xiàn)大量客戶群體之間的相似性,從而制定個(gè)性化的優(yōu)惠方案。
先知。該算法是一種預(yù)測(cè)程序,對(duì)產(chǎn)能規(guī)劃尤為有效,可處理時(shí)間序列數(shù)據(jù),相對(duì)靈活。
以下是與預(yù)測(cè)建模相關(guān)的一些挑戰(zhàn)。
1.數(shù)據(jù)準(zhǔn)備
預(yù)測(cè)建模最常被忽視的挑戰(zhàn)之一是獲取適量的數(shù)據(jù),并對(duì)正確的數(shù)據(jù)進(jìn)行分類,以便在開發(fā)算法時(shí)使用。據(jù)估計(jì),數(shù)據(jù)分析師在這一階段花費(fèi)的時(shí)間約占 80%。收集數(shù)據(jù)固然重要,但如果不對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)墓芾砗颓謇?,其效用就?huì)受到限制。
數(shù)據(jù)分類后,企業(yè)必須注意避免過(guò)度擬合。對(duì)訓(xùn)練數(shù)據(jù)的過(guò)度測(cè)試可能導(dǎo)致模型看起來(lái)非常準(zhǔn)確,但卻記住了數(shù)據(jù)集中的關(guān)鍵點(diǎn),而不是學(xué)會(huì)歸納。
2.技術(shù)和文化障礙
盡管預(yù)測(cè)建模通常被認(rèn)為是一個(gè)數(shù)學(xué)問(wèn)題,但用戶仍需要對(duì)可能阻礙他們獲取所需數(shù)據(jù)的技術(shù)和組織障礙進(jìn)行規(guī)劃。通常,包含有用數(shù)據(jù)的系統(tǒng)無(wú)法直接連接到中央數(shù)據(jù)倉(cāng)庫(kù)。此外,一些業(yè)務(wù)部門可能認(rèn)為他們管理的數(shù)據(jù)是自己的資源,因此可能不會(huì)隨意與數(shù)據(jù)科學(xué)團(tuán)隊(duì)共享。
3.選擇正確的業(yè)務(wù)案例
預(yù)測(cè)建模計(jì)劃的另一個(gè)可能障礙是確保項(xiàng)目能夠解決正確的業(yè)務(wù)挑戰(zhàn)。有時(shí),數(shù)據(jù)分析師會(huì)發(fā)現(xiàn)在某個(gè)特定時(shí)間點(diǎn)上似乎很有趣的相關(guān)性,并創(chuàng)建算法來(lái)進(jìn)一步探索這些相關(guān)性。然而,僅僅因?yàn)樗麄儼l(fā)現(xiàn)了一些在統(tǒng)計(jì)學(xué)上有意義的東西,并不意味著這些東西提供了企業(yè)可以利用的洞察力。預(yù)測(cè)建模計(jì)劃需要有堅(jiān)實(shí)的業(yè)務(wù)相關(guān)性基礎(chǔ)。
以上就是關(guān)于格拉斯哥大學(xué)預(yù)測(cè)建模初級(jí)輔導(dǎo)攻略的內(nèi)容,如果同學(xué)們還有其他疑問(wèn)的話,可以聯(lián)系小海馬,得到專業(yè)幫助哦。
海馬課堂專業(yè)課程輔導(dǎo)
①3500+海外碩博導(dǎo)師,Highmark承諾導(dǎo)師真實(shí)教育背景,假一賠三!
③根據(jù)學(xué)生情況進(jìn)行1V1專屬備課,輔導(dǎo)不滿意隨心退!
②試聽課全面升級(jí)!讓留學(xué)生聽得安心!
④課程輔導(dǎo)產(chǎn)品升級(jí)贈(zèng)送,考前保障。
⑤中英雙語(yǔ)詳細(xì)講解課程中的考點(diǎn)、難點(diǎn)問(wèn)題,提供多方位的課后輔導(dǎo)!
閱讀原文:http://cheshan.cn/news/15854_61.html
版權(quán)作品,未經(jīng)海馬課堂 highmarktutor.com 書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。
24h在線客服



備案號(hào):遼ICP備19007957號(hào)-1
聆聽您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號(hào)創(chuàng)業(yè)大廈A座18層1801室
hmkt088