備案號(hào):遼ICP備19007957號(hào)-1
聆聽(tīng)您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號(hào)創(chuàng)業(yè)大廈A座18層1801室
如今,企業(yè)通常可以訪問(wèn)非常豐富的信息數(shù)據(jù)集,這些數(shù)據(jù)集通常是作為公司或業(yè)務(wù)部門主要機(jī)構(gòu)活動(dòng)的副產(chǎn)品自動(dòng)生成的。數(shù)據(jù)挖掘涉及推斷和驗(yàn)證數(shù)據(jù)中的模式、結(jié)構(gòu)和關(guān)系,作為支持商業(yè)環(huán)境中決策的工具。
QBUS6810(統(tǒng)計(jì)學(xué)習(xí)和數(shù)據(jù)挖掘)課程輔導(dǎo)深入了解了可視化和分析業(yè)務(wù)和市場(chǎng)數(shù)據(jù)的主要統(tǒng)計(jì)方法。它提供了提取特定任務(wù)所需信息所需的工具,例如信用評(píng)分、預(yù)測(cè)和分類、市場(chǎng)細(xì)分和產(chǎn)品定位。重點(diǎn)介紹使用現(xiàn)代軟件工具進(jìn)行數(shù)據(jù)挖掘的商業(yè)應(yīng)用。

1. 統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)
統(tǒng)計(jì)學(xué)習(xí)理論是統(tǒng)計(jì)學(xué)習(xí)和數(shù)據(jù)挖掘課程的基礎(chǔ)部分。該部分內(nèi)容包括對(duì)概率論和統(tǒng)計(jì)理論的深入理解,以及如何將這些理論應(yīng)用于實(shí)際數(shù)據(jù)分析。學(xué)生將學(xué)習(xí)經(jīng)典的統(tǒng)計(jì)模型,如線性回歸和邏輯回歸模型,以及這些模型的假設(shè)條件和適用范圍。此外,還會(huì)介紹模型評(píng)估方法,如交叉驗(yàn)證和AIC/BIC準(zhǔn)則,幫助學(xué)生選擇最優(yōu)模型。
2. 監(jiān)督學(xué)習(xí)方法
監(jiān)督學(xué)習(xí)是數(shù)據(jù)挖掘中最常見(jiàn)的方法之一,重點(diǎn)在于預(yù)測(cè)和分類。課程內(nèi)容涵蓋各種監(jiān)督學(xué)習(xí)算法,包括線性和非線性回歸、決策樹、支持向量機(jī)(SVM)、k近鄰算法(k-NN)等。學(xué)生將學(xué)習(xí)如何處理不同類型的數(shù)據(jù),選擇合適的模型,并使用評(píng)估指標(biāo)(如準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù))來(lái)評(píng)估模型性能。實(shí)際應(yīng)用案例也將被討論,以幫助學(xué)生理解這些算法在實(shí)際問(wèn)題中的應(yīng)用。
3. 無(wú)監(jiān)督學(xué)習(xí)方法
無(wú)監(jiān)督學(xué)習(xí)方法主要用于數(shù)據(jù)聚類和降維。在這部分課程中,學(xué)生將學(xué)習(xí)k-means聚類、層次聚類、DBSCAN等常見(jiàn)的聚類算法,以及主成分分析(PCA)和獨(dú)立成分分析(ICA)等降維技術(shù)。課程還將探討如何選擇適當(dāng)?shù)木垲悢?shù)目和評(píng)估聚類效果的方法,如輪廓系數(shù)和SSE(Sum of Squared Errors)。這些技術(shù)在大數(shù)據(jù)處理和特征提取中有著廣泛的應(yīng)用。
4. 高維數(shù)據(jù)分析
隨著數(shù)據(jù)量的增加,分析高維數(shù)據(jù)變得越來(lái)越重要。本部分課程將介紹高維數(shù)據(jù)的特點(diǎn)和挑戰(zhàn),以及應(yīng)對(duì)這些挑戰(zhàn)的技術(shù)。學(xué)生將學(xué)習(xí)如何使用正則化方法(如LASSO和Ridge回歸)來(lái)處理高維數(shù)據(jù)的過(guò)擬合問(wèn)題。此外,還將討論特征選擇和特征工程的重要性,并介紹常用的方法,如遞歸特征消除(RFE)和基于樹模型的特征重要性評(píng)估。
5. 數(shù)據(jù)預(yù)處理和清洗
數(shù)據(jù)預(yù)處理和清洗是數(shù)據(jù)分析過(guò)程中的關(guān)鍵步驟。課程內(nèi)容包括缺失值處理、異常值檢測(cè)和處理、數(shù)據(jù)標(biāo)準(zhǔn)化和歸一化等。學(xué)生將學(xué)習(xí)如何使用不同的方法來(lái)填補(bǔ)缺失值,如均值填補(bǔ)、插值法和多重插補(bǔ)。此外,課程還將介紹如何處理分類數(shù)據(jù)和文本數(shù)據(jù),包括編碼技術(shù)(如獨(dú)熱編碼和詞袋模型)和文本預(yù)處理(如分詞和停用詞處理)。
完成本單元后,您應(yīng)該能夠:
LO1 . 認(rèn)識(shí)機(jī)器學(xué)習(xí)如何幫助組織優(yōu)化業(yè)務(wù)流程并大規(guī)模做出有效決策。
LO2 .將商業(yè)決策問(wèn)題表述為預(yù)測(cè)機(jī)器學(xué)習(xí)問(wèn)題。
LO3 .選擇相關(guān)的機(jī)器學(xué)習(xí)算法和工具來(lái)解決一系列業(yè)務(wù)預(yù)測(cè)和數(shù)據(jù)挖掘問(wèn)題。
LO4 .根據(jù)統(tǒng)計(jì)和計(jì)算特性評(píng)估機(jī)器學(xué)習(xí)算法和技術(shù)。
LO5 .使用機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法從大量數(shù)據(jù)中提取商業(yè)洞察。
LO6 .使用行業(yè)標(biāo)準(zhǔn)的計(jì)算工具應(yīng)用機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)。
LO7 . 在數(shù)據(jù)團(tuán)隊(duì)內(nèi)有效協(xié)作。
LO8 .向商業(yè)受眾有效地傳達(dá)數(shù)據(jù)驅(qū)動(dòng)的結(jié)果和見(jiàn)解。
海馬課堂專業(yè)課程輔導(dǎo)
1.擁有4000+嚴(yán)選碩博學(xué)霸師資。針對(duì)學(xué)生的薄弱科目和學(xué)校教學(xué)進(jìn)度,匹配背景相符的導(dǎo)師。
2.根據(jù)學(xué)生情況進(jìn)行1V1專屬備課,上課時(shí)間靈活安排。
3.中英雙語(yǔ)詳細(xì)講解課程中的考點(diǎn)、難點(diǎn)問(wèn)題,并提供多方位的課后輔導(dǎo),輔助學(xué)生掌握全部課程知識(shí),補(bǔ)足短板。
閱讀原文:http://cheshan.cn/news/21872_62.html
版權(quán)作品,未經(jīng)海馬課堂 highmarktutor.com 書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。
24h在線客服



備案號(hào):遼ICP備19007957號(hào)-1
聆聽(tīng)您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號(hào)創(chuàng)業(yè)大廈A座18層1801室
hmkt088