備案號:遼ICP備19007957號-1
聆聽您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號創(chuàng)業(yè)大廈A座18層1801室
與其被 “論文拖延癥” 折磨,不如一開始就找對方法,海馬課堂論文輔導(dǎo)將會為大家詳細介紹數(shù)據(jù)科學(xué)的寫作指南,對于有疑問的同學(xué),可以隨時與我們的在線客服進行溝通哦。
數(shù)據(jù)科學(xué)論文其實可以一句話概括:“為讀者而寫,而不是為自己而寫。”
數(shù)據(jù)科學(xué)是一個復(fù)雜的領(lǐng)域,其間繁多的算法、性能指標和數(shù)據(jù)結(jié)構(gòu),即便對最資深的從業(yè)者來說也很難完全掌握。因此,作為作者,你的職責(zé)是盡可能幫助讀者消化你的研究,在能引導(dǎo)與能澄清的地方主動做引導(dǎo)與澄清。讓問題更復(fù)雜誰都能做到,而把復(fù)雜問題講清楚、講簡單,才是真正考驗功力的地方。

引言
務(wù)必以一個引言開篇,告訴讀者接下來可以期待什么。關(guān)鍵是讓引言足夠具體。不要只說你會做文獻綜述、收集數(shù)據(jù)、建立模型——而要預(yù)告你具體將研究什么、收集什么數(shù)據(jù)、要建模哪些結(jié)構(gòu)或決策。學(xué)術(shù)寫作與靠延宕情節(jié)制造懸念的精彩小說恰恰相反——學(xué)術(shù)讀者不喜歡驚喜。恰當(dāng)?shù)囊詴峁┮粋€框架,幫助讀者為后續(xù)內(nèi)容建立結(jié)構(gòu)性預(yù)期。
正文
正文將占據(jù)主要篇幅,因此必須清晰地組織結(jié)構(gòu)。事先思考你想傳達的關(guān)鍵信息。通常,先寫出文本的“骨架”會很有幫助(例如:章節(jié)主題、段落目的、每段一句要點)。檢查這些信息是否按邏輯順序排列,并能形成一個連貫的敘事。盡量做到每段只有一個關(guān)鍵信息。沒有預(yù)設(shè)結(jié)構(gòu)與清晰信息,正文就很容易淪為公式、數(shù)據(jù)結(jié)構(gòu)與實驗結(jié)果交織的一團亂麻。
結(jié)論
無論是整篇論文、某一章,甚至一個段落,都要以明確的結(jié)論或總結(jié)收尾。你的讀者很可能不會閱讀、記住或理解你寫下的每一個細節(jié)。當(dāng)然,結(jié)論的長度應(yīng)與其所歸納的對象相稱:對于整篇論文,通常是一整章結(jié)論;而對一個段落,一句收束即可。以有力的收尾結(jié)束,對你的論文至關(guān)重要。
真正讀懂一篇論文是件辛苦的事;讀者需要盡可能多的幫助。你作為作者,可能連續(xù)數(shù)周沉浸在這個主題里,但對讀者而言,你的論文很可能只是眾多需要略讀的文檔之一。事實上,極少有人會從頭到尾通讀你的工作。因此,作為作者,你有責(zé)任盡量幫助讀者。把你在 10 頁之前提到的 ω_t 復(fù)述一遍。解釋 AUC=0.7 實際意味著什么。說明你為什么要做那個 t 檢驗。不要假設(shè)讀者會自己把碎片拼起來——要主動努力,引導(dǎo)你的受眾走過你的研究路徑。
在選擇技術(shù)時,問題應(yīng)始終起主導(dǎo)作用。追逐本周最火的機器學(xué)習(xí)新潮很誘人,但它很可能并不是這項任務(wù)的最佳工具。首先:
(i) 研究你的問題情境;
(ii) 定義合適的研究問題;
(iii) 設(shè)定需求與約束;
(iv) 分析你的數(shù)據(jù)集;
(v) 確定成功標準。
只有完成了這些,才能就合適的解決方法做出信息充分的決策??陀^地說,論文項目通常比日常工作有更多的探索空間——畢竟,有時公司只是想看看某個新東西行不行。盡管如此,也要始終讓“問題”驅(qū)動“方法”,而不是本末倒置。
數(shù)據(jù)科學(xué)論文往往會在細枝末節(jié)上深挖,比如微調(diào)超參數(shù)或進行大量實驗。這本身沒有問題。然而,如果你試圖解決的問題從一開始就不清楚(問題陳述、情境分析),或者你的實驗結(jié)果從未回扣到最初的研究動機(結(jié)論、建議),那么就錯過了讓研究產(chǎn)生有意義影響的機會。下面這些結(jié)構(gòu)可能有助于把你的工作“翻譯”出來:
沙漏模型:從企業(yè)/社會層面的宏觀問題廣泛切入,逐步聚焦到技術(shù)層面,然后再把結(jié)果翻譯回管理層面的洞見。
雙鉆石模型:在研究階段與設(shè)計階段交替進行發(fā)散與收斂思考。有意識地安排探索期與聚焦期。
你的大部分工作很可能發(fā)生在“內(nèi)容層”(數(shù)據(jù)收集與清洗、建模、參數(shù)調(diào)優(yōu)、實驗)。但是,別忘了先搭好舞臺,最后以有說服力的“大結(jié)局”收尾。
努力識別能刻畫你的研究成功與否的關(guān)鍵指標。為獲得平衡視角,通常需要報告多個指標(精準率、召回率、AUC、F1 分數(shù)等)。但應(yīng)避免在缺乏整體解讀的情況下僅僅羅列一堆指標。你的欺詐檢測模型 98.3% 的準確率聽起來很棒,但對其實際可用性說明不多。你的結(jié)果表里羅列了上百個指標,很令人印象深刻,但你能用一句話抓住其關(guān)鍵信息嗎?與基線模型相比,更高的精準率但更低的召回率算不算改進?要從多個角度深入剖析你的結(jié)果,但也務(wù)必把關(guān)鍵結(jié)論提煉到能放進一條 Twitter 摘要的程度。
本文討論了五條有助于撰寫數(shù)據(jù)科學(xué)論文的建議。貫穿始終的原則是:始終把讀者放在心上,并在結(jié)構(gòu)、解釋與闡釋上多做一步,主動為目標讀者服務(wù)。五條建議可概述如下:
引言、正文、結(jié)論——在文本的各個層級(論文、章節(jié)、小節(jié)、段落)保持一致的結(jié)構(gòu),以引導(dǎo)性提綱或提示開篇,以總結(jié)或結(jié)論收尾。
回顧、解讀、解釋——成功的論文會引導(dǎo)讀者走過你的研究,為你的技術(shù)與結(jié)果提供有幫助的解釋。
選擇適合問題的解決方案——在選定解決方法之前,務(wù)必充分研究問題、情境與期望,讓方法契合任務(wù)本質(zhì)。
開始要寬、結(jié)束也要寬——深入細節(jié)完全可以,但別忘了:(i) 清晰勾勒問題情境;(ii) 把主要發(fā)現(xiàn)轉(zhuǎn)化為可落地的洞見。
明確關(guān)鍵指標——單一指標很少能捕捉分析的全貌,但最終仍需要把研究提煉成若干可消化的數(shù)字。
閱讀原文:http://cheshan.cn/news/29943_61.html
版權(quán)作品,未經(jīng)海馬課堂 highmarktutor.com 書面授權(quán),嚴禁轉(zhuǎn)載,違者將被追究法律責(zé)任。
24h在線客服



備案號:遼ICP備19007957號-1
聆聽您的聲音:feedback@highmark.com.cn企業(yè)熱線:400-778-8318
Copyright ?2015- 海馬課堂網(wǎng)絡(luò)科技(大連)有限公司辦公地址:遼寧省大連市高新技術(shù)產(chǎn)業(yè)園區(qū)火炬路32A號創(chuàng)業(yè)大廈A座18層1801室
hmkt088