所屬欄目:心理學論文 發(fā)布日期:2021-08-13 09:45 熱度:
《“健康中國2030”規(guī)劃綱要》指出,健康是促進人的全面發(fā)展的必然要求,也是經(jīng)濟社會發(fā)展的基礎條件。然而心理問題診斷的準確性和干預的有效性一直是心理健康領域的重大挑戰(zhàn),這很大程度上是由于缺乏科學的預測工具。隨著國家和社會對心理健康問題的日益關注,研究者越來越多地將現(xiàn)代科技方法(如機器學習)融入到心理健康問題的研究。機器學習作為人工智能的核心已經(jīng)在許多領域(如金融和醫(yī)學)都展示了獨特的優(yōu)勢,將機器學習應用于心理健康領域已是大勢所趨。
一、機器學習的含義及其實現(xiàn)路徑
機器學習(Machine Learning)是通過發(fā)現(xiàn)大量已有數(shù)據(jù)和信息的規(guī)律,從而對新的、未知的數(shù)據(jù)做出自動的分析或預測的過程。[1]機器學習之父湯姆?米切爾給出了機器學習的形式化定義:假設使用P(Performance)評估計算機程序在某個任務T(Task)上的性能,若該程序通過利用E(Experience)在T任務上獲得了性能的改善,即P的提高,則認為該程序?qū)進行了學習。
機器學習能通過對不同類型數(shù)據(jù)的處理來實現(xiàn)。目前機器學習可利用的數(shù)據(jù)類型有:(1)文本數(shù)據(jù)。其來源包括社交媒體、臨床評估和記錄、電子健康記錄及日記等。尤其是社交媒體能提供大量反映個體心理與行為痕跡的數(shù)據(jù),具有更高的生態(tài)效度。目前主要集中在自殺風險的預測、人格特質(zhì)的分析、心理健康狀況和主觀幸福感的預測等。(2)調(diào)查數(shù)據(jù)。常用的是人口學變量、心理量表和公開的權威統(tǒng)計數(shù)據(jù)組合使用,以對人格類型和精神障礙等心理疾病進行預測和診斷。(3)腦影像數(shù)據(jù)。傳統(tǒng)的腦影像數(shù)據(jù)的檢測過度依賴專家判斷,費時費力且誤診或漏診率高。利用機器學習進行自動分類準確率優(yōu)于專家判斷法。目前常用于認知、記憶、情緒情感和成癮行為等的預測。(4)行為和生理數(shù)據(jù)。它主要來自眼動追蹤、便攜式移動設備、多導生理記錄儀和表情分析系統(tǒng)等。便攜式移動設備包括智能手機和智能手環(huán)等,通過自動化的數(shù)據(jù)獲取手段,可得到實時、海量、真實且生態(tài)效度高的行為數(shù)據(jù)。[3]傳統(tǒng)的眼動數(shù)據(jù)的處理算法由于需要過度的設置而無法獲得令人滿意的檢測結果,利用機器學習可從眼動數(shù)據(jù)中獲得良好的特征的組合,效果甚至優(yōu)于專家判斷。[4]
二、機器學習的常用算法及其比較
機器學習算法分為三類:(1)監(jiān)督學習;(2)半監(jiān)督學習;(3)無監(jiān)督學習。監(jiān)督學習是通過訓練而獲得有特征(預測變量)和標簽(結果變量)的數(shù)據(jù)間的關系,從而對新的數(shù)據(jù)做出判斷。使用具有標簽的數(shù)據(jù)訓練模型,該模型可以預測新數(shù)據(jù)的標簽,例如,可以根據(jù)創(chuàng)傷性腦損傷患者和正常個體的腦成像數(shù)據(jù)讓機器學習模型做出自動的識別以區(qū)分個體的患病情況。[5]無監(jiān)督學習是通過訓練而發(fā)現(xiàn)無特征和標簽的數(shù)據(jù)間的關系,從而對新的數(shù)據(jù)做出判斷。通過對無標簽數(shù)據(jù)進行聚類來發(fā)現(xiàn)新的規(guī)律,例如在社交論壇中找到有關心理疾病的話題并進行分析。[6]很多時候有標簽的數(shù)據(jù)集可能難以獲得,因此可通過使用無標簽的數(shù)據(jù)來增強模型的預測能力,但是應該了解的是沒有一種算法能夠很好地解決每個問題,因此需要比較多種算法來確定哪種算法最適合特定的數(shù)據(jù)集和所需要解決的任務。[7]常用的機器學習算法包括決策樹、樸素貝葉斯、支持向量機、K近鄰、邏輯回歸、多層感知機、隨機森林和K均值等,具體優(yōu)缺點見表1所示。
應用機器學習時的一個重要困難是選擇合適且正確的算法。[8]這里需要結合已獲得的數(shù)據(jù)的數(shù)量、質(zhì)量、類型和性質(zhì)(如連續(xù)和離散)等方面綜合考慮,通過對各不同算法之間進行比較,才能選出合適且滿足研究需求的算法。具體而言:(1)當數(shù)據(jù)量較大時,可以選擇隨機森林、K均值和多層感知機等算法;數(shù)據(jù)量較小時可采用樸素貝葉斯、K近鄰和支持向量機。(2)當數(shù)據(jù)的預測變量較少時,可采用邏輯回歸、K近鄰等算法;其他的算法對數(shù)量較多的預測變量可以很好的處理,尤其是深度學習的算法。(3)當數(shù)據(jù)類型屬于文本數(shù)據(jù)時,最合適的算法是樸素貝葉斯。(4)當數(shù)據(jù)的質(zhì)量并不完美,如有少量的缺失值,可使用決策樹、樸素貝葉斯、K近鄰等;支持向量機算法則對缺失值十分敏感。若有少量異常值則可以考慮K近鄰、隨機森林和支持向量機算法;而K均值和邏輯回歸算法會對異常值十分敏感。(5)當所使用的數(shù)據(jù)是線性數(shù)據(jù)時,可采用邏輯回歸;其余的算法都能夠處理非線性數(shù)據(jù)。(6)值得注意的是,在眾多分類算法中,若結果變量是連續(xù)數(shù)據(jù)時,通常會將連續(xù)變量離散化,以便于模型能夠很好的處理,尤其是在邏輯回歸算法中;而回歸算法的結果變量通常是連續(xù)數(shù)據(jù)。其次,若結果變量是二分變量時,常選用邏輯回歸、決策樹算法;多分類時則考慮選擇隨機森林、樸素貝葉斯算法。
三、機器學習在心理健康的應用領域
(一)服務心理健康問題的診斷與篩查
心理健康問題診斷的主觀性強和精確性低一直是困擾研究者的重要問題之一,這可能是由于精神疾病的研究、評估和治療常常是基于一系列人類經(jīng)驗術語的診斷系統(tǒng),而不是基于疾病的客觀標志(如腦影像數(shù)據(jù)、遺傳數(shù)據(jù)),因此診斷的人為性、主觀性強。基于機器學習的模型可充分利用客觀的疾病標志(如腦影像數(shù)據(jù))實現(xiàn)對精神疾病的診斷,有極高的診斷正確率,整個過程可避免人為參與,具有較強的診斷客觀性。Khazaee等人曾利用客觀的靜息態(tài)功能性磁共振腦影像數(shù)據(jù),并結合支持向量機算法自動、正確的區(qū)分認知障礙患者和健康的對照組,分類準確度可達到88%。[9]另外,也有研究者利用靜息態(tài)磁共振成像數(shù)據(jù)和支持向量機算法區(qū)分反社會人格障礙與正常個體的大腦中功能連通性的變化,分類的準確度可達86%左右。[10]可見,機器學習模型應用于臨床能極大幫助臨床醫(yī)生做出正確的診斷。另外,重大公共衛(wèi)生事件(如疫情)后,通常需要對民眾心理問題進行大規(guī)模心理篩查,但限于專業(yè)心理醫(yī)師數(shù)量少、心理診斷的時間和經(jīng)濟成本高等問題,大規(guī)模的診斷篩查相對比較困難。而機器學習的優(yōu)勢之一是處理大規(guī)模的數(shù)據(jù),并利用大規(guī)模的數(shù)據(jù)來提高其泛化能力,適合進行大規(guī)模的公共心理問題篩查。它能處理變量的數(shù)量多,同時,可假定預測變量與結果變量之間是線性或曲線關系,還可以從上百個預測變量中尋找最佳的預測變量,數(shù)據(jù)處理靈活性更好,處理效率更高,能夠減少大規(guī)模篩查的人力、物力和時間成本。例如,Park等的研究使用公共健康數(shù)據(jù)中的40736份老年群體的數(shù)據(jù),利用機器學習的方法通過已有的疾病診斷代碼對這些老年群體中未來可能被診斷為癡呆癥做出預測,其在未來1年內(nèi)的預測性能可達到75%以上。[11]
(二)豐富心理健康研究的途徑與手段
心理學的目標在于描述、解釋、預測和控制行為,目前心理學研究大多側(cè)重于描述和解釋變量間的關系,能夠真正實現(xiàn)預測目標的研究并不常見;而且傳統(tǒng)的心理學研究由于樣本量小、數(shù)據(jù)質(zhì)量低和缺乏協(xié)變量信息等原因?qū)е乱恍┭芯康慕Y果是矛盾且不確定的。且基于P值的顯著性檢驗正面臨重復危機,即研究結果的不可復制性。嚴格、系統(tǒng)地使用機器學習的交叉驗證技術能夠為實現(xiàn)心理學研究的可復制性提供巨大潛力。[12]
基于機器學習的技術可從海量的數(shù)據(jù)中建構學習模型,更準確地識別數(shù)據(jù)的潛在規(guī)律,具有更強的泛化能力,從而使得模型適用于不同的樣本或群體,進而最大限度地減少預測誤差,對結果做出更準確的預測。許多研究者嘗試采用機器學習預測個體復雜的心理問題,如預測應激障礙、焦慮癥等。田瑋和朱廷劭的研究發(fā)現(xiàn)僅能夠預測自殺可能性的有效特征就可達到上千個,其利用多層感知器算法建立的微博社交媒體的自殺識別器,實時評估微博用戶的自殺可能性,預測準確率可達94%左右。[13]Carpenter等利用學齡前精神病學評估的數(shù)據(jù)以及機器學習來評估2至5歲兒童的患焦慮癥的風險,其對廣泛性焦慮癥和分離性焦慮癥的預測準確率均高達90%。[14]而且,機器學習通常不會在自變量和因變量之間做出假設或建立關系,它通常會在所有可能的自變量之間做出判斷,給出預測結果,并能夠輸出重要的自變量。
Walsh等利用隨機森林模型來預測自殺未遂患者和正常被試的未來自殺行為,采用的自變量包括人口統(tǒng)計學變量、醫(yī)療記錄和社會經(jīng)濟地位等,最終其預測指標的準確度可達89%左右。而且,在長期的預測周期中,對于有自殺未遂經(jīng)歷者最重要的預測指標是醫(yī)院的就診歷史記錄;在短期的預測周期中,對上癮類藥物的依賴則是重要的預測指標。[15]
(三)預測或優(yōu)化心理輔導和治療干預效果
心理輔導和治療的效果不盡如人意,一直是困擾研究者和專業(yè)從業(yè)人員的問題之一,這與心理問題成因的復雜性和單一治療方法的局限性密不可分。機器學習可靈活優(yōu)化和調(diào)整算法的參數(shù),獲得最優(yōu)模型,即在數(shù)據(jù)保持不變的情況下,機器學習模型的性能是可以操縱或改變的。而傳統(tǒng)的統(tǒng)計方法的模型性能是無法改變的,只能通過操縱數(shù)據(jù)改變性能。比如在隨機森林或K近鄰等算法中,能通過可調(diào)節(jié)的超參數(shù)值觀察所得到的不同預測結果,從而選擇預測效果最好的超參數(shù)值。因此,采用機器學習,可以更有效地評估或預測心理治療方法或者干預的有效性,大大提高患者的治愈率,而且對調(diào)整優(yōu)化治療藥物的劑量和開發(fā)新的、有效的治療方法也起著很好的輔助決策作用。[16]
Lenhard等利用四種不同的機器學習算法和多元邏輯回歸模型預測認知行為療法對強迫癥兒童的治療效果,結果表明機器學習算法在預測治療效果方面均表現(xiàn)良好,平均準確率達80%左右;治療效果的最佳預測因素是強迫癥的發(fā)作時間和持續(xù)時間。[17]Schmitgen等使用邊緣性人格障礙患者的臨床和人口統(tǒng)計學數(shù)據(jù),結合多模態(tài)磁共振成像技術和隨機森林模型成功的預測邊緣人格障礙的治療效果,而且該模型表明認知重評任務期間的杏仁核和海馬旁的激活程度以及杏仁核灰質(zhì)體積對邊緣性人格障礙具有良好的預測能力,其準確度和靈敏度都可達到70%以上,這樣的預測結果對開發(fā)和選擇個性化的精神干預措施是至關重要的。[18]
四、研究展望
機器學習雖然有對樣本量要求高,選擇合適的算法需要耗費的時間和精力多等局限性,但是,作為一種新的統(tǒng)計方法和技術,在心理健康領域有巨大的發(fā)展空間。未來研究可以從以下幾方面開展:
第一,聚焦社會重大需求和學科領域前沿問題,加強多學科協(xié)作,獲取更多樣化的數(shù)據(jù),從多角度多層面闡述科學問題。
心理學、教育學、認知神經(jīng)科學、醫(yī)學以及數(shù)據(jù)科學等領域研究者要以研究問題為導向,通力協(xié)作,從不同途徑采集數(shù)量更多、類別更多樣化的數(shù)據(jù),涵蓋生理、心理、社會等多種指標,并在此基礎上最大限度地采用機器學習以及深度學習等前沿方法建立研究模型,提高模型的預測力。例如可以將各種心理障礙的癥狀和相關信息(如自我報告、臨床記錄、遺傳和神經(jīng)成像數(shù)據(jù))與治療結果相結合,以產(chǎn)生適當?shù)念A測因子,并開發(fā)適用于篩查人群中真實異質(zhì)性的模型,提高模型的預測能力。[19]同時,嘗試建立縱向數(shù)據(jù)庫,以獲得動態(tài)的、追蹤性數(shù)據(jù),如在預測精神障礙時,適當增加動態(tài)數(shù)據(jù),考查哪些影響因素(如作為時間函數(shù)的血壓等變量)是如何隨著時間變化而變化的,以及不同心理問題的類型是如何隨著時間發(fā)生相互轉(zhuǎn)換的。
第二,將機器學習方法應用于處境不利人群(流動兒童、留守兒童)心理健康的促進研究,增強精準性。
從眾多的影響因素中,找出影響處境不利人群心理問題(如焦慮、自卑、問題行為)的關鍵性因素,并在此基礎上開發(fā)有針對的干預方案或提出改進策略。同時,心理健康,不僅指心理障礙或心理問題,更包含積極的心理品質(zhì)。未來研究應更多的關注積極的心理健康結果的預測,如心理韌性、幸福感、獲得感、感恩等積極心理品質(zhì)。但是目前研究多數(shù)側(cè)重臨床樣本中心理障礙和疾病的診斷和預測等,忽視了非臨床普通群體及其積極心理的重要性。隨著機器學習用于探討普通群眾的積極心理品質(zhì)的深入開展,將對指導全國公共衛(wèi)生事業(yè)的發(fā)展與完善做出重要的貢獻。
第三,強化對深度學習等更先進的機器學習算法在心理領域的推廣和應用。
深度學習的算法(如生成對抗網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡等)比傳統(tǒng)的機器學習算法擁有更強的學習能力和適應性,對結果的解釋也將更具有說服力。深度學習與常規(guī)機器學習方法的不同之處在于,它能夠通過連續(xù)的非線性變換從原始數(shù)據(jù)中習得數(shù)據(jù)的最佳表示,從而實現(xiàn)了更高水平的抽象性和復雜性。同時還可以更多的采用無監(jiān)督的機器學習方法在大量的影像數(shù)據(jù)中發(fā)現(xiàn)潛在的結構,該結構可用于通過識別具有相似生物學或臨床特征的患者,從而將異質(zhì)患者分為更均勻的亞群。[20]
參考文獻
[1] SENDERS J T, STAPLES P C, KARHADE A V, et al.Machine learning and neurosurgical outcome prediction.A systematic review[J]. World Neurosurgery, 2018, 109:476-486.
[2] MITCHELL T M. Machine Learning[M]. New York:McGraw-Hill Inc, 1997:19.
《機器學習及其在心理健康領域的應用》來源:《寧波大學學報》,作者:賈緒計; 金桃; 汪強; 林琳
文章標題:機器學習及其在心理健康領域的應用
轉(zhuǎn)載請注明來自:http://www.optiwork.cn/fblw/wenyi/xinli/46446.html
攝影藝術領域AHCI期刊推薦《Phot...關注:105
Nature旗下多學科子刊Nature Com...關注:152
中小學教師值得了解,這些教育學...關注:47
2025年寫管理學論文可以用的19個...關注:192
測繪領域科技核心期刊選擇 輕松拿...關注:64
及時開論文檢索證明很重要關注:52
中國水產(chǎn)科學期刊是核心期刊嗎關注:54
國際出書需要了解的問題解答關注:58
合著出書能否評職稱?關注:48
電信學有哪些可投稿的SCI期刊,值...關注:66
通信工程行業(yè)論文選題關注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關注:120
評職稱發(fā)論文好還是出書好關注:68
copyright © www.optiwork.cn, All Rights Reserved
搜論文知識網(wǎng) 冀ICP備15021333號-3