李飛飛最新研究：透過臉部、語音辨識，「AI 醫生」也能診斷憂鬱症

【為什麼我們要選這篇文章】根據數據顯示，台灣有 200 萬人曾經受到憂鬱症的困擾，其中有 125 萬人是重度憂鬱症患者，但礙於社會對於憂鬱症的成見，許多患者不敢主動去看心理醫生。

面對這樣的議題，AI 女神李飛飛有了新的發想，透過臉部辨識、聲音語調等關鍵來判別是否為憂鬱症患者，AI 的力量不僅僅用在科技業，同時也能在醫療服務上造福人群。（責任編輯：鄭惟馨）

本文經 AI 新媒體量子位（公眾號 ID：QbitAI）授權轉載，轉載請聯繫出處

作者：量子位／郭一璞

在全世界範圍內，有超過 3 億人有憂鬱症，其中 60% 的人都沒有接受任何治療。我們時有聽到名人罹患憂鬱症甚至嚴重到自殺的消息，卻不知周圍一些普通人身在病中不知病。

面對這一病癥，AI 能做些什麼？

AI 福祉無邊界：李飛飛團隊用表情和語音，辨識憂鬱症患者

曾經說過「AI 沒有國界，AI 的福祉亦無邊界」的李飛飛老師這次要為那些懷疑自己得憂鬱症的人創造福祉了，她和團隊瞄準了 AI 診斷憂鬱症這個方向：

結合語音識別、電腦視覺和自然語言處理技術，通過表情和語言診斷一個人是否患了憂鬱症。

目前，這項研究初見成效，診斷憂鬱症的機器學習模型目前 precision （精密度）達到 83.3%，recall 達到 82.6%。並且，這個模型可以部署到手機上，讓更多人能方便的診斷憂鬱症，不再受困於「沒錢」、「沒時間」、「別人知道我去看憂鬱症會怎麼議論我」的阻撓之中。另外，這項研究成果還入選了 NeurIPS 2018 醫療健康機器學習（ML4H）Workshop。

下面，為大家詳細介紹李飛飛這篇新作品的具體內容。

AI 如何診斷病徵？靠 3D 臉部辨識、患者語音和訪談文字檔

為什麼用表情和語音能診斷憂鬱症？因為醫生就是這麼做的。

在目前的憂鬱症診斷過程中，醫生需要和患者面對面聊天，來判斷對方是否患病。需要醫生來觀察的要素包括：對方是否語調單一，完全不抑揚頓挫；說話音量是否比較低；講話時手勢是不是比正常人少；是不是總愛低頭向下看；……

另外，還需要通過患者健康問卷（PHQ, Patient Health Questionnaire）來調查來瞭解更詳細的信息。

用 AI 來診斷憂鬱症，就相當於用機器學習模型來代替那個和患者對話的醫生，把患者在醫生面前的表現變成數據，輸入機器學習模型中。

因此，李飛飛團隊採用的方案是先在模型中輸入 3D 臉部關鍵點影片、患者說話的音頻和轉成文字的訪談錄音三種數據，分別對應下圖中的 abc 三行。

之後，輸出 PHQ 評分或憂鬱症分類標簽，就能得出此人是否患了抑鬱症。

訓練模型：透過語音句子嵌入、因果卷積神經網路，找出蛛絲馬跡

訓練這個模型用到的是 DAIC-WOZ 數據集，包括 142 名患者的 PHQ 評分和 189 次臨床訪談、總共 50 小時的數據。整個模型由兩個部分組成。

第一個部分叫句子級嵌入（Sentence-Level Embeddings）。以往的嵌入方式都是嵌入一個音節或單詞，只能捕捉幾百毫秒的時間。李飛飛團隊用的是整個句子多模態嵌入，可以實現捕捉更長時間的聲音、視覺和語言元素。下圖就是多模態句子級嵌入的示例：

第二個部分叫因果卷積神經網路（C-CNN, Causal Convolutional Networks）。之所以用因果卷積神經網路，是因為憂鬱症患者說話慢。相比普通人，憂鬱症患者說話的時候會在不同的字詞之間停頓更長時間，因此整個句子的音視頻也就比較長。處理這種長句子的時候，因果卷積神經網路要比 RNN（遞歸神經網絡）強。

一起來看看實驗成效如何！

我們來看一下實驗結果。

其中，A 是指輸入數據為音頻，V 是指輸入數據為視頻，L 是指輸入數據為文本。

對比前人的實驗結果，李飛飛的這項新研究數據上相對較高。不過，與前人不同的是，這項新研究並不依賴一些預先做好的訪談記錄，所以來的背景資料更少。並且，這項新研究無需特徵工程，可以直接用輸入原始數據。

這張實驗結果表格對比了使用不同嵌入方式的結果。其中，前兩行是手工嵌入，第 3~6 行是預訓練嵌入，最後兩行是我們用到的句子級嵌入，輸入的是 log-mel 光譜圖、3D 臉部關鍵點影片和 Word2Vecs 的序列。

完整論文：
Measuring Depression Symptom Severity from Spoken Language and 3D Facial Expressions
Albert Haque, Michelle Guo, Adam S Miner, Li Fei-Fei
https://arxiv.org/abs/1811.08592

（本文經原作者量子位授權轉載，並同意 TechOrange 編寫導讀與修訂標題，原文標題為〈李飛飛新論文「AI醫生」診斷抑鬱症，準確率超過80%，可移植到手機端〉。）

延伸閱讀

Google 首席 AI 科學家李飛飛宣布離職！就是她讓 Google 人工智慧登上神壇
 Google AI 大神李飛飛新論文：只要說出需求，AI 自動把圖畫出來
 哈佛大學最新研究成果：從 Instagram 上的濾鏡、相片內容，來判斷你有沒有憂鬱症！

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

李飛飛最新研究：透過臉部、語音辨識，「AI 醫生」也能診斷憂鬱症

AI 福祉無邊界：李飛飛團隊用表情和語音，辨識憂鬱症患者

AI 如何診斷病徵？靠 3D 臉部辨識、患者語音和訪談文字檔

訓練模型：透過語音句子嵌入、因果卷積神經網路，找出蛛絲馬跡

一起來看看實驗成效如何！

延伸閱讀

開啟心律不整治療的新可能！專訪國立陽明交通大學生物藥學研究所胡瑜峰教授談「心臟細胞轉化」

臺灣首顆自製氣象衛星「獵風者」即將升空！科普知識分享：獵風者如何「獵風」？

婚禮誓詞想破頭也空白？婚禮策劃公司推出 AI 工具讓新人不再絞盡腦汁！

【價值 2 千億的迷因股票故事】越南特斯拉股價暴漲 8 倍又暴跌，它不是電動車股票是迷因股票吧