上海生科院建立量化網(wǎng)絡中直接關聯(lián)性的部分互信息新方法

作者: 2016年05月03日 來源: 瀏覽量:
字號:T | T
4月18日,國際學術期刊PNAS在線發(fā)表了中國科學院上海生命科學研究院生物化學與細胞生物學研究所系統(tǒng)生物學重點實驗室陳洛南研究組題為Partmutualinformationforquantifyingdirectassociationsinnetworks的最新研究成
上海生科院建立量化網(wǎng)絡中直接關聯(lián)性的部分互信息新方法

  4月18日,國際學術期刊PNAS 在線發(fā)表了中國科學院上海生命科學研究院生物化學與細胞生物學研究所系統(tǒng)生物學重點實驗室陳洛南研究組題為Part mutual information for quantifying direct associations in networks 的最新研究成果。該成果首次提出“部分互信息”的新概念和理論,通過“部分互信息”量化網(wǎng)絡中節(jié)點之間的直接相關性,可實現(xiàn)由觀測數(shù)據(jù)直接構建網(wǎng)絡。

  在數(shù)據(jù)分析中,定量的標識變量的直接依賴性是一件非常重要的事情,特別是對于科學和工程中各種類型的網(wǎng)絡重構和因果推斷問題,都需要高精度的理論和方法。應用的最廣泛的方法之一是偏相關性系數(shù)(partial correlation),但是偏相關性系數(shù)只能量化線性之間相關性和關聯(lián)性,從而忽略非線性的關聯(lián)性。然而,基于“條件獨立性”(conditional independency)的“條件互信息”(CMI: conditional mutual information)可以從觀察數(shù)據(jù)中量化變量之間非線性的直接關聯(lián)性,優(yōu)于線性的方法。但是,條件互信息存在著過低估計的問題,因而嚴重限制它的應用,特別是在網(wǎng)絡節(jié)點有強相關的網(wǎng)絡中,這個問題就更加嚴重。

  基于這個問題,陳洛南研究組提出了全新的概念,即“偏獨立性”(partial independency)以及新的度量方法,又稱作“部分互信息”(PMI: part mutual information),不僅能夠克服條件互信息的缺點,同時還能保持互信息和條件互信息的性質。特別是,陳洛南研究組首先定義了部分互信息用于量化變量之間的直接關聯(lián)性,然后從理論上給出部分互信息和互信息以及條件互信息之間的內在聯(lián)系。通過數(shù)值實驗,陳洛南研究組證明了部分互信息的性質和優(yōu)點,接著通過用Escherichia coli和Yeast的基因表達數(shù)據(jù)重構其基因調控網(wǎng)絡,進一步驗證了部分互信息在量化網(wǎng)絡中非線性的直接關聯(lián)性的優(yōu)越性。該工作對大數(shù)據(jù)網(wǎng)絡研究提供了全新的概念和理論,不僅可用于生物分子網(wǎng)絡的高精度構建,而且可以應用于其他網(wǎng)絡(領域)中各種復雜因素的因果關系推斷。

  該研究得到了中國科學院和國家自然科學基金委的經(jīng)費支持。

  比較PMI(X;Y|Z)和CMI(X;Y|Z)的統(tǒng)計功效。研究了十種不同類型的關系,在變量X和Z關系由弱變強的過程中,PMI(X;Y|Z)和CMI(X;Y|Z)的統(tǒng)計功效的變化情況。根據(jù)上圖可以看出PMI(X;Y|Z)的統(tǒng)計功效變化并不明顯,而CMI(X;Y|Z)的統(tǒng)計功效則隨著X和Z關系的變強而逐漸減小至接近零。



 

全球化工設備網(wǎng)(http://bhmbl.cn )友情提醒,轉載請務必注明來源:全球化工設備網(wǎng)!違者必究.

標簽:

分享到:
免責聲明:1、本文系本網(wǎng)編輯轉載或者作者自行發(fā)布,本網(wǎng)發(fā)布文章的目的在于傳遞更多信息給訪問者,并不代表本網(wǎng)贊同其觀點,同時本網(wǎng)亦不對文章內容的真實性負責。
2、如涉及作品內容、版權和其它問題,請在30日內與本網(wǎng)聯(lián)系,我們將在第一時間作出適當處理!有關作品版權事宜請聯(lián)系:+86-571-88970062