標題:PADS: Prior-Assisted Data Splitting for False Discovery Rate Control
報告時間:2025年05月07日(星期三)13:30-14:30
報告地點:人民大街校區惟真樓523
主講人: 劉軍
主辦單位:數學與統計學院
報告內容簡介:
Mirror statistic (or knockoff statistic) is a key component for most p-value-free feature selection methods. However, it is unclear how to choose the best statistic when additional prior information or covariate information is available. In this paper, we first describe a large class of possible choices of mirror statistics and derive an optimal form of mirror statistic inspired by the two-stage formula proposed in Li and Fithian (2021). Theoretically, we demonstrate the power advantage of this optimal form by considering the Rare/Weak signal model. With prior information, evenly splitting the data into two halves is no longer the most efficient way. Building upon the optimal form of the mirror statistic, we investigate how the splitting ratio affects the power of a feature selection procedure and introduce the Adaptive-Data-Splitting (ADS) approach. Both simulations and real data examples show that ADS performs significantly better than the original equal-splitting.
主講人簡介:
劉軍1981年畢業于清華附中;1985年于北京大學獲得數學學士學位;1991年在美國芝加哥大學獲統計學博士學位。自2000年至今,劉軍擔任美國哈佛大學統計系終身教授,并于2003-2015年兼任哈佛生物統計系教授。他曾任哈佛統計系助理教授(1991-1994);斯坦福大學統計系助理教授、副教授、終身教授(1994-2004);北京大學數學學院長江講座教授、清華大學數學系訪問教授,并獲國家級高層次青年人才(2005)。他于2015年領導創建清華大學統計學研究中心,并任名譽主任至2024年。2024年7月他以籌建發展委員會主任身份領導在清華大學創建統計與數據科學系。
劉軍一直從事于貝葉斯統計理論、蒙特卡洛方法、統計機器學習、狀態空間模型和時間序列、生物信息學、計算生物學等方向的研究,并做出杰出貢獻,對大數據處理和機器學習領域有深遠影響。他于2002年獲得考普斯會長獎 (COPSS Presidents' Award,公認為國際統計學界的最高榮譽); 2010年獲得世界華人應用數學最高榮譽晨興應用數學金獎(三年一度,不超過45歲);2014年被ISI評為論文高頻引用的數學家;2016年獲得泛華統計協會許寶騄獎(三年一度,不超過51歲);2004、2005年分別成為美國數理統計學會和美國統計學會會士(Fellow); 2022年當選國際計算生物學會會士;2025年當選美國國家科學院院士。
劉軍教授還曾任美國統計協會會刊(JASA)聯席主編及多個國際一流統計雜志副編等職。截至2025年5月,他在各類國際頂尖學術雜志(如Science,Nature,Cell,JASA,JMLR等)及書刊上發表論文300余篇和一本專著。他已經指導了40多位博士生、30多位博士后。