當前,體育學界的定量研究多數處于統計相關性的描述階段,基于因果推斷的解釋能力不足,而在其他學科(尤其經濟學和計算機學)中,因果推斷已經成為“新的學科前沿”。2020年6月,英國學者Guan Jing 等在利物浦大學經濟論壇上報告了1 篇文章,主要探討運動與健康的雙向因果關系。他們指出,當前體育學界對于因果推斷的運用主要存在2 個問題:①忽略內生性;②武斷假設因果關系的單一路徑,如只指出運動促進了健康,而未考慮健康的人更愛運動。目前很多國內學者也注意到:內生性是影響因果推斷的核心問題。具體而言,回歸分析可通過控制協變量使不同組別具備可比性(如運動和不運動2組人群的健康程度比較),但總有一些無法觀測到的變量(如基因特征)未被納入控制變量,而它們又與解釋變量(如基因特征、運動偏好)相關,違反回歸分析中“隨機誤差項與解釋變量相互獨立”這一基本假設,從而導致估計參數(回歸系數)偏誤。這種遺漏變量偏誤是產生內生性問題的主要來源。此外,內生性問題還源于自選擇偏誤(如參與運動本身即是具備某種特征的人自行選擇的結果)、樣本選擇偏誤(如僅研究參與運動的群體就得出普遍結論)和聯立偏誤(運動與健康存在雙向因果關系)。針對上述問題,陳云松、梁玉成等國內學者總結了相應的解決辦法,包括工具變量法、傾向值匹配(PSM)、赫克曼(Heckman)兩階段模型等。另外,近年來較流行的“交叉滯后面板模型”亦是一種利用面板數據解決雙向因果問題的方法。值得一提的是,當前隨著人工智能的發(fā)展和大數據研究的深入,機器學習方法在社會現象的“分類”和“預測”上呈現出強大功能,未來其可助力因果推斷在體育學界的應用和發(fā)展。