磁共振成像(Magnetic Resonance Imaging, MRI)是研究人类大脑最主要的工具之一。它具有安全、覆盖全脑以及模态丰富等优点。在科研实践中,研究者们提出了一系列用来刻画大脑结构和功能的指标,但是这些指标的信效度如何往往是不确定或者没有充分了解的。如果我们不清楚MRI指标的信效度是多少或者指标的信效度太低,那么我们对于测量结果和研究结论是没有信心的。
过去10年,MRI脑成像领域对于重测信度做了大量的研究(比如,Noble et al., 2019)。所谓重测信度就是对同一个被试测量多次,观察结果是否稳定。而对于效度的研究则比较缺乏,原因在于缺乏参考标准。效度反映的是MRI指标和我们想要测量的真实世界对象的符合程度。比如,我们根据MRI数据计算出反映皮层厚度的指标,那么这个指标测量的皮层厚度精确性如何呢?这往往是很难验证的,因为不太可能在活体上去做组织学检验或者不太可能每个大脑区域都能涉及到。
我们在4个公开数据集上对13个常用MRI指标进行了重测信度的评估。结论和前人研究类似:整体上结构像和弥散像指标重测信度较高,功能像指标重测信度较低。我们在3个公开数据集上对这13个MRI指标进行了预测效度的评估。我们选择的参考标准是被试的年龄,因为从青年到老年,我们的大脑结构和功能显然随着年龄在不断变化,如果MRI脑成像指标是有效的,那么应该与年龄具有相关性。相关的程度越高,则说明预测效度越高。我们发现,整体上结构像和弥散像指标预测效度较高,功能像指标预测效度较低。图1表示皮层厚度指标不同脑区的重测信度(用ICC表示)和预测效度(用Age-R表示),更详细的结果请参考相关论文(Hu et al., 2022)。
如何正确地评估MRI脑成像指标的信效度这本身仍然是一个不断研究的问题。而对于MRI脑成像指标信效度的评估只是第一步,更重要的是,我们应该如何改进这些指标或者提出信效度更好的指标,这样MRI脑成像指标和相应的研究结果才能更有希望应用于生活实践中。
参考文献
- Hu, Y., Li, Q., Qiao, K., Zhang, X., Chen, B., & Yang, Z. (2022). PhiPipe: A multi-modal MRI data processing pipeline with test-retest reliability and predicative validity assessments. Human Brain Mapping, 1-23. https://doi.org/10.1002/hbm.2619
- Noble, S., Scheinost, D., & Constable, R. T. (2019). A decade of test-retest reliability of functional connectivity: A systematic review and meta-analysis. NeuroImage, 203, 116157. https://doi.org/10.1016/j.neuroimage.2019.116157