很多软件都可以基于T1加权结构像数据来估计常见皮层下核团的体积,比如FreeSurfer, CAT和FSL。在实践中,选择哪个软件来进行计算往往会考虑多方面的因素,比如软件是否简单好用、软件是否便于和其他软件进行结合、估计结果是否准确等等。一般来说,估计结果的准确性应该是优先考虑的因素,因为这关系到研究结论的有效性。但是和磁共振脑影像研究中的大多数分析一样,目前我们并不知道哪个软件的估计结果是最准确的。对于皮下核团体积估计,手动勾画(manual tracing)的结果一般作为评价准确性的金标准,通过将软件自动估计的结果与手动勾画的结果进行比较,可以衡量一个软件估计结果的准确性。但是目前这样的准确性评估的研究得到的结论是不一致的。比如,在Herten et al. (2019)中,FreeSurfer的海马体积与手动勾画的结果的组内相关系数(ICC)约为0.7,但是在Lidauer et al. (2022)中,FreeSurfer的海马体积与手动勾画的结果的ICC约为0.2。导致这种不一致的原因可能有很多,比如样本群体差异、样本量太小、手动勾画变异性等等。由于手动勾画费时费力,所以大样本的验证研究很难进行。因此,在短期内,我们对于皮下核团体积估计的准确性仍然无法有更深入的认识。
考虑到评价估计准确性的困难,我们退而求其次,选择考虑不同软件估计结果的一致性问题。虽然我们无法知道哪个软件的计算结果更准确,但是我们可以知道不同软件之间结果有多相似。如果不同软件间结果非常相似,那么使用不同软件会得到相似的结论,这样有利于研究的可重复性;如果不同软件间结果差异很大,那么使用不同软件会得到可能完全不同的结论,选择哪个软件来计算会成为非常困难的抉择。在两个样本量相对大的公开数据集中,我们测量了FreeSurfer、CAT和FSL对于7个皮下核团体积估计的一致性(Zhang & Hu, 2024),发现丘脑、尾状核、壳核、海马具有较好的一致性(ICC >= 0.75),苍白球具有中等的一致性(0.5 <= ICC < 0.75),杏仁核和伏隔核具有较差的一致性(ICC < 0.5)。这个结论在不同年龄段(儿童青少年、青年、中年、老年)样本中都是成立的,即软件一致性并没有明显的年龄效应。
参考文献
- Herten, A., Konrad, K., Krinzinger, H., Seitz, J., & von Polier, G. G. (2019). Accuracy and bias of automatic hippocampal segmentation in children and adolescents. Brain Structure and Function, 224, 795-810.
- Lidauer, K., Pulli, E. P., Copeland, A., Silver, E., Kumpulainen, V., Hashempour, N., … & Tuulari, J. J. (2022). Subcortical and hippocampal brain segmentation in 5‐year‐old children: Validation of FSL‐FIRST and FreeSurfer against manual segmentation. European Journal of Neuroscience, 56(5), 4619-4641.
- Zhang, L. and Hu, Y. (2024), Inter-Software Consistency on the Estimation of Subcortical Structure Volume in Different Age Groups. Hum Brain Mapp, 45: e70055. https://doi.org/10.1002/hbm.70055