基于轻量级混合网络的3D医学图像分割方法的介绍

3D医学图像自动分割是计算机辅助诊断中最基本、也是最重要的技术之一。目前,deep convolutional neural network (DCNN)是医学图像分割这个领域的主流模型。根据卷积维度的不同,我们大致可以将其归类为2D DCNN和3D DCNN。2D DCNN相对来说计算量要小很多,参数也少很多,但是局限于二维平面上的卷积操作,它在3D医学图像分析的相应任务上无法捕捉到空间上下文信息。3D DCNN通过三维卷积操作,很好地解决了这个问题,然而其代价是更多的计算量、更多的参数量。

这篇文章考虑通过结合2D DCNN和3D DCNN各自的优势,在更少的参数、更少的计算量下,还能学习到有效的空间上下文关系,从而更好地解决3D医学图像分割问题。

本文提出了一个LW-HCN (light-weigt hybrid convolutional network)模型用来解决上述的问题。如图1所示,LW-HCN是由编码解码的结构构成,其中编码器采用了2D卷积(蓝色)和3D卷积(绿色)混合堆叠的结构模式,解码器则完全采用了3D卷积的结构。底层的2D卷积操作可以有效地降低整个模型的计算复杂度和参数量,高层的3D卷积能够捕捉到丰富的3D语义信息,从而实现准确的语义分割。同时,本文还使用了一种DSTS(depthwise spatiotemporal separtate)卷积操作来进一步降低3D卷积的参数量。