Skip to main content
. 2019 Jan 4;46(2):619–633. doi: 10.1002/mp.13331

Table 1.

Architecture of a basic three‐dimensional (3D)‐UNet

Feature size 3DUNet
Input 1 × 96 × 96 × 48
Conv 1(F1) 32 × 96 × 96 × 48 Conv, 3 × 3 × 3, 32, stride 1
Encoder 1(F2) 64 × 48 × 48 × 24 Conv, 3 × 3 × 3, 64, maxpool, stride 2
Encoder 2(F3) 128 × 24 × 24 × 12 Conv, 3 × 3 × 3, 128, maxpool, stride 2
Encoder 3(F4) 256 × 12 × 12 × 6 Conv, 3 × 3 × 3, 256, maxpool, stride 2
Encoder 4(F5) 512 × 6 × 6 × 3 Conv, 3 × 3 × 3, 512, maxpool, stride 2
Decoder 4 256 × 12 × 12 × 6 Deconv, concat(F4), 3 × 3 × 3, 256, conv
Decoder 3 128 × 24 × 24 × 12 Deconv, concat(F3), 3 × 3 × 3, 128, conv
Decoder 2 64 × 48 × 48 × 24 Deconv, concat(F2), 3 × 3 × 3, 64, conv
Decoder 1 32 × 96 × 96 × 48 Deconv, concat(F1), 3 × 3 × 3, 32, conv
Output 2 × 96 × 96 × 48 Conv, 1 × 1 × 1, 2, conv, stride 1