. 2022 Nov 21;8:e1161. doi: 10.7717/peerj-cs.1161

Table 7. ResNet configuration for ImageNet100 (He et al., 2016).

Layer	Output size	Network configuration
conv1	$224 \times 224$	$3 \times 3$ , 64, stride 1
conv2 $_$ x	$224 \times 224$	$[\begin{matrix} 3 \times 3, 32 \\ 3 \times 3, 32 \end{matrix}] \times 2$
	$224 \times 224$	None/FMAttn/CAM
conv3 $_$ x	$112 \times 112$	$[\begin{matrix} 3 \times 3, 64 \\ 3 \times 3, 64 \end{matrix}] \times 2$
	$112 \times 112$	None/FMAttn/CAM
conv4 $_$ x	$56 \times 56$	$[\begin{matrix} 3 \times 3, 64 \\ 3 \times 3, 64 \end{matrix}] \times 2$
	$56 \times 56$	None/FMAttn/CAM
conv5 $_$ x	$28 \times 28$	$[\begin{matrix} 3 \times 3, 128 \\ 3 \times 3, 128 \end{matrix}] \times 2$
	$28 \times 28$	None/FMAttn/CAM
conv6 $_$ x	$14 \times 14$	$[\begin{matrix} 3 \times 3, 128 \\ 3 \times 3, 128 \end{matrix}] \times 2$
	$14 \times 14$	None/FMAttn/CAM
	$4 \times 4$	Adaptive average pooling
	$1 \times 1$	FC-100

Notes:

The first block of convN $_$ x is followed by a downsample layer, except for conv2 $_$ x.

The first convolutional layer of conv3_x and conv4_x has a stride of 2. The rest are all 1.

Each convolutional layer is followed by a BN layer and ReLU layer.

[ $m \times m, n$ ]: Convolution kernel size $m \times m$ , n channels.

Output size: $w i d t h \times h e i g h t$ .