. 2024 May 10;14:10697. doi: 10.1038/s41598-024-61136-w

Table 3.

Comparison of different models on VisDrone validation set.

Method	Backbone	Resolution	mAP@.5%	mAP@.75%	mAP@.5:.95%
RetinaNet²³	ResNet-50	2400*2400	44.9	27.1	26.2
ClusDet²⁵	ResNet-50	1000*600	50.6	24.4	26.7
ClusDet	ResNext-101	1000*600	53.2	26.4	28.4
DMNet²⁴	ResNet-50	1000*600	47.6	28.9	28.2
DMNet	ResNext-101	1000*600	49.3	30.6	29.4
GLSAN²⁶	ResNet-50	1000*600	51.5	22.9	25.8
HRDNet²⁹	ResNet-50+ ResNet-101	2666*1600	49.3	28.2	28.3
QueryDet²	ResNet-50	2400*2400	48.1	28.8	28.3
GFL V1⁴	ResNet18	1333*800	50.0	27.8	28.4
GFL V1(CEASC)²⁸	ResNet-18	1333*800	50.7	28.4	28.7
Cascade²⁷	ResNet-50	–	47.1	29.3	28.8
DFPN³	Modified CSP v5-M	768*768	50.9	30.5	30.3
YOLOv8	CSPDarkNet	640*640	37.6	–	22.1
FocusDet(ours)	STCF-EANet	768*768	48.7	35.6	30.4

The bolded performance is the best one.