. Author manuscript; available in PMC: 2025 Feb 8.

Published in final edited form as: Proc ACM Interact Mob Wearable Ubiquitous Technol. 2024 Mar 6;8(1):31. doi: 10.1145/3643540

Table 9.

Balanced Accuracy Performance Summary on Three External Datasets. These datasets come from diverse social media platforms. For each column, the best result is bolded, and the second best is underlined.

	Dataset	Red-Sam	Twt-60Users	SAD
Category	Model	Task #2	Task #2	Task #1
Zero-shot Prompting	${Alpaca}_{Z S_best}$	0.527_±0.006	0.569_±0.017	0.557_±0.041
	${Alpaca-LoRA}_{Z S_best}$	0.577_±0.004	0.649_±0.021	0.477_±0.016
	${FLAN-T5}_{Z S_best}$	0.563_±0.029	0.613_±0.046	0.767_±0.050
	${LLaMA2}_{Z S_best}$	0.574_±0.008	0.736 _±0.019	0.704_±0.026
	$GPT-3 {.5}_{Z S_best}$	0.506_±0.004	0.571_±0.000	0.750_±0.027
	${GPT-4}_{Z S_best}$	0.511_±0.000	0.566_±0.017	0.854 _±0.006
Instructional Finetuning	Mental-Alpaca	0.604 _±0.012	0.718_±0.011	0.819 _±0.006
	$Δ - {Alpaca}_{F T_v s_Z S}$	↑ +0.077	↑ +0.149	↑ +0.262
	Mental-FLAN-T5	0.582 _±0.002	0.736 _±0.003	0.779_±0.002
	$Δ - {FLAN-T5}_{F T_v s_Z S}$	↑ +0.019	↑ +0.123	↑ +0.012