题目详情
单选题 Transformer模型中,用于解决长距离依赖问题的关键技术是
A. 多头注意力
B. 前馈网络
C. 残差连接
D. 层归一化
学科:默认课程
时间:2025-12-21 22:16:11
相关题目
相关作业