题目详情
单选题 图像和视频编码器在多模态大型语言模型(MLLM)中的作用是什么?( )
A. 类似人类的耳朵,接收和预处理声学信号
B. 类似人类的大脑,进行理解和推理
C. 类似人类的眼睛,接收和预处理光学信号
D. 类似生成器,输出除文本之外的其他模态
学科:
时间:2025-05-07 04:19:34
相关题目
相关作业