构建有“温度”的通用人工智能:大模型驱动的多模态情感智能
在人工智能迈向通用化(AGI)的征途中,理解人类的情感与意图是填合“人机鸿沟”的关键。本课题组专注于多模态大模型(Large Multi-modal Models)、计算机视觉、情感计算(Affective Computing)、数字人等方面的前沿及交叉研究。
我们不满足于让机器“看清”和“听懂”,更致力于让算法/模型具备:
l 深层语义共情:跨越文本、语音、视觉、生理信号(脑电等)维度的情感协同表征、对齐。
l 复杂场景理解:在非结构化环境中捕捉细微的人类心理状态。
l 交互式演进:利用大模型的推理能力,实现具备情感感知力的自然交互。

