这一篇是讲 多模态情感分类的。

模型结构
在这里插入图片描述

  • Low Rank Fusion

借用了 ACL2018 Efficient Low-rank Multimodal Fusion with Modality-Specific Factors论文中的Low Rank Fusion

ACL2018的模型如下
在这里插入图片描述
作者在此基础上, 使用LSTM 对序列数据进行压缩 (为什么是时间序列, 是如何用LSTM 进行压缩的, 这个论文没有讲清楚)

  • Fusion-based Transformer
    在这里插入图片描述
    我们把三个模态的信息 经过LMF 得到融合后的信息, 然后对每个模态放到一个 Transformer中, 来做一个跨模态的attention, 然后得到的新的 融合向量 在进行self-attention, 使得得到最终的表示, 进行预测。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐