1、操作数来源

cpu/dsp: 寄存器为主,指令本身执行完成就几个cycles的事情

AI: 片上sram内存(L1)为主,算子一般执行很耗时,因此加载数据慢一点可接受;而且张量比较大,寄存器难以放下;

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐