PVT(Pyramid Vision Transformer)作为 Transformer 应用于视觉领域的代表性模型之一,在诸多任务上取得了优异的结果。最近在PVT的基础上,研究人员为其添加了重叠片元嵌入编码、卷积前传网络和线性复杂度的注意力层等功能模块,实现了PVTv2模型,大幅提升了在图像分类、目标检测和分割等任务上的性能,为研究领域提供了功能更为强大、可用的基准模型。

什么是pvt模型

物理气相传输法(PhySiCal Vapor Transport,PVT),即在高温区将材料升华,然后输送到冷凝区使其成为饱和蒸气,经过冷凝成核而长成晶体。