- 柳军杰;蔡英;范艳芳;赵放;
针对行人轨迹的多态性导致模型预测精度下降的问题,提出了基于图卷积网络(graph convolution network, GCN)和Transformer时空信息融合的行人轨迹预测模型。采用Transformer提取行人运动行为特征;构建时空图,并根据结伴行人轨迹相似的特点,设计基于轨迹相似度的GCN,来优化时空图的卷积以提取行人间的空间交互特征;针对时空图之间的关联性,采用Transformer编码不同历史时刻的空间交互特征,深度挖掘行人轨迹的时空交互特征。融合行人运动行为特征、空间交互特征和时空交互特征实现基于时空信息融合的行人轨迹预测。在ETH-UCY和SDD公开数据集上的实验结果验证了所设计模型的性能和有效性。
2024年06期 v.39;No.162 1-8页 [查看摘要][在线阅读][下载 1481K] [下载次数:540 ] |[网刊下载次数:32 ] |[引用频次:0 ] |[阅读次数:50 ] - 高立卫;吕学强;马登豪;
针对零样本多标签图像分类,提出了一种基于关键词生成与标签匹配的分类方法,在无须额外训练的情况下,通过输入图像来预测其关键词信息及标签概率。图像关键词生成模块利用视觉编码器和文本解码器生成图像语义描述,清洗并提取相关的关键词及权重信息。标签匹配模块使用词嵌入模型编码关键词和待预测标签,并结合权重计算图像关于任意标签的匹配概率,得到预测结果。在5个公开数据集上的实验结果表明,所提方法能够显著提高不同基线模型的图像分类性能与效果。
2024年06期 v.39;No.162 9-16页 [查看摘要][在线阅读][下载 1846K] [下载次数:126 ] |[网刊下载次数:19 ] |[引用频次:0 ] |[阅读次数:40 ] - 任子玉;游新冬;滕尚志;吕学强;
针对DeepLabv3+在高分辨率遥感图像语义分割中存在的分割目标边界残缺和细节模糊问题,提出了一种图像边界修复语义分割方法。引入多深度卷积头转置注意力(multi-Dconv head transposed attention, MDTA)边界修复模块,将通道注意力机制应用于多级低阶特征,获取不同抽象层次的边缘纹理结构;将经过通道权值分配的密集采样空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)级联模块的输出作为编码器的输出,解码器融合了低阶特征与编码器输出的增强特征,提高了目标边界的清晰度;利用空间上下文信息挖掘模块——上下文转换器(contextual transformer, CoT),增强对图像不同区域之间依赖关系的感知能力。实验证明,该方法在多个公开数据集上的性能取得了显著提升,在VOC2012的验证集上平均交并比(mean intersection over union, mIoU)达到了90.42%。
2024年06期 v.39;No.162 17-24页 [查看摘要][在线阅读][下载 2229K] [下载次数:284 ] |[网刊下载次数:14 ] |[引用频次:0 ] |[阅读次数:33 ] - 赵华;周虹洁;刘涵;张希文;邹祯祺;
准确抽取医疗事件及关系对于构建临床医疗事理图谱、为临床医疗提供更加精准的疾病推理诊断服务具有非常重要的意义。总结了近年来面向医疗文本的事件和关系抽取相关工作。首先,梳理了医疗事件抽取、事件关系抽取的具体任务,归纳了2项任务的主要研究方法;其次,介绍了用于医疗文本事件抽取的相关数据集及评测结果;最后,对此领域的不足和未来发展做出了探讨与展望,以期为后续研究提供参考。
2024年06期 v.39;No.162 25-37页 [查看摘要][在线阅读][下载 1596K] [下载次数:273 ] |[网刊下载次数:14 ] |[引用频次:0 ] |[阅读次数:22 ]