• 2017年第9卷第6期文章目次
    全 选
    显示方式: |
    • >目录
    • 封一/封四

      2017, 9(6):0-0. CSTR:

      摘要 (927) HTML (0) PDF 8.83 M (1541) 评论 (0) 收藏

      摘要:

    • 封二/封三

      2017, 9(6):0-0. CSTR:

      摘要 (881) HTML (0) PDF 19.67 M (1628) 评论 (0) 收藏

      摘要:

    • 目录

      2017, 9(6):0-0. CSTR:

      摘要 (817) HTML (0) PDF 196.11 K (1485) 评论 (0) 收藏

      摘要:

    • >综述
    • 基于用户点击数据的细粒度图像识别方法概述

      2017, 9(6):567-574. DOI: 10.13878/j.cnki.jnuist.2017.06.001 CSTR:

      摘要 (1301) HTML (0) PDF 2.10 M (2611) 评论 (0) 收藏

      摘要:近年来,细粒度图像识别逐渐成为计算机视觉领域的研究热点.由于不同类别图像间的视觉差异小、语义鸿沟问题严重,传统的基于视觉特征的细粒度图像识别性能往往不尽人意.针对这些挑战,目前许多学者都在研究基于用户点击数据的图像识别.本文围绕点击数据在图像识别中数据预处理、特征提取和模型构建3大模块中的应用,总结了已有的基于点击数据的识别算法及最新的研究进展.

    • 知识图谱发展与构建的研究进展

      2017, 9(6):575-582. DOI: 10.13878/j.cnki.jnuist.2017.06.002 CSTR:

      摘要 (1502) HTML (0) PDF 1.18 M (6520) 评论 (0) 收藏

      摘要:近年来知识图谱技术引起了广泛的关注和研究,本文介绍了近期知识图谱的发展、构建方法、详细的构建过程,并对知识图谱在交叉学科领域的应用和未来的研究方向做了总结.本文详细介绍了构建文本知识图谱、视觉知识图谱、多模态知识图谱的关键技术,比如信息提取、知识融合、知识表示等.作为知识工程的重要组成部分,知识图谱,尤其是多模态知识图谱的发展对大数据时代的高效知识管理、知识获取、知识共享有着重要的意义.

    • 融合多模态特征的社会多媒体谣言检测技术研究

      2017, 9(6):583-592. DOI: 10.13878/j.cnki.jnuist.2017.06.003 CSTR:

      摘要 (1391) HTML (0) PDF 2.39 M (3235) 评论 (0) 收藏

      摘要:以微博为代表的社会媒体的蓬勃发展在加速信息交流的同时,也促使虚假谣言信息迅速在社会网络上传播,造成严重的后果.自动谣言检测问题受到了国内外学术界、产业界的广泛关注.围绕社会多媒体谣言检测这一问题,本文总结了融合多模态特征的谣言检测相关技术.首先从基本概念出发,阐述了谣言的定义和社会多媒体的特点,给出了社会多媒体谣言检测问题的定义.针对谣言检测面临的多模态特征抽取和模型构建两大难点,分别总结和归纳了各种类型的特征及其提取方法和不同的机器学习检测模型.这些特征和算法是检测谣言的基本手段,也是接下来研究的基础,可为进一步谣言检测的研究提供参考.

    • 图像艺术风格化的研究现状

      2017, 9(6):593-598. DOI: 10.13878/j.cnki.jnuist.2017.06.004 CSTR:

      摘要 (971) HTML (0) PDF 3.53 M (3680) 评论 (0) 收藏

      摘要:图像艺术风格化作为一个正在蓬勃发展的领域被越来越多的人熟知,也引起了众多学者的研究兴趣.本文总结了图片风格化的发展现状,分析了不同风格化方法的特点,指出了目前风格化方法的缺点,总结了图片风格化的发展趋势,为进一步研究图片风格化提供了方向.

    • 多媒体社会事件分析的研究与展望

      2017, 9(6):599-612. DOI: 10.13878/j.cnki.jnuist.2017.06.005 CSTR:

      摘要 (1363) HTML (0) PDF 1.76 M (2632) 评论 (0) 收藏

      摘要:随着互联网的快速发展,近年来出现了越来越多的社会媒体网站.用户可以非常方便地在这些网站上分享想法、图片、帖子和从事其他相关活动.当一个流行事件发生时,它可以在不同社会媒体网站中快速地进行传播,同时产生大量的多媒体数据.因此,研究多媒体社会事件分析是非常必要的,能够让人们及时地了解社会事件随时间演变的发展趋势.本文对近年来多媒体社会事件分析的相关研究进行了综述,并针对多媒体社会事件表示、多媒体社会事件检测和跟踪、多媒体社会事件动态演变和多媒体社会事件主题观点分析这4个具体任务进行了详细总结.随后,对多媒体社会事件的发展趋势进行了介绍.最后,对多媒体社会事件分析方面未来可能的研究课题进行了展望.

    • 图像检索技术研究进展

      2017, 9(6):613-634. DOI: 10.13878/j.cnki.jnuist.2017.06.006 CSTR:

      摘要 (1139) HTML (0) PDF 2.03 M (3446) 评论 (0) 收藏

      摘要:近年来,互联网上视觉数据呈现出爆炸式的增长,越来越多的研究工作围绕图像搜索或图像检索技术而展开.早期的搜索技术仅采用文本信息,忽视了视觉内容作为排序的线索,导致搜索文本和视觉内容不一致.基于内容的图像检索(CBIR)技术充分利用视觉内容识别相关图像,在近几年来获得了广泛关注.在图像检索中,最根本的问题是意图鸿沟和语义鸿沟,围绕该问题,近年涌现出大量的基于内容的图像检索的技术.本文主要对2003-2016年间提出的相关图像检索方法进行总结、分类和评估,并对未来的潜在研究方向进行讨论.

    • >研究性论文
    • 基于Faster R-CNN的食品图像检索和分类

      2017, 9(6):635-641. DOI: 10.13878/j.cnki.jnuist.2017.06.007 CSTR:

      摘要 (1710) HTML (0) PDF 3.87 M (3689) 评论 (0) 收藏

      摘要:面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.

    • 关系挖掘驱动的视频描述自动生成

      2017, 9(6):642-649. DOI: 10.13878/j.cnki.jnuist.2017.06.008 CSTR:

      摘要 (1140) HTML (0) PDF 2.17 M (2774) 评论 (0) 收藏

      摘要:视频的自动描述任务是计算机视觉领域的一个热点问题.视频描述语句的生成过程需要自然语言处理的知识,并且能够满足输入(视频帧序列)和输出(文本词序列)的长度可变.为此本文结合了最近机器翻译领域取得的进展,设计了基于编码-解码框架的双层LSTM模型.在实验过程中,本文基于构建深度学习框架时重要的表示学习思想,利用卷积神经网络(CNN)提取视频帧的特征向量作为序列转换模型的输入,并比较了不同特征提取方法下对双层LSTM视频描述模型的影响.实验结果表明,本文的模型具有学习序列知识并转化为文本表示的能力.

    • 基于残余插值的卷积神经网络去马赛克算法

      2017, 9(6):650-655. DOI: 10.13878/j.cnki.jnuist.2017.06.009 CSTR:

      摘要 (1291) HTML (0) PDF 2.03 M (2978) 评论 (0) 收藏

      摘要:在去马赛克问题中,为了精确插值倾斜边缘并提高结果图像的整体质量,提出一种基于残余插值的卷积神经网络去马赛克算法.针对Bayer格式的颜色滤波阵列,插值绿色平面时,对于红蓝通道信息不全的问题,采用同通道邻近像素值近似代替,综合考虑3个通道的梯度,运用倾斜方向的边缘检测算子,将倾斜边缘分为不同方向的边缘分别插值.在插值完成后,利用深度卷积神经网络,进一步训练插值结果.在标准的IMAX数据集上,与目前流行的算法相比,本文算法视觉上更接近原图,具有更高的峰值信噪比和更短的运行时间.

    • 多种信息融合的实时在线多目标跟踪

      2017, 9(6):656-660. DOI: 10.13878/j.cnki.jnuist.2017.06.010 CSTR:

      摘要 (1225) HTML (0) PDF 3.14 M (3378) 评论 (0) 收藏

      摘要:多目标跟踪算法在目标发生遮挡、目标快速运动时容易跟踪失败,而且无法从失败中恢复跟踪.针对该问题,首先利用目标的外观信息、运动信息和形状信息多种信息融合的目标特征表示,准确地计算目标间的相似性,使同一目标之间相似性距离尽量小,不同目标间的相似性距离尽量大;其次,基于判别能力强大的相关滤波器和卡尔曼预估器结合的单目标跟踪器可以在目标遮挡、快速运动中准确地跟踪目标.实验结果表明,多目标跟踪算法能够实时准确地跟踪被遮挡的目标和快速运动的目标.

    • 多模态融合的家庭音乐相册自动生成

      2017, 9(6):661-668. DOI: 10.13878/j.cnki.jnuist.2017.06.011 CSTR:

      摘要 (1219) HTML (0) PDF 1.11 M (2294) 评论 (0) 收藏

      摘要:随着大数据以及社交网络的发展,电子相册与在线服务成为如今人们使用计算机与互联网的基础应用.尤其是近年社交网络的流行,电子相册的数量得到了爆炸增长,而如何增强相册的用户体验变得尤为重要.具有某种主题的相册一般都带有一定的情感信息,因此,本文研究了基于多模态融合的家庭音乐相册自动生成问题,旨在使用户能够在享受音乐的同时配以与音乐情感相同的相册图片.针对音乐与图片中所蕴含的情感,本文在音乐和图像中分别选取能够表达其情感的句子级别的音频特征和图像特征,然后在图像与音乐之间异构和跨模态的特征融合问题上,采用局部保持投影(LPP)方法,将图像特征与音乐特征映射到更具情感分类能力的隐式特征空间中,实现了音乐相册的自动生成.在实验中,客观评测结果表明,采用LPP方法在查准率方面高于纯CCA方法;在主观评测中LPP获得72.06%的满意度,与人工推荐的评价结果(78.09%)比较接近,明显高于随机推荐和CCA方法的满意度.

    • 基于边缘指导的双通道卷积神经网络单图像超分辨率算法

      2017, 9(6):669-674. DOI: 10.13878/j.cnki.jnuist.2017.06.012 CSTR:

      摘要 (1060) HTML (0) PDF 1.32 M (2562) 评论 (0) 收藏

      摘要:当前基于卷积神经网络(CNN)的超分辨率(SR)重建算法,虽然取得了很大的成功,但是重建图像高频纹理的效果仍然不能令人满意,其高分辨率(HR)图像局部边缘存在明显的震荡.本文提出一种结合形态学成分分析(MCA)分解的边缘指导双通道CNNSR算法:待处理的低分辨率(LR)图像通过MCA分解为纹理部分和平滑结构部分;纹理部分和原LR图像共同组成双通道,输入到改进的网络结构中重建HR纹理部分;结合HR纹理输出与LR平滑结构部分重建HR图像.训练过程采用最小化纹理损失与原图像损失之和最优化网络模型参数.后处理包括:执行网络输出与LR输入图像的直方图匹配使色调保持一致,提升感官效果;应用迭代的反向映射使HR重建与LR输入保持退化算子一致性提高PSNR值.实验结果显示:该方法能够很好地恢复HR图像的纹理细节,对纹理细节丰富的图像恢复效果更好.

    • 电网短路电流限制措施的研究与应用

      2017, 9(6):675-680. DOI: 10.13878/j.cnki.jnuist.2017.06.013 CSTR:

      摘要 (1087) HTML (0) PDF 1.24 M (2892) 评论 (0) 收藏

      摘要:针对短路电流超标的问题,研究分析了包括改变系统运行方式、改善电网结构、采用高阻抗变压器、故障电流限制器等在内的多种短路电流限制措施在电网中的应用情况,并依据短路电流限制措施的仿真,对比提出适应电网实际情况的短路电流限制措施.

当期目录


年第卷第

文章目录

过刊浏览

年份

刊期

浏览排行

引用排行

下载排行

地址:江苏省南京市宁六路219号    邮编:210044

联系电话:025-58731025    E-mail:nxdxb@nuist.edu.cn

南京信息工程大学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司