基本信息

 

宋永红

研究员,博士生导师

PMI认证项目管理专家

联系方式

电话:029-82663000-8015 

Email:songyh@xjtu.edu.cn 

地址:陕西省西安市咸宁西路28号

          西安交通大学软件学院

邮编:710049

办公室:兴庆校区 软件学院西小楼 A205

办公室:创新港校区 泓理楼-4159

讲授课程

研究生课程:

  • 《软件能力成熟度模型》
  • 《软件过程与管理》
  • 《软件工程综合训练》

本科生课程:

  • 《软件项目管理》

 

具有20多年的软件项目研发与管理经验,擅长金融信息系统、分布式软件系统的研发。

工作经历

1. 2002年-至今,就职于西安交通大学,主要从事计算机视觉,包括:图像处理、模式识别与智能系统、机器学习、深度学习,等领域的算法研究工作。 

2. 1996年—2002年,就职于日本PSB株式会社,担任情报事业本部金融系统开发部部长,从事大型金融、保险软件研发与项目管理。

3. 1992年—1996年,就职于中国煤田地质总局航测遥感局图像处理研究所,主要从事地理信息与遥感图像处理的方法研究与系统开发工作。

4. 1989年—1991年,就职于中国科学院遥感应用研究所,参加了我国“七五”攻关项目“高空机载遥感系统”的研究与开发工作。

站点计数器

招生信息

       课题组每年招收博士研究生、硕士研究生与本科实习生,具体研究方向包括图像处理、模式识别与智能系统、机器学习、深度学习等领域。
课题组提供良好的科研环境氛围,并且有一批专业的老师、专家、同学来指导、合作。


       欢迎自动化、计算机、软件工程、数学、等学科、对人工智能及其在智能金融、智能制造、智能交通、等领域得研究工作有浓厚兴趣,具有钻研和探索精神、团队合作意识、思想品质优秀、专业知识扎实得同学与宋永红老师联系(songyh@xjtu.edu.cn),欢迎优秀学子们加入!

研究领域

 1. 视频内容分析与理解

 2. 文档图像内容分析与处理

 3. 文字检测与识别

 4. 产品缺陷检测与识别

 5. 大型分布式系统研发

科研项目

       作为项目负责人承担与日本富士施乐公司、宝钢集团公司、华为、日本欧姆龙公司、中国铁道部科学研究院等合作伙伴的产学研合作项目,包括:

      1. 文档图像处理与图文分析编码

      2. 自然场景图像目标检测与识别

      3. 钢板表面缺陷检测与分类

      4. 产品质量实时在线监测

      5. 视频分析算法研究

      6. 面向安检的人脸检测与识别技术

      7. 连续视频帧中的行为分析与理解

      8. 安检行业违禁品检测与识别方法研究项目

      9. 工业产品自动质量判级

    10. 高速铁路危情识别算法研究

    11. 金融票据鉴真与变造识别方法研究

    12. CT断面图像生成方法研究

发表论文

  1. 李晓玉,宋永红 ,余涛. 结合感受野增强和全卷积网络的场景文字检测方法,《自动化学报》,2022,第 Vol.48 卷,第 No.03 期pp:797-807,DOI:10.16383/j.aas.c190376
  2. 王鑫,宋永红 ,张元林. 基于显著性特征提取的图像描述算法,《自动化学报》,2022,第 Vol.48 卷,第 No.03 期pp:  735-746,DOI:10.16383/j.aas.c190279
  3. Yaochen Li,Yuhui Hong,Yonghong Song*,Chao Zhu, Ying Zhang,Ruihao Wang,SiamPolar: Semi-supervised Realtime Video Object Segmentation with Polar Representation,Journal:  Neurocomputing,Volume 467, 7 January 2022, Pages 491-503
  4. Chongdong Huang, Yonghong Song*, and Chen Wu, Multi-view Gait Recognition By Inception-Encoder And CL-GEI,  the 11th International Conference on Image and Graphics (ICIG 2021), August 6 to 8, 2021, in Haikou, China
  5. Chongdong Huang, Yonghong Song*, Yuanlin Zhang , Feature Separation GAN for Cross View Gait Recognition,  the 11th International Conference on Image and Graphics (ICIG 2021), August 6 to 8, 2021, in Haikou, China
  6. Ge Pan, Zhang Han, fan yu, Yonghong Song*, Yuanlin Zhang, Han Yuan, You Ought to Look Around: Precise, Large Span Action Detection, 25th International Conference on Pattern Recognition (ICPR) (ICPR 2020),Online, Jan 10-Jan 15,2021
  7. Hang Song, Yonghong Song*, Yuanlin Zhang, SCA Net: Sparse Channel Attention Module for Action Recognition, 25th International Conference on Pattern Recognition (ICPR) (ICPR 2020),Online, Jan 10-Jan 15,2021
  8. LIdou Liao, Yonghong Song*, Yuanlin Zhang, Object Modifier Generation for Image Captioning, CAC2020,in Shanghai ,on Nov.6-Nov.8, 2020.
  9. Xiao Yi, Yonghong Song*, Xu Tang, Enhanced Darknet53 Combine MLFPN Based Real-time Defect Detection in Steel Surface, 3rd Chinese Conference on Pattern Recognition and Computer Vision, PRCV 2020,in Nanjing,China,on Oct.16-Oct.18, 2020 
  10. Mao Mengge and Yonghong Song*, Gait Recognition Based on 3D Skeleton Data and Graph Convolutional Network, INTERNATIONAL JOINT CONFERENCE ON BIOMETRICS (IJCB 2020), Online, Sept 28 – Oct 1, 2020
  11. Xiao Yi, Yonghong Song, Xu Tang, Weak Supervised Surface Defect Detection Method Based on Selective Search and CAM, CAC2019,on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
  12. Han Zhang, Yonghong Song, Yuanlin Zhang, Body part level attention model for skeleton-based action recognition, CAC2019,on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
  13. Ge Pan, Yonghong Song, Shenghua Wei, Combining Pose and Trajectory for Skeleton Based Action Recognition using Two-Stream RNN, CAC2019,on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
  14. 杜鹏、宋永红、张鑫瑶,基于自注意力模态融合网络的跨模态行人再识别方法研究,《自动化学报》,2019年10月16日网络首发,DOI:10.16383/j.aas.c190340
  15. Chen Wu, Yonghong Song, MultiView Gait Recognition Using NMF and 2DLDA, Journal: Multimedia Tools and Applications, 78(24), 35789-35811, ISSN: 1380-7501,DOI 10.1007/s11042-019-08153-4
  16. Zeshuang Mi, Yonghong Song, YueYan . A Defect Classification Network based on Deformation Dense Connection in Wire Rod Surface Image, the 2nd China Symposium on Cognitive Computing and Hybrid Intelligence (CCHI 2019), Sep. 21-Sep. 22, 2019 in Xi'an, China. (ei:20194907772825),Issue title:Proceedings - 2nd China Symposium on Cognitive Computing and Hybrid Intelligence, CCHI 2019,Issue date:September 2019,Publication Year:2019,Pages:155-160
  17. Wei R , Song Y , Zhang Y . Enhanced Faster Region Convolutional Neural Networks for Steel Surface Defect Detection[J]. ISIJ international, 2020, 60(3):539-545. 
  18. Liu Yang, Yonghong Song, Yuanlin Zhang, Enhanced EAST: Improving Network’s Feature Extraction Ability and Text Complete Shape Perception, the 15th International Conference on Document Analysis and Recognition (ICDAR), September 20-25, 2019 in Sidney, Australia. 
  19. Han Zhang, Yonghong Song, Yuanlin Zhang, Graph Convolutional LSTM Model for Skeleton-Based Action Recognition, 2019 IEEE International Conference on Multimedia and Expo (ICME),July 8-12,2019,Shanghai,China,Pages:412-417,ISSN:19457871
  20. Jingjun Chen,Yonghong Song, Yuanlin Zhang, Spatial Mask ConvLSTM Network and Intra-class Joint Training Method for Human Action Recognition in Video, 2019 IEEE International Conference on Multimedia and Expo (ICME),July 8-12,2019,Shanghai,China,Pages:1054-1059,ISSN:19457871

查看完整列表 

 

主要研究内容

1. 场景图像中文字检测与提取

图像中的文字是可以直接传递内容语义的重要信息源,由于自然场景的复杂性和其中的文字的大小、颜色、字体、语种、排列方向等的多样性,自然场景图像中的文字检测是一个非常有挑战性的问题。团队研究自然场景中文字的检测和提取方法,其中包括:复杂自然场景图像中文字特征的学习与筛选方法、基于多级信息集成机制的文字判别分析、等关键技术。

 

2. 手势识别

手势是人类常用的一种符号化语言,在传递信息时具有快速、方便、自然的特点。因此手势的自动识别一直是学术界关注的热点。团队主要侧重于结合深度信息的手势识别方法的研究,其中包括:指尖检测与定位、手部姿态估计与建模、手势识别与分类等。

 

3. 动作识别

动作识别结合了模式识别与机器学习、人工智能、等多个学科的理论与技术,在视频监控、视频检索、虚拟现实、人机交互等领域有广泛的应用前景。团队研究结合深度信息的视频序列中动作的识别与分类方法,主要包括:动作序列的检测与分割、动作显著性特征的学习与表达、动作的分类与预测等。

4. 文档图像分析与理解

文档图像能够使人们能够方便有效地对文档进行存储、检索和传输,因而越来越受到大家的关注。团队研究针对文档图像的图像去噪、校正、版面分析、拼接、扭曲恢复、表达、检索等关键技术,旨在构建高可靠性的文档图像处理系统。

 

5. 目标表面缺陷检测与三维重建

研究基于视觉信息的目标表面缺陷的检测与定位技术、分割技术、分类技术,完成目标表面的三维重建与可视化。

已获授权专利

  1. 宋永红、姚志茂、孟高峰、张元林、万湘琳,一种基于形状特征的带边框矩形印章图形提取方法,ZL200910150816.1,申请日:2009/6/15,授权日:2013/8/14
  2. 宋永红、张元林、肖桂林、孟高峰、雷东东,一种半色调文档图像的噪声处理方法,ZL200910022698.6,申请日:2009/5/26,授权日:2011/11/16
  3. 宋永红、张云、张元林,基于局部信息的文档图像校正方法,ZL201310303996.9,申请日:2013/7/18,授权日:2016/3/2
  4. 宋永红、张元林、孟泉、雍旭东、刘跃虎、陈晓,一种基于多特征的文本图像相似度度量方法,ZL201310332513.8,申请日:2013/8/1,授权日:2016/6/29
  5. 宋永红、张云、张元林、刘阳,一种手绘草图离线识别与整形方法,ZL201310289788.8,申请日:2013/7/10,授权日:2016/5/25
  6. 宋永红、俞雨、张元林,基于深度信息的指尖检测方法,ZL201310407231.X,申请日:2013/9/9,授权日:2016/7/6
  7. 宋永红、张元林、雍旭东,一种文字图像特征差异的快速计算方法,ZL201310331596.9,申请日:2013/8/1,授权日:2016/8/10
  8. 宋永红、龚晨、张元林,基于背景密度估计的印章图像提取方法, ZL201410690319.1,申请日:2014/11/25 ,授权日:2017/2/22
  9. 宋永红、郁冲、张元林,一种基于直线连续性的文档图像来源判别方法,ZL201410389826.1,申请日:2014/8/8 ,授权日:2017/2/15
  10. 宋永红、龚晨、张元林,基于局部纹理方向性的图像增强方法, ZL201410741870.4,申请日:2014/12/8,授权日:2017/4/19

查看完整列表