个人主页 - 宋永红 - 教师个人主页

基本信息

宋永红

研究员，博士生导师

PMI认证项目管理专家

联系方式

电话：029-82663000-8015

Email：songyh@xjtu.edu.cn

地址：陕西省西安市咸宁西路28号

西安交通大学软件学院

邮编：710049

办公室：兴庆校区软件学院西小楼 A205

办公室：创新港校区泓理楼-4159

新闻通知

课题组长期招收博士研究生、硕士研究生与本科实习生

2022-04-03
李晓玉同学的论文发表在《自动化学报》

2022-04-01
王鑫同学的论文发表在《自动化学报》

2022-04-01
吴极同学的论文被ICPR2022接收

2022-03-30
更多新闻>>

讲授课程

研究生课程：

《软件能力成熟度模型》
《软件过程与管理》
《软件工程综合训练》

本科生课程：

《软件项目管理》

具有20多年的软件项目研发与管理经验，擅长金融信息系统、分布式软件系统的研发。

工作经历

1. 2002年-至今，就职于西安交通大学，主要从事计算机视觉，包括：图像处理、模式识别与智能系统、机器学习、深度学习，等领域的算法研究工作。

2. 1996年—2002年，就职于日本PSB株式会社，担任情报事业本部金融系统开发部部长，从事大型金融、保险软件研发与项目管理。

3. 1992年—1996年，就职于中国煤田地质总局航测遥感局图像处理研究所，主要从事地理信息与遥感图像处理的方法研究与系统开发工作。

4. 1989年—1991年，就职于中国科学院遥感应用研究所，参加了我国“七五”攻关项目“高空机载遥感系统”的研究与开发工作。

站点计数器

招生信息

课题组每年招收博士研究生、硕士研究生与本科实习生，具体研究方向包括图像处理、模式识别与智能系统、机器学习、深度学习等领域。
课题组提供良好的科研环境氛围，并且有一批专业的老师、专家、同学来指导、合作。

欢迎自动化、计算机、软件工程、数学、等学科、对人工智能及其在智能金融、智能制造、智能交通、等领域得研究工作有浓厚兴趣，具有钻研和探索精神、团队合作意识、思想品质优秀、专业知识扎实得同学与宋永红老师联系(songyh@xjtu.edu.cn)，欢迎优秀学子们加入！

研究领域

1. 视频内容分析与理解

2. 文档图像内容分析与处理

3. 文字检测与识别

4. 产品缺陷检测与识别

5. 大型分布式系统研发

科研项目

作为项目负责人承担与日本富士施乐公司、宝钢集团公司、华为、日本欧姆龙公司、中国铁道部科学研究院等合作伙伴的产学研合作项目，包括：

1. 文档图像处理与图文分析编码

2. 自然场景图像目标检测与识别

3. 钢板表面缺陷检测与分类

4. 产品质量实时在线监测

5. 视频分析算法研究

6. 面向安检的人脸检测与识别技术

7. 连续视频帧中的行为分析与理解

8. 安检行业违禁品检测与识别方法研究项目

9. 工业产品自动质量判级

10. 高速铁路危情识别算法研究

11. 金融票据鉴真与变造识别方法研究

12. CT断面图像生成方法研究

…

发表论文

李晓玉，宋永红，余涛. 结合感受野增强和全卷积网络的场景文字检测方法，《自动化学报》，2022，第 Vol.48 卷，第 No.03 期pp:797-807，DOI：10.16383/j.aas.c190376
王鑫，宋永红，张元林. 基于显著性特征提取的图像描述算法，《自动化学报》，2022，第 Vol.48 卷，第 No.03 期pp: 735-746，DOI：10.16383/j.aas.c190279
Yaochen Li,Yuhui Hong,Yonghong Song*,Chao Zhu, Ying Zhang,Ruihao Wang，SiamPolar: Semi-supervised Realtime Video Object Segmentation with Polar Representation，Journal: Neurocomputing，Volume 467, 7 January 2022, Pages 491-503
Chongdong Huang, Yonghong Song*, and Chen Wu, Multi-view Gait Recognition By Inception-Encoder And CL-GEI, the 11th International Conference on Image and Graphics (ICIG 2021), August 6 to 8, 2021, in Haikou, China
Chongdong Huang, Yonghong Song*, Yuanlin Zhang , Feature Separation GAN for Cross View Gait Recognition, the 11th International Conference on Image and Graphics (ICIG 2021), August 6 to 8, 2021, in Haikou, China
Ge Pan, Zhang Han, fan yu, Yonghong Song*, Yuanlin Zhang, Han Yuan, You Ought to Look Around: Precise, Large Span Action Detection, 25th International Conference on Pattern Recognition (ICPR) (ICPR 2020),Online, Jan 10-Jan 15,2021
Hang Song, Yonghong Song*, Yuanlin Zhang, SCA Net: Sparse Channel Attention Module for Action Recognition, 25th International Conference on Pattern Recognition (ICPR) (ICPR 2020),Online, Jan 10-Jan 15,2021
LIdou Liao, Yonghong Song*, Yuanlin Zhang, Object Modifier Generation for Image Captioning, CAC2020，in Shanghai ,on Nov.6-Nov.8, 2020.
Xiao Yi, Yonghong Song*, Xu Tang, Enhanced Darknet53 Combine MLFPN Based Real-time Defect Detection in Steel Surface, 3rd Chinese Conference on Pattern Recognition and Computer Vision, PRCV 2020，in Nanjing,China,on Oct.16-Oct.18, 2020
Mao Mengge and Yonghong Song*, Gait Recognition Based on 3D Skeleton Data and Graph Convolutional Network, INTERNATIONAL JOINT CONFERENCE ON BIOMETRICS (IJCB 2020), Online, Sept 28 – Oct 1, 2020
Xiao Yi, Yonghong Song, Xu Tang, Weak Supervised Surface Defect Detection Method Based on Selective Search and CAM, CAC2019，on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
Han Zhang, Yonghong Song, Yuanlin Zhang, Body part level attention model for skeleton-based action recognition, CAC2019，on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
Ge Pan, Yonghong Song, Shenghua Wei, Combining Pose and Trajectory for Skeleton Based Action Recognition using Two-Stream RNN, CAC2019，on Nov.22-Nov.24, 2019 in Hangzhou, Zhejiang Province.
杜鹏、宋永红、张鑫瑶，基于自注意力模态融合网络的跨模态行人再识别方法研究，《自动化学报》，2019年10月16日网络首发，DOI：10.16383/j.aas.c190340
Chen Wu, Yonghong Song, MultiView Gait Recognition Using NMF and 2DLDA, Journal: Multimedia Tools and Applications, 78(24), 35789-35811, ISSN: 1380-7501，DOI 10.1007/s11042-019-08153-4
Zeshuang Mi, Yonghong Song, YueYan . A Defect Classification Network based on Deformation Dense Connection in Wire Rod Surface Image, the 2nd China Symposium on Cognitive Computing and Hybrid Intelligence (CCHI 2019), Sep. 21-Sep. 22, 2019 in Xi'an, China. （ei：20194907772825），Issue title:Proceedings - 2nd China Symposium on Cognitive Computing and Hybrid Intelligence, CCHI 2019，Issue date:September 2019，Publication Year:2019，Pages:155-160
Wei R , Song Y , Zhang Y . Enhanced Faster Region Convolutional Neural Networks for Steel Surface Defect Detection[J]. ISIJ international, 2020, 60(3):539-545.
Liu Yang, Yonghong Song, Yuanlin Zhang, Enhanced EAST: Improving Network’s Feature Extraction Ability and Text Complete Shape Perception, the 15th International Conference on Document Analysis and Recognition (ICDAR), September 20-25, 2019 in Sidney, Australia.
Han Zhang, Yonghong Song, Yuanlin Zhang, Graph Convolutional LSTM Model for Skeleton-Based Action Recognition, 2019 IEEE International Conference on Multimedia and Expo (ICME),July 8-12,2019,Shanghai,China，Pages:412-417，ISSN:19457871
Jingjun Chen,Yonghong Song, Yuanlin Zhang, Spatial Mask ConvLSTM Network and Intra-class Joint Training Method for Human Action Recognition in Video, 2019 IEEE International Conference on Multimedia and Expo (ICME),July 8-12,2019,Shanghai,China，Pages:1054-1059，ISSN:19457871

查看完整列表

主要研究内容

1. 场景图像中文字检测与提取

图像中的文字是可以直接传递内容语义的重要信息源，由于自然场景的复杂性和其中的文字的大小、颜色、字体、语种、排列方向等的多样性，自然场景图像中的文字检测是一个非常有挑战性的问题。团队研究自然场景中文字的检测和提取方法，其中包括：复杂自然场景图像中文字特征的学习与筛选方法、基于多级信息集成机制的文字判别分析、等关键技术。

2. 手势识别

手势是人类常用的一种符号化语言，在传递信息时具有快速、方便、自然的特点。因此手势的自动识别一直是学术界关注的热点。团队主要侧重于结合深度信息的手势识别方法的研究，其中包括：指尖检测与定位、手部姿态估计与建模、手势识别与分类等。

3. 动作识别

动作识别结合了模式识别与机器学习、人工智能、等多个学科的理论与技术，在视频监控、视频检索、虚拟现实、人机交互等领域有广泛的应用前景。团队研究结合深度信息的视频序列中动作的识别与分类方法，主要包括：动作序列的检测与分割、动作显著性特征的学习与表达、动作的分类与预测等。

4. 文档图像分析与理解

文档图像能够使人们能够方便有效地对文档进行存储、检索和传输，因而越来越受到大家的关注。团队研究针对文档图像的图像去噪、校正、版面分析、拼接、扭曲恢复、表达、检索等关键技术，旨在构建高可靠性的文档图像处理系统。

5. 目标表面缺陷检测与三维重建

研究基于视觉信息的目标表面缺陷的检测与定位技术、分割技术、分类技术，完成目标表面的三维重建与可视化。

已获授权专利

宋永红、姚志茂、孟高峰、张元林、万湘琳，一种基于形状特征的带边框矩形印章图形提取方法，ZL200910150816.1，申请日：2009/6/15，授权日：2013/8/14
宋永红、张元林、肖桂林、孟高峰、雷东东，一种半色调文档图像的噪声处理方法，ZL200910022698.6，申请日：2009/5/26，授权日：2011/11/16
宋永红、张云、张元林，基于局部信息的文档图像校正方法，ZL201310303996.9，申请日：2013/7/18，授权日：2016/3/2
宋永红、张元林、孟泉、雍旭东、刘跃虎、陈晓，一种基于多特征的文本图像相似度度量方法，ZL201310332513.8，申请日：2013/8/1，授权日：2016/6/29
宋永红、张云、张元林、刘阳，一种手绘草图离线识别与整形方法，ZL201310289788.8，申请日：2013/7/10，授权日：2016/5/25
宋永红、俞雨、张元林，基于深度信息的指尖检测方法，ZL201310407231.X，申请日：2013/9/9，授权日：2016/7/6
宋永红、张元林、雍旭东，一种文字图像特征差异的快速计算方法，ZL201310331596.9，申请日：2013/8/1，授权日：2016/8/10
宋永红、龚晨、张元林，基于背景密度估计的印章图像提取方法， ZL201410690319.1，申请日：2014/11/25 ，授权日：2017/2/22
宋永红、郁冲、张元林，一种基于直线连续性的文档图像来源判别方法，ZL201410389826.1，申请日：2014/8/8 ，授权日：2017/2/15
宋永红、龚晨、张元林，基于局部纹理方向性的图像增强方法， ZL201410741870.4，申请日：2014/12/8，授权日：2017/4/19