Welcome - 宋永红 - 教师个人主页

Basic Information

宋永红

研究员，博士生导师

PMI认证项目管理专家

Contact Information

电话：029-82663000-8015

Email：songyh@xjtu.edu.cn

地址：陕西省西安市咸宁西路28号

西安交通大学软件学院

邮编：710049

办公室：兴庆校区软件学院西小楼 A205

办公室：创新港校区泓理楼-4159

News

2025年开门红---好消息 Up

2025-01-14
2024第13弹 Up

2024-12-06
2024第9-12弹 Up

2024-11-16
2024第八弹 Up

2024-11-08
2024第七弹 Up

2024-08-11
2024第六弹 Up

2024-08-07
More news

Lecture Course

研究生课程：

《软件能力成熟度模型》
《软件过程与管理》
《软件工程综合训练》

本科生课程：

《软件项目管理》

具有20多年的软件项目研发与管理经验，擅长金融信息系统、分布式软件系统的研发。

Work Experience

1. 2002年-至今，就职于西安交通大学，主要从事计算机视觉，包括：图像处理、模式识别与智能系统、机器学习、深度学习，等领域的算法研究工作。

2. 1996年—2002年，就职于日本PSB株式会社，担任情报事业本部金融系统开发部部长，从事大型金融、保险软件研发与项目管理。

3. 1992年—1996年，就职于中国煤田地质总局航测遥感局图像处理研究所，主要从事地理信息与遥感图像处理的方法研究与系统开发工作。

4. 1989年—1991年，就职于中国科学院遥感应用研究所，参加了我国“七五”攻关项目“高空机载遥感系统”的研究与开发工作。

站点计数器

Blank7

课题组每年招收博士研究生、硕士研究生与本科实习生，具体研究方向包括图像处理、模式识别与智能系统、机器学习、深度学习等领域。
课题组提供良好的科研环境氛围，并且有一批专业的老师、专家、同学来指导、合作。

欢迎自动化、计算机、软件工程、数学、等学科、对人工智能及其在智能金融、智能制造、智能交通、等领域得研究工作有浓厚兴趣，具有钻研和探索精神、团队合作意识、思想品质优秀、专业知识扎实得同学与宋永红老师联系(songyh@xjtu.edu.cn)，欢迎优秀学子们加入！

Research Fields

1. 视频内容分析与理解

2. 文档图像内容分析与处理

3. 文字检测与识别

4. 产品缺陷检测与识别

5. 大型分布式系统研发

Academic Exchange

作为项目负责人承担与日本富士施乐公司、宝钢集团公司、华为、日本欧姆龙公司、中国铁道部科学研究院、国家管网、等合作伙伴的产学研合作项目，包括：

1. 文档图像处理与图文分析编码

2. 自然场景图像目标检测与识别

3. 钢板表面缺陷检测与分类

4. 产品质量实时在线监测

5. 视频分析算法研究

6. 面向安检的人脸检测与识别技术

7. 连续视频帧中的行为分析与理解

8. 安检行业违禁品检测与识别方法研究项目

9. 工业产品自动质量判级

10. 高速铁路危情识别算法研究

11. 金融票据鉴真与变造识别方法研究

12. CT断面图像生成方法研究

13. 基于视频的评标室违规行为检测与识别

14. 基于多传感技术融合的高铁周界入侵报警前端监测技术研究

15. 基于视频图像内容分析的铁路线路危情监测智能化提升关键技术研究

16. 城轨列车振动信号治理

17. 铁路场景下视频危情识别技术研究

18. 天然气管网模型转换与快速建模方法研究

19. 户外全天候监控视频的异常行为检测关键技术及其应用

…

Blank3

Jiawei Zheng，Yonghong Song，Learning the Beneficial, Forgetting the Harmful: High Generalization Reinforcement Learning with in Evolving Representations, Journal: Neurocomputing, Volume 619, 28 February 2025, 129139, ISSN: 0925-2312，https://doi.org/10.1016/j.neucom.2024.129139
P. Guo, Y. Song, B. Wang, J. Liu and Q. Zhang, "PLBR: A Semi-Supervised Document Key Information Extraction via Pseudo-Labeling Bias Rectification," in IEEE Transactions on Knowledge and Data Engineering, vol. 36, no. 12, pp. 9025-9036, Dec. 2024, doi: 10.1109/TKDE.2024.3443928.
Chenning Kang,Yonghong Song,Pengcheng Guo, LHE-PSN A Photometric Stereo Network with Lightweight High-frequency Enhancement Module, 2024 7th Artificial Intelligence and Cloud Computing Conference be held at Tokyo, Japan, 14 Dec - 16 Dec 2024.
Jiawen Chen,Yonghong Song, Area Mapping via Pseudo Label Discovery for Weakly Supervised Object Detection, the 2024 International Conference on Progress in Informatics and Computing (PIC-2024), be held at Shanghai,China, 20 Dec - 22 Dec 2024.
Qi Zhang, Yonghong Song, Pengcheng Guo, Yangyang Hui,CRMSP: A semi-supervised approach for key information extraction with Class-Rebalancing and Merged Semantic Pseudo-Labeling,Neurocomputing,Volume 616,2025,128907,ISSN 0925-2312, https://doi.org/10.1016/j.neucom.2024.128907.
Meng, X., Song, Y., & Li, G. (2024). Nested transformer decoder using dense skip-connections for change detection in high-resolution remote sensing image. International Journal of Remote Sensing, 45(22), 8061–8083. https://doi.org/10.1080/01431161.2024.2398225
Z. Meng, Y. Song, Y. Zhang, Y. Nan and Z. Bai, "Traffic Object Detection for Autonomous Driving Fusing LiDAR and Pseudo 4D-Radar Under Bird’s-Eye-View," in IEEE Transactions on Intelligent Transportation Systems, vol. 25, no. 11, pp. 18185-18195, Nov. 2024, doi: 10.1109/TITS.2024.3417826.
Li, S., Song, Y., Wu, X., Su, Y., & Zhang, Y. (2024). MFMENet: multi-scale features mutual enhancement network for change detection in remote sensing images. International Journal of Remote Sensing, 45(10), 3248–3273. https://doi.org/10.1080/01431161.2024.2343139
Liu T, Huang S, Li R, Gao P, Li W, Lu H, Song Y, Rong J. Dual and Multi-Target Cone-Beam X-ray Luminescence Computed Tomography Based on the DeepCB-XLCT Network. Bioengineering (Basel). 2024 Aug 28;11(9):874. doi: 10.3390/bioengineering11090874. PMID: 39329616; PMCID: PMC11428951.
Li Z , Liu Y , Song Y .Image Caption Method from Coarse to Fine Based On Dual Encoder-Decoder Framework[C]//2024 International Joint Conference on Neural Networks (IJCNN).0[2024-10-20].DOI:10.1109/IJCNN60899.2024.10650584.
Hanxiao Li, Yonghong Song, Tong Geng, Semi-Supervised Crowd Counting Based on Hard Pseudo-Labels, the IEEE World Congress on Computational Intelligence (IEEE WCCI 2024) to be held at Pacifico Yokohama, Yokohama, Japan, 30 June - 5 July 2024.
Ke Jia, Yonghong Song, Video Anomaly Detection Via Self-supervised Learning With Frame Interval and Rotation Prediction, IEEE Conference on Multimedia Expo 2024, July 15-19 ,2024, in Niagara Falls
DaiLiang Zhou, YongHong Song,PNSP: Overcoming catastrophic forgetting using Primary Null Space Projection in continual learning,Pattern Recognition Letters,Volume 179,2024,Pages 137-143,ISSN 0167-8655,https://doi.org/10.1016/j.patrec.2024.02.009.
Jiawei Zheng, Yonghong Song*，Effective Representation Learning is More Effective in Reinforcement Learning than You Think，2024 IEEE International Conference on Robotics and Automation (ICRA)
Z. Chen, Y. Song, Y. Ma, G. Li, R. Wang and H. Hu, "Interaction in Transformer for Change Detection in VHR Remote Sensing Images," in IEEE Transactions on Geoscience and Remote Sensing, vol. 61, pp. 1-12, 2023, Art no. 3000612, doi: 10.1109/TGRS.2023.3324025.

查看完整列表

Blank2

1. 场景图像中文字检测与提取

图像中的文字是可以直接传递内容语义的重要信息源，由于自然场景的复杂性和其中的文字的大小、颜色、字体、语种、排列方向等的多样性，自然场景图像中的文字检测是一个非常有挑战性的问题。团队研究自然场景中文字的检测和提取方法，其中包括：复杂自然场景图像中文字特征的学习与筛选方法、基于多级信息集成机制的文字判别分析、等关键技术。

2. 手势识别

手势是人类常用的一种符号化语言，在传递信息时具有快速、方便、自然的特点。因此手势的自动识别一直是学术界关注的热点。团队主要侧重于结合深度信息的手势识别方法的研究，其中包括：指尖检测与定位、手部姿态估计与建模、手势识别与分类等。

3. 动作识别

动作识别结合了模式识别与机器学习、人工智能、等多个学科的理论与技术，在视频监控、视频检索、虚拟现实、人机交互等领域有广泛的应用前景。团队研究结合深度信息的视频序列中动作的识别与分类方法，主要包括：动作序列的检测与分割、动作显著性特征的学习与表达、动作的分类与预测等。

4. 文档图像分析与理解

文档图像能够使人们能够方便有效地对文档进行存储、检索和传输，因而越来越受到大家的关注。团队研究针对文档图像的图像去噪、校正、版面分析、拼接、扭曲恢复、表达、检索等关键技术，旨在构建高可靠性的文档图像处理系统。

5. 目标表面缺陷检测与三维重建

研究基于视觉信息的目标表面缺陷的检测与定位技术、分割技术、分类技术，完成目标表面的三维重建与可视化。

Blank1

宋永红、姚志茂、孟高峰、张元林、万湘琳，一种基于形状特征的带边框矩形印章图形提取方法，ZL200910150816.1，申请日：2009/6/15，授权日：2013/8/14
宋永红、张元林、肖桂林、孟高峰、雷东东，一种半色调文档图像的噪声处理方法，ZL200910022698.6，申请日：2009/5/26，授权日：2011/11/16
宋永红、张云、张元林，基于局部信息的文档图像校正方法，ZL201310303996.9，申请日：2013/7/18，授权日：2016/3/2
宋永红、张元林、孟泉、雍旭东、刘跃虎、陈晓，一种基于多特征的文本图像相似度度量方法，ZL201310332513.8，申请日：2013/8/1，授权日：2016/6/29
宋永红、张云、张元林、刘阳，一种手绘草图离线识别与整形方法，ZL201310289788.8，申请日：2013/7/10，授权日：2016/5/25
宋永红、俞雨、张元林，基于深度信息的指尖检测方法，ZL201310407231.X，申请日：2013/9/9，授权日：2016/7/6
宋永红、张元林、雍旭东，一种文字图像特征差异的快速计算方法，ZL201310331596.9，申请日：2013/8/1，授权日：2016/8/10
宋永红、龚晨、张元林，基于背景密度估计的印章图像提取方法， ZL201410690319.1，申请日：2014/11/25 ，授权日：2017/2/22
宋永红、郁冲、张元林，一种基于直线连续性的文档图像来源判别方法，ZL201410389826.1，申请日：2014/8/8 ，授权日：2017/2/15
宋永红、龚晨、张元林，基于局部纹理方向性的图像增强方法， ZL201410741870.4，申请日：2014/12/8，授权日：2017/4/19