
邮箱:
束俊,西安交通大学数学与统计学院副教授,博导。目前从事于机器学习基础理论与方法研究,主要包括:
现代机器学习的基础理论与方法
近些年,人工智能研究的突破之一是以ChatGPT、DeepSeek等为代表的大模型技术的显著发展。然而,相比技术水平的迅猛提升,机器学习的基础理论研究进展远远滞后,难以有效解释大模型技术发展中的实验现象,这对具有坚实理论基础的统计与机器学习研究带来巨大挑战。本研究方向主要从大模型的几个典型的技术实验现象的理论内涵作为分析对象,发展现代机器学习的基础理论和方法研究。主要研究内容包括:
大模型的极限理论:解译大模型智能涌现及尺度律的数学理论;大模型深度架构设计的设计原理与方法;非线性Lipschitz算子理论
大模型的学习理论:阐明大模型强任务泛化的数学理论;大模型微调及持续学习的数学理论及方法;模拟学习方法论的理论及方法
大模型的推断理论:大模型可靠推断的数学理论;任务自适应的大模型推断方法
模型学习方法论的框架、理论与方法
机器学习的核心目标是利用学习机模型实现“数据”到“标记”的预测规律,但目前机器学习自身的设计主要依赖于人工。本研究方向的核心思想是通过机器学习的方式来模拟实现人类专家设置机器学习的过程,即模拟学习方法论(Simulating Learning Methodology, SLeM)。SLeM的核心目标是利用元学习机模型实现从“学习任务”到“学习方法”的预测规律(即学习方法论)。主要研究内容包括:
SLeM的基础理论:SLeM的统计学习理论(学习方法论的泛化性理论);SLeM的优化理论(双层优化算法的收敛性理论);SLeM的表示理论
SLeM的基础方法:基于元数据的元学习实现途径;基于元知识的元正则化实现途径;基于prompt任务表示的大模型实现途径
SLeM的基础算法:机器学习自动化化算法簇(如数据自选择、标记自校正、模型自调节、损失自构建、算法自设计等);任务自切换/环境自适应的机器学习算法
机器学习与数学的交叉研究
该研究方向主要聚焦于机器学习与数学相关研究领域的交叉研究,如:
动力系统:数据驱动的非线性动力系统
PDE:AI for PDE的数据、架构、算法设计
优化:模型结构感知的优化算法设计
目前已在JMLR/TPAMI/TMLR/NSR/NeurIPS/ICML等国际顶级期刊和会议发表学术论文30余篇。主持科技部重点研发计划青年科学家项目、基金委面上项目以及多项企业横向课题等。研究成果受到领域广泛关注与认可,被诺贝尔物理学奖得主Geoffrey Hinton教授等领域知名学者正面引用和评价;被纳入国/境外名校课程,写入爱思唯尔出版社出版的三本教材。曾获教育部“基础学科拔尖学生培养计划”2.0“提问与猜想”活动特等奖优秀指导教师、“CCF 博士学位论文激励计划”提名、粤港澳大湾区(黄埔) 国际算法算例大赛擂台赛冠军等。
2027年(保研/考研)学硕名额2个、专硕名额1个、强基硕士名额1个、(直博/硕博连续/考核制)博士名额2个!
欢迎对机器学习基础研究感兴趣、有自驱力的博士生、硕士生、大二至大四本科生与本人联系:junshu@mail.xjtu.edu.cn
西安交通大学 - 应用数学 - 硕博连读 - 理学博士学位
西安交通大学 - 信息与计算科学 - 本科(学士) - 理学学士学位
西安交通大学 - 数学与统计学院 - 副教授 - 西安交通大学青年拔尖人才B类
琶洲实验室(黄埔) - 助理研究员