如何在实验室快速成为数据科学家

 

实验室积累了大量行为相关的核心数据,数据科学家的作用在于利用这些数据创造性地解决一些实际问题,从大数据中创造经济、社会价值。这不仅需要必要的数据分析技能,更重要的是发现问题、解决问题的能力。关于如何培养解决实际问题的能力,主要有以下3点:

1.掌握必要的数据分析技能,方便对数据进行探索。数据分析不仅体现在解决问题的过程中,而且在发现问题的阶段,往往需要对数据进行分析探索。在这一阶段,实验室大数据组积累了丰富的数据分析处理经验,大家可以向相关同学请教学习,快速成长。

2.培养自己发现问题的能力。在此阶段的必备技能:数据思考+文献阅读+交流沟通。一个好的实际问题不是轻而易举就能找到的。首先,需要对手边的数据进行思考,理解数据背后的洞察。以用户时空数据为例,其最表面的含义就是表示用户的空间活动轨迹,因此相应的研究早已存在。如果你对数据进行深入思考,就会发现数据同样反应城市人口交通出行,此时就可以找到一些别人不容易想到的问题。其次,需要阅读大量相关的文献。在充分了解数据之后,我们往往还是没有找到有趣的问题,此时,需要阅读大量的文献,从文献中找问题。以城市地铁网络扩建为例,正是在阅读大量文献之后,将用户时空数据的用途定位在解决城市交通网络的设计上。此外,要注重与老师、周围同学的沟通交流。每周的组会为大家提供了了解别人工作的机会,尤其是促进了管工学科同学进行跨学科研究。别人的研究问题可以开阔你的眼界,别人解决问题的方法可以被借鉴用来解决你的问题。课题组良好的研究氛围,可以使学生更快地出成果。

3.培养自己解决问题的能力。解决实际问题,一定要从行业背景出发,善于利用各种合理的技术、模型。目前课题组涉及深度学习、强化学习、数据挖掘等。课题组内人工智能小组每周进行文章、技术交流,有助于学生快速掌握相应的技术理论基础。