tooyoungtoosimple(Too)
过去四十年,决定经济发展的是摩尔定律,而在未来二十年,真正改变经济发展的是大数据。
因为数据分析,就是传说中预知未来的超能力,所有的公司未来都会是数据公司。

显而易见,无论哪一个领域都会用到data science,而data analyst作为data science的一个分支职位,在未来也将是极度供不应求的工作。
IBM报告曾指出到2020年,全球将出现270W Data Science岗位缺口,仅在美国就将增加36W。
作为Data Analyst,其中必备技能就要有独立把数据化为己用的能力,然而,这种能力并不是一蹴而就的,而是需要积累的,这就需要我们从小夯实基础,培养对数据的敏感度。
那么会有人对数据是天生敏感的吗?
当!然!有!
但是这些人毕竟是少数,更多的人还是为数据所惑,云里雾里,感慨数据的神奇与玄妙,但是万物有规律可循。

是不是存在一种或几种切实可行的工具或方法,能够帮助我们更好地理解数据?理解数据背后的含义?理解事物联系的因果?
答案是肯定的,Python就是目前常用的做数据分析的主流语言。
利用Python进行数据分析,那Python的基础就非常重要了,这意味着你后续是否能够正常地用Python代码来实现你的分析想法。
很多时候,我们拿到的数据是不干净的,数据的重复、缺失、异常值等等。这时候就需要进行数据的清洗,把这些影响分析的数据处理好,才能获得更加精确地分析结果。

而在Python中,有个非常重要的库Pandas,是需要掌握的,因为很多的数据处理及分析方法就源于其中。如果把Python比作是我们的房子,为我们提供基础的框架,那么Pandas就是房子里的电器,为我们入住提供各种功能。
学会 Pandas 库的用法,应对一般的数据清洗就完全没问题了。
是不是听起来很厉害呢?
不用羡慕哦~我们四点半擎课堂的老师们明日将带领大家再次走进数据的世界,与你一起挖掘数据、清洗数据,让数据说话!