以下是我自己的学习路线,至少是我目前能回忆起来的一些学习路线,希望能帮到你们。虽然我之前学过前端的网站搭建框架,但是我忘了,因为我好久不用了,所以就不在这里介绍了。
一、python基础
基础
环境搭建
注释
变量
数据类型
数学计算
字符串
布尔值
列表
元组
集合
字典
控制流
函数
面向对象
继承
日期
JSON数据处理
格式化输入输出
警告处理
文件的基本处理
二、数据处理
需要掌握的模块:
模块
pandas
numpy
三、数据可视化
以下是常见需要绘制的图形,是需要掌握的:
内容
子图
散点图
折线图
柱形图
直方图
扇形图
K线图
箱型图
热力图
省市地图
水球图
个人建议需要掌握的模块:
模块
Matplotlib
Seaborn
Pyechart
五、网页基础与网络爬虫
需要掌握的网页基础内容:
内容
HTML
CSS
JS
需要掌握的网络爬虫内容:
基本模块
urllib
requests
re
Xpath
bs4
selenium
Scrapy
六、数据与服务器的管理
需要掌握的内容:
需要掌握
SQL
Linux
七、机器学习十大基本算法
以下是我脑子能想到比较常见的又还会的,不分顺序:
算法
线性回归
Logistic 回归
逐步回归
正则化(岭回归)
决策树
朴素贝叶斯
k-邻近算法(kNN)
Kmeans聚类
支持向量机(SVM)
随机森林(Random Forest)
主成份分析
主成分回归(PCR)
灰色关联
皮尔逊相关性
特征选择算法
XGBoost算法
LSTM模型
ARMA模型
神经网络
如果有时间,希望把西瓜书啃一遍。关于机器学习算法,可以使用Python和Matlab。哪样方便哪样来,本篇主要是介绍的Python,暑假我会更新一套完整的Matlab教程。
八、最后几句话
学习的过程不是一帆风顺的,一定要坚持。数据挖掘工程师在国内是很缺少的,自己打开招聘看看就知道了,对于有经验的数据工程师,至少都是两万起步,基本都能达到三万,这仅仅是公司的基本工资,如果还有股权,以及自己外快,具体自己算(不过要慢慢积累,不是说毕业就这么厉害了)。以上是我个人所学知识,但是对这些掌握也不能说是完全掌握,所以准备是要复习一遍。
对于学生,接触数据挖掘最多的应该就是大学期间的各种数学建模竞赛了,挑战性很强。最后说一句,不是你拿奖了,就代表你有这个实力了,不是说你没拿奖,就代表你没有这个实力了,数学建模竞赛,老玩家懂的都懂了,所以我就不直言。但是这个竞赛,我就把它定义为数据挖掘了。