掌握数据分析技术,支撑复杂商业决策
无论是数据规模的爆炸式增长,还是国内市场数据分析师的供不应求,似乎都在告诉我们,一个数据价值爆发的时代已经来临。掌握数据分析的方法,将帮助你提升工作和决策的效率,挖掘别人看不见的信息和价值。从现在开始,像数据分析师一样从分析的角度,客观、系统地思考业务问题,然后得出能够影响这些业务的解决方案。
课程适合这样的你
野路子的初级分析师
你从事最基础的数据工作,用Excel进行机械的采集、统计,本课程帮助你系统学习编程、统计知识和分析方法,了解一线企业的项目需求和实现,胜任更专业的数据分析工作。
想入行/转行的求职者
你是有前瞻眼光的理工科学生,或技术开发者,但不满足于现状,本课程将帮你打开职业的新可能。若你对数据热忱,向往高薪和广阔前景,通过这门课你将从零掌握数据分析核心技能。
要用数据撕逼的互联网人
你从事产品、运营、市场等非技术工作,但希望工作、方案、建议是基于客观的数据分析,这门课涉及的数据获取、存储、分析等技能将成为你不可替代的核心价值。
寻找最适合你的学习路径
最简单的学习框架,拒绝知识冗余
我们总结了无数招聘需求和竞赛用户踩坑的经验,你不需要看100本书,不需要学习冗余的知识,每学一部分你都能解决工作中的一个实际难题。即便你没有任何基础,不曾写过代码,仍然可以快速获得数据分析的技能。
一线企业案例,重现实际业务问题
以互联网金融用户信誉分析、智能交通轨迹分析、社交网络关系分析等多个方面案例为导向,你将通过这些案例了解一线企业的项目需求,学习数据获取、数据清洗、数据分析(数据挖掘)、数据报告撰写等全方位的技能。
数据分析学习计划
为保证学习效果,建议每周至少学习5-8小时,以下建议学习时间为观看视频课程、查看课后资料、完成练习题等时间之和
课程目录:
第一章 : 开启数据分析之旅
认识数据分析,搭建环境 建议学习时间:1天
了解数据分析的应用场景,以及实际业务中数据分析的基本流程,对学习路径有深入的认识,做好编程环境搭建等数据分析的准备工作
1-1 数据分析的一般流程及应用场景课时资料
1-2 Python编程环境的搭建及数据分析包的安装课时资料
第二章 : 获取你想要的数据
从互联网获取你想要的数据 建议学习时间:2周
了解获取公开数据集的方法。学习Python的基础知识,并通过Python爬虫来获取你想要的数据。你将了解基于API和网页两种形式的爬虫,以此你可以获取绝大多数网页数据。
2-1 获取互联网上的公开数据集课时资料
2-2 用网站API爬取网页数据课时资料
2-3 爬虫所需的HTML基础课时资料
2-4 基于 HTML 的爬虫,Python(Beautifulsoup)实现 课时资料
2-5 网络爬虫高级技巧:使用代理和反爬虫机制课时资料
2-6 应用案例:爬取豆瓣 TOP250 电影信息并存储课时资料
第三章 : 数据存储与预处理
用SQL存储和提取数据 建议学习时间:2周
学习SQL数据库的基本知识与操作语句,学会建立数据表、索引,实现数据的插入和读取,当你把所得数据存储进数据库后,能够进行数据的筛选、分组、聚合、排序以及重复值处理等工作,提取出你想要的数据。
3-1 数据库及 SQL 语言概述课时资料
3-2 基于 HeidiSQL 的数据库操作 课时资料
3-3 数据库进阶操作:数据过滤与分组聚合 课时资料
3-4 用 Python 进行数据库连接与数据查询 课时资料
3-5 其他类型数据库:SQLite&MongoDB 课时资料
3-6 用 Pandas 进行数据预处理:数据清洗与可视化 课时资料
第四章 : 统计学基础与Python数据分析
用统计和编程技术分析数据 建议学习时间:3周
学习数据分析中必备的概率、统计知识,了解常用于分析的指标,学习回归分析、统计建模和更高级的机器学习算法,并在实际的案例中应用numpy、pandas等python包进行数据分析,得出基于数据的结论。
4-1 探索型数据分析:绘制统计图形展示数据分布课时资料
4-2 探索型数据分析实践:通过统计图形探究数据分布的潜在规律(Seaborn实现)课时资料
4-3 描述统计学:总体、样本和误差,基本统计量课时资料
4-4 推断统计学:概率分布和假设检验课时资料
4-5 验证型数据分析实践:在实际分析中应用不同的假设检验(scipy实现)课时资料
4-6 预测型数据分析:线性回归课时资料
4-7 预测型数据分析:Python中进行线性回归(scikit-learn实现)课时资料
4-8 预测型数据分析:分类及逻辑回归课时资料
4-9 预测型数据分析:其它常用回归和分类算法(k近邻、决策树、随机森林)课时资料
4-10 预测型数据分析:聚类算法(k均值、DBSCAN)课时资料
4-11 预测型数据分析:用特征选择方法优化模型(一)课时资料
4-12 预测型数据分析:用特征选择方法优化模型(二)课时资料
4-13 预测型数据分析实践:用scikit-learn实现数据挖掘建模全过程课时资料
4-14 预测型数据分析实践:用rapidminer解决商业分析关键问题课时资料
4-15 高级数据分析工具:进阶机器学习技术概览课时资料
第五章 : 数据分析思维与全流程实战
数据分析全流程实战并形成报告 建议学习时间:1周
从问题定义、数据获取、数据预处理到数据分析、报告撰写,全方位的数据分析训练,学会独立分析商业问题,并通过数据分析的方法得出结论并作出决策。
5-1 养成数据分析的思维课时资料
5-2 全方位数据分析实战及报告撰写课时资料
5-3 课程回顾以及知识延伸
课程导师
如果觉得学习没有方向,你可能需要一盏灯塔
课程主讲老师
王乐业
香港科技大学博士后
王乐业,香港科技大学博士后,法国国立电信学院及巴黎六大计算机科学与技术专业博士。本科和硕士毕业于北京大学计算机科学与技 术专业。
目前研究方向研究方向为城市时空数据挖掘。从事研究工作包括通过社交网络识别个人兴趣、通过移动通信网络推理人群移动模式、以及通过公共交通数据优化交通站点分布等。发表论文20余篇,其中SCI10余篇,引用300余次。乐业老师是一位乐于分享的学者,善于用简单的方法解答复杂的问题。在他看来,找到好的学习方法和路径,其实可以少走很多弯路。
课程研发老师
周涛
电子科技大学教授
周涛,电子科技大学教授、大数据研究中心主任(团队有 9名国家千人,两名长江学者)。主要从事统计物理与复 杂性,数据挖掘与数据分析方面的研究。在Physics Reports、PNAS、Nature Communications等国际 SCI期刊发表300余篇学术论文,引用超过17000次,H 指数为63。2009年获教育部自然科学一等奖,2011年获第十二届中国青年科技奖(系我国最年轻的获奖者), 2015年当选全国十大科技创新人物。超级畅销书《大数据时代》译者,畅销书 《为数据而生:大数据创新实践》作者。周涛教授参与课程的研发和课程体系的设计,以多年的教学科研和企业数据团队管理经验为课程的顶层设计保驾护航。
课程截图:
评论0