细分课程 |
周 |
日 |
内容 |
详细内容 |
预习课 (录播) |
|
|
数据库SQL |
1. 数据库基本概念 2. DDL数据定义语言 3. DML数据操作语言 4. 单表查询 5. 多表查询 6. Python连接SQL |
Python编程基础 |
1. Python标准数据类型 2. 控制流语句 3. 自定义函数 4. 异常和错误 5. 类与面向对象编程 6. Numpy数组操作 7. 用Python做数据分析,必会的库Pandas 8. 用Pandas做数据清洗与数据探索 9. Python数据可视化库(Matplotlib,Seaborn) |
数学与统计学基础 |
1. 线性代数 2. 微积分 3. 描述性统计 4. 参数估计 5. 假设检验 6. 相关分析 7. 卡方分析 8. 一元线性回归理论推导 |
商业策略分析 (Level 2) |
第1周 |
周六 |
SQL |
1. 数据库MySQL语句与实战 2. Python连接SQL数据库 3. SQL使用案例 4. 金融行业多表分析案例 |
周日 |
指标体系与数据治理进阶 |
1. 分析基础-数据分析的概念、过程、能力 2. 指标体系的意义与构建 3. 常用指标体系示例 4. 数据治理进阶 5. 淘宝经营分析案例 |
第2周 |
周六 |
Pandas与数据可视化 |
1. Python基础与数据清洗可视化技术回顾 2. Python数据可视化常用方法 3. 交通数据分析 4. 经典数据集:生还率的影响因素 5. 零售行业产品分析 |
周日 |
方差分析,线性回归 |
1. 方差分析 2. 线性回归(模型的建立与估计) 3. 统计模型的检验 4. 识别分析-用户支出影响因素分析案例 |
第3周 |
周六 |
逻辑回归,主成分分析 |
1. 逻辑回归(模型的建立与估计) 2. 模型评估 3. 信息压缩-主成分分析与因子分析(数据降维) 4. 成交分析-Talkingviews案例 5. 因子分析-城市发展水平综合分析 |
周日 |
标签体系与用户画像 |
1. 标签体系的设计原理 2. 用户标签的制作方法 3. 客群分析-标签体系与用户画像 4. 应用用户画像-信用卡持卡用户画像实战案例 |
第4周 |
周六 |
时间序列 |
1. 时间序列分析(ARIMA算法) 2. Box-Jenkins 建模流程 3. 时间序列回归 4. 销售额预测-线上平台销售额预测实战案例 |
周日 |
聚类分析,决策树应用 |
1. 层次聚类 2. Kmeans聚类 3. 聚类分析评价方法-决策树应用 4. 用户分群-金融行业运营案例 |
第5周 |
周六 |
数据采集与处理,特征工程基础 |
1. 数据采集(概率与非概率抽样) 2. 数据处理方法(数据录入,数据清洗,数据编码) 3. 特征工程基础(特征预处理,特征的选择与转换) |
周日 |
数字化工作方法,最优化方法 |
1. 数字化工作方法 2. 运筹优化方法(线性规划与二次优化,基于业务流程的优化) 3. 数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
附加内容 |
第6周 |
周六 |
ETL数据接入与数据模型管理 |
1. 数据分类 2. 数据建模 3. ETL基本概念与常用工具 4. 基于Python的ETL程序开发 5. ETL实战项目 6. 数据接入策略与调度工具 |
机器学习与人工智能 (Level 3) |
周日 |
大数据平台Spark,数据挖掘导论 |
1. 数据挖掘导论 2. 梯度下降 3. 分布式存储与计算 4. Spark与Flink工作原理 5. Spark基本语法 6. 使用PySpark实现分布式计算 |
第7周 |
周六 |
决策树 |
1. 决策树与信息熵 2. ID3, C4.5, CART树 3. 模型调优:网格搜索与交叉验证 4. 决策树的PySpark实现 5. 分类模型的评估(混淆矩阵,ROC等) 6. 决策树之欺诈识别案例 |
周日 |
正则回归,Pipeline |
1. 正则项的理论基础 2. 带正则项的回归 3. Pipeline工作流专题 4. 使用Pipeline部署算法模型 |
第8周 |
周六 |
关联规则与协同过滤 |
1. 关联规则(关联规则的概念,评估指标,Apriori算法) 2. 协同过滤 3. 大数据环境下的协同过滤实现 4. 产品组合策略-零售产品捆绑销售策略分析案例 |
周日 |
集成算法基础 |
1. 集成学习的理论基础 2. Bagging, Boosting, Stacking 3. AdaBoost 4. 随机森林 5. GBDT, XGBoost |
第9周 |
周六 |
爬虫,文本分析 |
1. 数据的爬取(http原理, requests应用, HTML结构及xpath应用) 2, 非结构化数据的加工处理 3. 文本数据处理之正则表达式 |
周日 |
机器学习进阶,人工智能基础 |
1. LightGBM 2. 数据不平衡问题 3. 进阶调参方法python实践 4. 贝叶斯调参python实践 5. 人工智能基础与网页端的使用 6. 常用人工智能软件 7. 人工智能相关库的环境配置 |
第10周 |
周六 |
人工智能基础 |
1. 深度神经网络基础:感知器及多层感知器 2. 神经网络架构 3. BP反向传播算法 4. 优化算法专题 5. 卷积神经网络(选修) 6. Pytorch框架与代码实践 7. Openai api之python代码实践 8. 图像分析-手写数字自动识别 |
周日 |
聚类分析进阶与异常识别 |
1. 聚类分析进阶(密度聚类,高斯混合聚类) 2. 聚类分析的Spark实现 3. 异常识别(孤立森林,局部异常因子) 4. 交易反欺诈-异常交易识别案例 |
第11周 |
周六 |
人工智能NLP之文本挖掘 |
1. 分词与词性标注 2. 文本信息提取 3. 词嵌入与词模型(CBOW与Skip-gram) 4. 构建文本信息库 5. 文本聚类算法 6. 词模型的Pytorch实现 7. 文本分类算法的Pytorch实现 |
周日 |
大型项目案例 |
实战项目-金融风控大型案例 |
第12周 |
周六 |
人工智能NLP之大语言模型LLM |
1. 循环神经网络RNN 2. 编码器与迁移学习 3. 残差连接ResNet 4. Transformer架构 5. 大语言模型LLM技术架构与训练方法 6. 开源模型平台与框架的代码实践 7. LLM的本地化部署 |
第13周 |
周六 |
大语言模型LLM前沿方法 |
1. 聊天机器人的本地化部署 2. Fine tuning 3. Lora专题 4. 本地化LLM的tuning代码实践 5. Agent与Lang Chain 6. 向量数据库与知识库 7. 人工智能NLP的前沿方向 |
选修课 |
|
|
选修课 |
1、互联网数字化运营【18课时】 2、何为数据产品经理?【1课时】 3、Python爬虫【15课时】 4、人工智能(深度学习)实战之图像识别【6课时】 5、Tableau多维可视化分析【3课时】 6、SPSS统计分析【12课时】 |