细分课程 |
周 |
日 |
内容 |
详细内容 |
预习课 (录播) |
|
|
数据库sql |
1. 数据库基本概念 2. ddl数据定义语言 3. dml数据操作语言 4. 单表查询 5. 多表查询 6. python连接sql |
python编程 |
1. python标准数据类型 2. 控制流语句 3. 自定义函数 4. 异常和错误 5. 类与面向对象编程 6. numpy数组操作 7. 用python做数据分析,必会的库pandas 8. 用pandas做数据清洗与数据探索 9. python数据可视化库(matplotlib,seaborn) |
数学与统计学基础 |
1. 线性代数 2. 微积分 3. 描述性统计 4. 参数估计 5. 假设检验 6. 相关分析 7. 卡方分析 8. 一元线性回归理论推导 9. 多元线性回归理论推导 |
附加内容 |
第1周 |
周六 |
etl数据接入与数据模型管理 |
1. 数据分类 2. 数据建模 3. etl基本概念与常用工具 4. 基于python的etl程序开发 5. etl实战项目 6. 数据接入策略与调度工具 |
机器学习进阶 (level 3) |
周日 |
大数据平台spark,数据挖掘导论 |
1. 数据挖掘导论 2. 梯度下降 3. 分布式存储与计算 4. spark与flink工作原理 5. spark基本语法 6. 使用pyspark实现分布式计算 |
第2周 |
周六 |
决策树 |
1. 决策树与信息熵 2. id3, c4.5, cart树 3. 模型调优:网格搜索与交叉验证 4. 决策树的pyspark实现 5. 分类模型的评估(混淆矩阵,roc等) 6. 决策树之欺诈识别案例 |
周日 |
正则回归,pipeline |
1. 正则项的理论基础 2. 带正则项的回归 3. pipeline工作流专题 4. 使用pipeline部署算法模型 |
第3周 |
周六 |
关联规则与协同过滤 |
1. 关联规则(关联规则的概念,评估指标,apriori算法) 2. 协同过滤 3. 大数据环境下的协同过滤实现 4. 产品组合策略-零售产品捆绑销售策略分析案例 |
周日 |
集成算法基础 |
1. 集成学习的理论基础 2. bagging, boosting, stacking 3. adaboost 4. 随机森林 5. gbdt, xgboost |
第4周 |
周六 |
爬虫,文本分析 |
1. 数据的爬取(http原理, requests应用, html结构及xpath应用) 2, 非结构化数据的加工处理 3. 文本数据处理之正则表达式 |
周日 |
机器学习进阶,人工智能基础 |
1. lightgbm 2. 数据不平衡问题 3. 进阶调参方法python实践 4. 贝叶斯调参python实践 5. 人工智能基础与网页端的使用 6. 常用人工智能软件 7. 人工智能相关库的环境配置 |
第5周 |
周六 |
人工智能基础 |
1. 深度神经网络基础:感知器及多层感知器 2. 神经网络架构 3. bp反向传播算法 4. 优化算法专题 5. 卷积神经网络(选修) 6. pytorch框架与代码实践 7. openai api之python代码实践 8. 图像分析-手写数字自动识别 |
周日 |
聚类分析进阶与异常识别 |
1. 聚类分析进阶(密度聚类,高斯混合聚类) 2. 聚类分析的spark实现 3. 异常识别(孤立森林,局部异常因子) 4. 交易反欺诈-异常交易识别案例 |
第6周 |
周六 |
人工智能nlp之文本挖掘 |
1. 分词与词性标注 2. 文本信息提取 3. 词嵌入与词模型(cbow与skip-gram) 4. 构建文本信息库 5. 文本聚类算法 6. 词模型的pytorch实现 7. 文本分类算法的pytorch实现 |
周日 |
大型项目案例 |
实战项目-金融风控大型案例 |
第7周 |
周六 |
人工智能nlp之大语言模型llm |
1. 循环神经网络rnn 2. 编码器与迁移学习 3. 残差连接resnet 4. transformer架构 5. 大语言模型llm技术架构与训练方法 6. 开源模型平台与框架的代码实践 7. llm的本地化部署 |
第8周 |
周六 |
大语言模型llm前沿方法 |
1. 聊天机器人的本地化部署 2. fine tuning 3. lora专题 4. 本地化llm的tuning代码实践 5. agent与lang chain 6. 向量数据库与知识库 7. 人工智能nlp的前沿方向 |
cda认证考试辅导 (仅限报名考试的学生) |
|
|
level 3 认证考试辅导 |
cda level 3 认证考试辅导 1. 数据挖掘概论 2. 高级数据处理与特征工程 3. 自然语言处理与文本分析 4. 机器学习算法 5. 机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化) |
选修课 |
|
|
选修课 |
1、互联网数字化运营【18课时】 2、何为数据产品经理?【1课时】 3、python爬虫【15课时】 4、人工智能(深度学习)实战之图像识别【6课时】 5、tableau多维可视化分析【3课时】 6、spss统计分析【12课时】 |