HM—python+大数据就业课2024.9资源介绍:
学完收获:
熟练使用DS、Oozie、AirFlow等任务调度工具,完成大数据任务调度
熟悉Linux基本操作,完成分布式虚拟机搭建任务
了解数据仓库开发从需求沟通、标签定义、编码开发、整个流程
能够掌握Python语言基础,利用Python语言完成常见编程任务
能够掌握Pandas数据处理和数据分析的工作
能够掌握Java语言基础,利用Java完成MapReduce编程,Flink任务编程
熟练掌握Hadoop生态体系,掌握MapReduce原理及优化技巧
熟悉掌握Spark生态技术栈,利用SparkCore基础数据处理
能够使用SparkSQL完成大数据数据处理及统计分析
能够掌握Hive基础内容,利用HiveSQL完成基础数据仓库构建
能够利用Spark On Hive完成企业级离线数据处理及统计工作
熟练Mysql数据库,有使用一种ETL方式经验优先
完成Spark/Hadoop/HBase/Kafka/Flink等组件的搭建
能够基于Flink进行实时分析和离线分析
掌握Flink核心4大特性
能够基于FlinkSQL完成常见大数据统计分析任务
能够使用Hbase完成大数据异构数据存储
能够掌握Kafka消息队列基础使用
能够掌握Kafka和Flume对接完成实时数据采集工作
熟练使用FineBi等BI工具完成数据展示任务
资源目录:
01阶段:数据库基础
02阶段:Orcale
03阶段:Hadoop技术栈
04阶段:项目一【黑马甄选】
05阶段:基于Al大模型数据开发项目实战
06阶段:Python基础编程
07阶段:项目二【BI报表开发】
08阶段:数据分析pandas
09阶段:Spark技术栈
10阶段: kafka及结构化流
11阶段:项目三【用户画像】
12阶段:Flink全栈开发
13阶段:项目四【实时计算项目】
Python大数据课件
HTTPDebuggerSession.xml