BDM125:Hadoop大數據開發精品實戰

開班計劃時間:36 小時
上課地點 上課方式 預計上課時間
北京 線下面授
2020/1/4、5、11、12
預約試聽 馬上咨詢
課程介紹
適用對象:需要了解大數據,或者需要熟知大數據管理、維護、開發和數據分析的人
學習收獲:1、了解大數據在行業的發展情況 2、了解大數據的理論基礎知識 3、了解大數據的發展趨勢 4、動手Clouders Manager的安裝和部署 5、熟知CDH的安裝配置和解決越到的問題 6、熟悉Hadoop分布式文件系統 7、懂得hdfs分布式文件系統的使用 8、了解MapReduce工作原理 9、熟知Hadoop集群硬件配置規劃 10、懂得Hadoop集群配置及優化 11、學會如何維護和監測Hadoop集群 12、學會怎么使用Sqoop連接關系數據庫進行數據導入導出 13、了解Hive數據倉庫的開發和應用 14、Hue的web頁面的數據庫開發 15、精通Hbase列式數據庫的開發 16、熟悉hadoop衍生數據處理 17、學會kettle等數據處理的工具
詳細大綱
1 大數據的基礎介紹
1.1 什么是大數據?
1.2 大數據時代的背景
1.3 學術上怎么定義大數據?
1.4 大數據的構成
1.5 大數據的演進過程
2 大數據帶來的影響
2.1 大數據的關鍵技術
2.2 大數據分布式系統的構成
2.3 計算模式
2.4 大數據產業
2.5 大數據與云計算的關系
2.6 大數據和物聯網的關系
3 安裝和配置
3.1 VMware虛擬機安裝和配置
3.2 CentOS5且64位系統安裝
3.3 簡單的配置和遇到的問題
3.4 動手和實操
3.5 Cloudera Manager的離線安裝
3.6 Cloudera CDH的離線安裝的環境準備 和配置,注意事項
3.7 單機版、偽分布式、真分布式介紹和區別
3.8 詳細介紹了CDH的部署配置,遇到的問題,怎么解決
3.9 HDFS分布式文件系統的安裝配置和測試
3.10 1hdfs的權限配置,目錄創建,目錄查看等命令的使用
4 如何構建分布式數據倉庫平臺
4.1 怎么樣才算是真正意義的大數據平臺
4.2 開源Hadoop生態系統的介紹
4.3 數據采集過程與分布式存儲
4.4 數據倉庫與數據分析介紹
4.5 集群監控與調度組件
4.6 Hue介紹和例子講解
4.7 練習
4.8 案例講解
5 Hive數據倉庫及案例
5.1 Hive基本介紹
5.2 Hive命令
5.3 Hive優化
5.4 Hive的用戶自定義函數
5.5 Hive練習和案例
6 大數據平臺部署及案例
6.1 我們應該選哪種Hadoop?
6.2 集群硬件應該如何選配?
6.3 部署案例講解
7 Hbase列數據庫及應用案例
7.1 Hbase感性認識
7.2 Hbase主要組成
7.3 Hbase性能測試
7.4 Hbase設計原則和優化
7.5 例子和練習
7.6 項目案例:
8 Kafka詳解及應用案例
8.1 Kafka的基本介紹
8.2 Kafka的原理解析
8.3 Kafka安裝和部署
8.4 Kafka的Java應用開發
8.5 Kafka與Hadoop集成
8.6 練習
8.7 案例
9 Hadoop衍生數據處理詳解
9.1 ETL數據處理介紹
9.2 Kettle 介紹
9.3 Kettle適用
9.4 Kettle案例
9.5 JAVASCRIPT的基本應用
9.6 文件FTP下載、上傳
9.7 作業調用作業、轉換
9.8 啟動腳本說明
9.9 JAVA調用作業、轉換
9.10 kettle使用原則
課程評價

課程評價({{EvaluationTotal}})

課程滿意度

評價

您還沒有給課程評分哦

滿意度

    追加評價:

課程咨詢
內容:

您還沒有填寫內容!

暫無問答,趕緊去提問吧
{{item.AnswerState==1?"已解決":"未解決"}}
{{item.Content}}
{{item.StudentAskTime}}
{{itemanswer.UserName}}
{{itemanswer.Content}}
{{itemanswer.StudentAskTime}}
同類課程推薦 more
嘉為大講堂 more
原創文章 more

您好! 歡迎來到學領未來 !

學領未來提供線上及線下的學習服務,根據您的位置,為您推薦最近的線下培訓地點 分站,你選擇:

广东十一选五技巧规律