Greenplum分布式大數(shù)據(jù)實(shí)戰(zhàn)培訓(xùn)
培訓(xùn)班型: 企業(yè)內(nèi)訓(xùn)、公開課
課程長(zhǎng)度: 3天/18小時(shí)
培訓(xùn)講師: 博學(xué)高級(jí)講師
培訓(xùn)地點(diǎn): 杭州市文三路252號(hào)偉星大廈19樓博學(xué)教育
環(huán)境要求: 投影儀、白板、大白紙
培訓(xùn)形式: 實(shí)例講授,現(xiàn)場(chǎng)演、練、及時(shí)溝通
培訓(xùn)資料: 培訓(xùn)教材
課程內(nèi)容
Greenplum:Greenplum誕生于2003年硅谷,2010/07 EMC收購(gòu)了GREENPLUM,并把GREENPLUM作為EMC面向分析云的戰(zhàn)略核心產(chǎn)品,加以大力發(fā)展。該產(chǎn)品不僅在國(guó)際市場(chǎng)發(fā)展很快,在國(guó)內(nèi)市場(chǎng)發(fā)展也很快。最著名的案例就是阿里巴巴集團(tuán),經(jīng)過多種產(chǎn)品的精心選型,最終選擇GREENPLUM作為它們的數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)存放數(shù)百TB的業(yè)務(wù)數(shù)據(jù)去高效支持各種分析應(yīng)用。正是由于產(chǎn)品發(fā)展速度很快,但是在相關(guān)人才上存在很大缺口。
課程描述:本課程全面深入地介紹了Greenplum數(shù)據(jù)庫(kù)的方方面面,包括架構(gòu)特性、部署、理、開發(fā)和調(diào)優(yōu)等,由淺入深,理論結(jié)合實(shí)戰(zhàn),讓同學(xué)全面徹底掌握這把大數(shù)據(jù)利劍。
培訓(xùn)對(duì)象:本課程適合于有對(duì)數(shù)據(jù)庫(kù)和sql語句有一定了解,熟練使用linux系統(tǒng)的技術(shù)人員,特別適合于想換工作或?qū)で蟾咝铰殬I(yè)的人士。
課程目標(biāo):課程結(jié)束時(shí),幫助學(xué)員實(shí)現(xiàn)如下目標(biāo):
1、了解Greenplum的歷史及目前發(fā)展的現(xiàn)狀、以及它們的技術(shù)特點(diǎn),從而把握分布式計(jì)算框架及未來發(fā)展方向,在大數(shù)據(jù)時(shí)代能為企業(yè)的技術(shù)選型及架構(gòu)設(shè)計(jì)提供決策參考。
2、深入理解Greenplum的技術(shù)核心和管理操作,以此為基礎(chǔ),進(jìn)而掌握MPP架構(gòu)數(shù)據(jù)庫(kù)的使用和調(diào)優(yōu)的思想。
課程大綱:
1. Greenplum 概述
Greenplum 數(shù)據(jù)庫(kù)架構(gòu)和模塊
數(shù)據(jù)冗余模塊
數(shù)據(jù)監(jiān)控模塊
2. 分布式數(shù)據(jù)和查詢處理
分布式表結(jié)構(gòu)
3. 并行查詢規(guī)劃和執(zhí)行
硬件設(shè)置
軟件設(shè)置考慮
存儲(chǔ)考慮
OS考慮
硬件優(yōu)化
4. 數(shù)據(jù)庫(kù)內(nèi)部機(jī)制
System Catalog Table
數(shù)據(jù)庫(kù)物理存儲(chǔ)
數(shù)據(jù)庫(kù)進(jìn)程介紹
5. 安裝和初始化
安裝介紹
環(huán)境設(shè)置
數(shù)據(jù)庫(kù)初始化
軟件更新
6. Postgres PSQL
連接數(shù)據(jù)庫(kù)
運(yùn)行SQL語句
PSQL 命令
怎樣設(shè)置參數(shù)
怎樣查看參數(shù)
pg_hba.conf 配置文件
7. DDL 語句
Database
Schema
Table
Data Type
Constraints
其他數(shù)據(jù)庫(kù)對(duì)象
8. 角色授權(quán)介紹
數(shù)據(jù)庫(kù)用戶
數(shù)據(jù)庫(kù)群組
數(shù)據(jù)庫(kù)授權(quán)
資源隊(duì)列和工作負(fù)載管理
9. 表操作
表分區(qū)
怎樣分區(qū)一個(gè)表
AO表
10. 數(shù)據(jù)加載
外表
GPfdist和GPload
Copy
數(shù)據(jù)加載性能
11. 性能調(diào)優(yōu)
性能調(diào)優(yōu)考慮
常見問題
硬件問題
資源規(guī)劃問題
數(shù)據(jù)庫(kù)統(tǒng)計(jì)
12. 數(shù)據(jù)分布
數(shù)據(jù)庫(kù)設(shè)計(jì)
數(shù)據(jù)鎖
PSQL調(diào)優(yōu)
13. 數(shù)據(jù)庫(kù)管理
啟停數(shù)據(jù)庫(kù)服務(wù)
監(jiān)控系統(tǒng)狀態(tài)
檢查數(shù)據(jù)斜交
檢查磁盤空間使用
Log 文件
Vacuum
Analyze
Reindex
14. 容錯(cuò)和高可用
主 Segment
鏡像Segment
15. 故障檢測(cè)和恢復(fù)
備用 Master
16. 備用和恢復(fù)
備份數(shù)據(jù)
恢復(fù)數(shù)據(jù)
自動(dòng)備份
17. Greenplum技術(shù)實(shí)戰(zhàn)