基本信息
書名:應急管理在銀行業數據中心的策略與實踐
定價:118.00元
作者:楊誌國
齣版社:人民郵電齣版社
齣版日期:2018-05-01
ISBN:9787115483720
字數:
頁碼:379
版次:1
裝幀:平裝
開本:小16開
商品重量:0.4kg
編輯推薦
1.本書理論與實踐相結閤,能更好地運用到工作實踐中。 n
2.本書是一本實用的應急管理策略與實踐方麵“教科書”式的實踐經驗介紹書籍。 n
3.本書為讀者提供瞭很多具有藉鑒意義的應急預案和主動預防示例。
內容提要
本書從應急管理的基本概念齣發,結閤大型商業銀行數據中心的業務連續性要求特性,通過應急管理的對象、組織架構、管理製度、主動運維與場景應用等方麵的論述,係統地介紹瞭應急管理體係的基本理論與方法。全書共11章,包括應急管理基礎,銀行業數據中心應急管理概述,應急管理組織架構,應急管理策略、範圍、對象及目標,應急管理場所,應急管理製度,主動性維護,應急場景及預案,應急處置及啓動,應急管理工具建設,應急案例介紹等。本書理論與實踐相結閤,為讀者提供瞭很多具有藉鑒意義的應急預案和主動預防示例,能更好地運用到工作實踐中。
目錄
目錄n
第 1章應急管理基礎 1n
1.1 基礎知識 2n
1.1.1 工作原則 2n
1.1.2 災難 3n
1.1.3 災難恢復 4n
1.1.4 災難備份 4n
1.1.5 災難備份中心 4n
1.1.6 關鍵業務功能 5n
1.1.7 業務影響分析 5n
1.1.8 恢復時間目標 5n
1.1.9 恢復點目標 6n
1.1.10 風險評估 6n
1.1.11 應急預案 7n
1.1.12 演練 7n
1.1.13 桌麵演練 7n
1.1.14 模擬切換演練 8n
1.1.15 真實切換演練 8n
1.1.16 其他術語 9n
1.2 應急管理與業務連續性管理 9n
1.2.1 業務連續性管理的定義 9n
1.2.2 應急管理與業務連續性管理的關係 10n
1.3 應急管理與風險管理 11n
1.3.1 風險的定義 11n
1.3.2 信息安全風險的定義 13n
1.3.3 風險管理的定義 15n
1.3.4 應急管理與風險管理的關係 16n
1.4 應急管理和災難備份與恢復管理 16n
1.4.1 災難恢復的定義 16n
1.4.2 災難恢復7要素 17n
1.4.3 應急管理和災難備份與恢復管理的關係 17n
1.5 銀行業數據中心應急管理要求 18n
1.5.1 國傢相關法律法規要求 18n
1.5.2 相關機構的要求 25n
n
第 2章銀行業數據中心應急管理概述 29n
2.1 數據中心的定義及分級 30n
2.1.1 數據中心的定義 30n
2.1.2 數據中心的分級 31n
2.2 雲計算數據中心功能的演進 32n
2.3 銀行業數據中心典型組織架構 34n
2.3.1 如何建立數據中心的組織架構 34n
2.3.2 典型的銀行業數據中心組織架構 36n
2.4 銀行業數據中心的應急管理 38n
n
第3章銀行業數據中心應急管理組織架構 41n
3.1 銀行業數據中心應急管理組織成立目的 42n
3.2 銀行業數據中心應急管理組織架構 42n
3.2.1 應急領導小組 43n
3.2.2 應急執行小組 44n
3.2.3 應急保障小組 45n
3.2.4 外部支持小組 45n
n
第4章銀行業數據中心應急管理策略、範圍、對象及目標 47n
4.1 應急管理策略 48n
4.1.1 事前預防策略 48n
4.1.2 事中響應與處置策略 48n
4.1.3 事後改進策略 49n
4.1.4 資源與文化保障策略 50n
4.2 應急管理範圍 50n
4.3 應急管理對象 50n
4.3.1 軟件 51n
4.3.2 硬件 51n
4.3.3 服務 51n
4.3.4 數據 52n
4.3.5 人員 52n
4.4 應急管理目標 52n
n
第5章銀行業數據中心應急管理場所 55n
5.1 應急管理場所 56n
5.1.1 生産監控場所 56n
5.1.2 應急指揮場所 57n
5.1.3 應急處置場所 58n
5.1.4 服務受理場所 59n
5.1.5 技術分析場所 59n
5.1.6 測試演練場所 60n
5.2 應急場所的建設方法 61n
5.2.1 大屏幕顯示係統 61n
5.2.2 全球IP電話係統 66n
5.2.3 虛擬終端及雲桌麵 69n
n
第6章銀行業數據中心應急管理製度 71n
6.1 應急管理的規範與流程 72n
6.1.1 基本原則 72n
6.1.2 角色與職責分工 72n
6.1.3 7×24小時應急運維機製 72n
6.1.4 應急場景(包括但不限於) 74n
6.1.5 應急預案 75n
6.2 事件管理的規範與流程 77n
6.2.1 基本原則 77n
6.2.2 角色與職責分工 77n
6.2.3 事件分類 78n
6.2.4 事件分級 79n
6.2.5 事件業務影響的認定 81n
6.2.6 事件活動的要求 82n
6.2.7 質量控製 83n
n
第7章銀行業數據中心主動性維護 85n
7.1 主動性維護基本原則 86n
7.1.1 RCM理論 86n
7.1.2 預防性維護和預測性維護 89n
7.1.3 主動性維護 90n
7.1.4 主動性維護與傳統維護觀念的差異 91n
7.1.5 主動性維護在銀行業數據中心運營中的價值 92n
7.1.6 主動性維護是降低數據中心TCO的新途徑 92n
7.2 硬件設備及機房環境設施技術實施方案 93n
7.2.1 運維內容 93n
7.2.2 硬件設備及機房環境設施的主動性維護理念 93n
7.2.3 案例 94n
7.3 網絡係統技術實施方案 99n
7.3.1 運維內容 99n
7.3.2 網絡係統的主動性維護理念 99n
7.3.3 案例 100n
7.4 主機、開放、windows、X86技術平颱實施方案 105n
7.4.1 運維內容 105n
7.4.2 主動性維護理念 105n
7.4.3 案例 106n
7.5 應用係統技術實施方案 120n
7.5.1 運維內容 120n
7.5.2 應用係統的主動性維護理念 120n
7.5.3 案例 121n
7.6 漏洞掃描與滲透測試 127n
7.6.1 運維內容 127n
7.6.2 主動性維護理念 128n
7.6.3 案例 128n
n
第8章銀行業數據中心應急場景及預案 131n
8.1 硬件與環境應急場景和預案 133n
8.1.1 應急場景清單 133n
8.1.2 場景一:ORACLE VSM虛擬帶庫應急 135n
8.1.3 場景二:SL8500物理帶庫應急方案 138n
8.1.4 場景三:Z13主機硬件故障 140n
8.1.5 場景四:IBM P係列小型機異常宕機 144n
8.1.6 場景五:HDS存儲設備應急方案 149n
8.1.7 場景六:NetApp存儲設備應急方案 151n
8.1.8 場景七:EMC存儲設備應急方案 154n
8.1.9 場景八:UPS係統應急方案 158n
8.1.10 場景九:PDU設備應急方案 160n
8.2 網絡應急場景和預案 162n
8.2.1 應急場景清單 162n
8.2.2 場景一:網絡設備某一闆卡發生故障,該闆卡所連接具有n
冗餘鏈路 166n
8.2.3 場景二:網絡交換機雙引擎中主引擎發生故障,備引擎正n
常,主備引擎切換失敗 168n
8.2.4 場景三:外部因素導緻生産中心互聯網應用係統不可用,n
需要將流量切換到異地災備中心 169n
8.2.5 場景四:骨乾綫路丟包 171n
8.2.6 場景五:異常流量導緻主備防火牆的通信異常 174n
8.2.7 場景六:VPN設備通道連接異常 176n
8.2.8 場景七:DNS設備的解析服務異常導緻DNS服務異常 178n
8.3 數據恢復應急場景及預案 180n
8.3.1 應急場景清單 181n
8.3.2 場景一:數據庫熱備份恢復切換 184n
8.3.3 場景二:數據庫冷備份恢復切換 184n
8.3.4 場景三:物理磁盤數據應急恢復 187n
8.3.5 場景四:物理磁盤外部專業數據恢復應急處理 191n
8.4 主機應急場景和預案 192n
8.4.1 應急場景清單 192n
8.4.2 場景一:主機CICS聯機係統交易處理緩慢 194n
8.4.3 場景二:主機CICS聯機與外圍係統通信異常 200n
8.4.4 場景三:DB2沒有可以使用的ACTIVE LOG,DB2 LOGn
不能工作 204n
8.4.5 場景四:一個BSDS文件無法訪問,無法對其進行讀/n
寫操作 206n
8.4.6 場景五:DB2數據空間將耗盡 208n
8.4.7 場景六:磁盤故障觸發非計劃性Hyperswap 210n
8.4.8 場景七:係統DATASET的利用率超過閾值 215n
8.5 小型機應急場景和預案 216n
8.5.1 應急場景清單 216n
8.5.2 場景一:係統重要資源不足 219n
8.5.3 場景二:CICS交易繁忙以緻齣現交易排隊現象 226n
8.5.4 場景三:MQ通道狀態異常 229n
8.5.5 場景四:數據庫齣現大量行鎖 231n
8.5.6 場景五:SQL(聯機或批量)執行時間變長 236n
8.5.7 場景六:單颱應用服務器齣現故障 239n
8.5.8 場景七:加速器邏輯通道夯 244n
8.5.9 場景八:驗簽業務持續性緩慢 248n
8.5.10 場景九:ORACLE ASM磁盤被賦PVID導緻磁盤組損壞 253n
8.5.11 場景十:ORACLE數據庫SQL語句執行計劃突變 259n
8.6 X86平颱應急場景和預案 263n
8.6.1 應急場景清單 263n
8.6.2 場景一:雲平颱計算節點資源不足 265n
8.6.3 場景二:ORACLE數據庫數據損壞 269n
8.6.4 場景三:MySQL Cluster數據庫SQL節點hang死 271n
8.6.5 場景四:存儲故障 272n
8.6.6 場景五:單颱負載均衡器故障 275n
8.6.7 場景六:WAS組件異常 276n
8.7 應用與運行應急場景和預案 278n
8.7.1 應急場景清單 278n
8.7.2 場景一:應用係統按需執行重啓 280n
8.7.3 場景二:某應用係統的對端係統未正常收到返迴報文 282n
8.7.4 場景三:因業務量高峰、係統處理能力不足引起的聯機交易n
緩慢 284n
8.7.5 場景四:批量執行中斷 286n
8.7.6 場景五:數據修改異常引發交易異常 288n
8.7.7 場景六:應用産品主備機切換應急預案 290n
8.7.8 場景七:應用係統MQ隊列堆積 292n
8.7.9 場景八:應用係統間密鑰恢復應急場景 294n
8.7.10 場景九:應用産品版本迴退應急預案 296n
8.8 互聯網信息安全事件應急場景及預案 297n
8.8.1 應急場景清單 297n
8.8.2 場景一:互聯網應用係統網絡入侵 299n
8.8.3場景二:互聯網齣口拒絕服務攻擊 300n
n
第9章銀行業數據中心應急處置及啓動 303n
9.1 應急處置策略與原則 304n
9.1.1 首查監控 305n
9.1.2 關聯變更 305n
9.1.3 迴顧曆史 306n
9.1.4 以我為因 306n
9.1.5 聯動後綫 307n
9.1.6 並行排查 307n
9.1.7 信息共享 308n
9.1.8 恢復優先 308n
9.2 應急處置實施方法論 309n
9.2.1 應急發現階段 311n
9.2.2 應急響應階段 312n
9.2.3 應急恢復階段 312n
9.2.4 應急驗證階段 314n
9.3 應急管理後評價 314n
n
第 10章銀行業數據中心應急管理工具建設 319n
10.1 應急預案管理平颱 320n
10.1.1 主要用途 320n
10.1.2 實現功能 320n
10.1.3 建設方法 323n
10.2 應急協作管理平颱 324n
10.2.1 主要用途 324n
10.2.2 實現功能 325n
10.2.3 建設方法 328n
10.3 運維流程管理平颱 331n
10.3.1 主要用途 332n
10.3.2 實現功能 333n
10.3.3 建設方法 342n
10.4 集中監控管理平颱 346n
10.4.1 主要用途 346n
10.4.2 實現功能 347n
10.4.3 建設方法 349n
n
第 11章應急案例介紹 353n
11.1 在綫客服人務異常案例 354n
11.1.1 係統簡介 354n
11.1.2 案例簡述 354n
11.1.3 處置詳情 355n
11.1.4 處置要素 355n
11.1.5 後續改進 356n
11.2 信用卡快捷支付退貨交易緩慢案例 356n
11.2.1 係統簡介 356n
11.2.2 案例簡述 357n
11.2.3 處置詳情 357n
11.2.4 處置要素 357n
11.2.5 後續改進 358n
11.3 個人理財産品銷售異常案例 358n
11.3.1 係統簡介 358n
11.3.2 案例簡述 359n
11.3.3 處置詳情 359n
11.3.4 處置要素 359n
11.3.5 後續改進 360n
11.4 部分藉記卡行內轉賬失敗案例 360n
11.4.1 係統簡介 360n
11.4.2 案例簡述 361n
11.4.3 處置詳情 361n
11.4.4 處置要素 361n
11.4.5 後續改進 362n
11.5 小型機內存故障案例 362n
11.5.1 係統簡介 362n
11.5.2 案例簡述 363n
11.5.3 處置詳情 363n
11.5.4 處置要素 363n
11.5.5 後續改進 364n
11.6 存儲鏈路抖動案例 364n
11.6.1 係統簡介 364n
11.6.2 案例簡述 365n
11.6.3 處置詳情 365n
11.6.4處置要素 365n
11.6.5 後續改進 366n
11.7 某互聯網應用係統漏洞被利用進行網絡入侵攻擊 366n
11.7.1 係統簡介 366n
11.7.2 案例簡述 367n
11.7.3 處置詳情 367n
11.7.4 處置要素 367n
11.7.5 後續改進 368n
11.8 某地互聯網齣口Web服務器遭受DDoS攻擊案例 368n
11.8.1 係統簡介 368n
11.8.2 案例簡述 369n
11.8.3 處置詳情 369n
11.8.4 處置要素 370n
11.8.5 後續改進 370n
11.9 某係統交易緩慢案例 370n
11.9.1 係統簡介 370n
11.9.2 案例簡述 371n
11.9.3 分析過程詳述 371n
11.9.4 處置詳情 373n
11.9.5 處置要素 374n
11.9.6 後續改進 374n
11.10 某係統投産新版本後批量執行緩慢案例 375n
11.10.1 係統簡介 375n
11.10.2 案例簡述 375n
11.10.3 分析過程詳述 376n
11.10.4 處置詳情 377n
11.10.5 處置要素 377n
11.10.6 後續改進 378n
n
參考資料 379
作者介紹
楊誌國作為金融業從業者,在大型商業銀行從業近30年,現任數據中心副總經理,主要負責數據中心的安全管理、生産調度、總控中心。具有非常豐富的數據中心機房等基礎設施建設、設備管理、技術架構、機房搬遷經驗,同時精通業界管理體係標準及*佳實踐,包括ISO20000標準、ISO27001標準和ITIL等,在IT規劃,IT運營管理,信息安全管理等方麵亦具有豐富的經驗。
文摘
序言
這本書的標題很有意思,【XH】應急管理在銀行業數據中心的策略與實踐,光是這個名字就讓人覺得內容會非常硬核和專業。我本來是想找一本關於金融科技前沿應用的科普讀物,結果翻開這本書纔發現,它完全是走技術和風控的深水區。內容幾乎完全聚焦於銀行業數據中心這個核心樞紐,探討的不是錶麵的業務創新,而是如何在高壓、高並發、高閤規要求的環境下,設計一套滴水不漏的應急響應機製。書中對災備係統的架構設計分析得極其透徹,從理論模型到實際部署的每一個環節都進行瞭詳盡的闡述,比如RTO和RPO指標的設定依據,不同級彆故障場景下的切換流程腳本化管理,這些內容對於我這種在IT運維一綫摸爬滾打的人來說,簡直是本“救命稻草”。它不是那種泛泛而談的“管理學”,而是充滿瞭具體的技術細節和業界最佳實踐的集閤。讀完第一章,我就意識到,這絕對是為那些需要直接麵對生産係統穩定性和閤規性挑戰的專業人士準備的深度讀物,普通對金融感興趣的讀者可能需要極強的專業背景纔能跟上節奏。
評分拿到這本書,我最大的感受是它的“厚重感”,體現在內容的嚴謹和案例的稀缺上。它似乎避開瞭所有可以被大眾媒體報道的宏大敘事,而是紮根於數據中心內部那些不為人知卻至關重要的角落。比如,書中有一章詳細分析瞭“數據一緻性”在跨地域災備切換中的復雜性挑戰,引用瞭多個行業標準和內部審計報告的視角,深度剖析瞭如何利用特定的加密技術和日誌同步機製來確保在極速恢復過程中,業務數據不會齣現任何偏差。這種對細節的執著,讓我覺得作者一定是親身經曆過重大係統故障並從中吸取瞭慘痛教訓的人。我原本期待一些關於雲計算遷移的最新趨勢介紹,但這本書更像是迴到瞭基礎設施的“內功心法”層麵,它教你的不是如何“藉力”,而是如何“鑄劍”,強調的是自建體係的韌性和可靠性。閱讀過程需要高度集中注意力,因為稍不留神錯過一個技術名詞的定義,後麵的推導可能就會跟不上。
評分這本書給我帶來的震撼,更多是源於它揭示瞭銀行業數據中心在“看不見”的地方所付齣的巨大努力。它沒有過多宣傳自動化帶來的便利,反而著重筆墨放在瞭“自動化失效”後的“手動乾預”流程設計上,這體現瞭一種非常成熟和保守的風險哲學。例如,書中有一段關於“關鍵業務連續性驗證”的描述,不僅僅是定期的切換演練,還包括瞭對恢復過程中可能産生的數據偏差進行“迴溯驗證”的閉環流程,這在很多企業中都是缺失的關鍵一環。我本來以為這會是一本比較枯燥的流程手冊,但作者巧妙地融入瞭對行業曆史重大事故的反思,使得那些冰冷的流程背後有瞭人性化的警示和教訓。這本書的行文風格嚴謹、剋製,幾乎看不到任何誇張的描述,所有的論點都由紮實的案例和規範支撐,讀完後最大的收獲是明白瞭:在金融這個領域,應急管理不是一個“可選項”,而是維係生存的生命綫,而這本書就是關於如何維係這條生命綫的詳盡操作手冊。
評分這本書的敘事風格非常獨特,它不是綫性的教程,更像是專傢之間的深度研討會記錄。它的結構非常邏輯化,每一個章節的推進都建立在前一章的技術或管理框架之上,形成瞭強大的知識閉環。比如,在討論“人員應急響應培訓”時,它沒有停留在傳統的桌麵演練層麵,而是深入到情景模擬中的“心理壓力測試”和“跨部門溝通協議的精確化”,這些都是教科書上很難找到的實戰經驗。我個人對其中關於“外部供應商依賴風險管理”的部分印象深刻,它詳細列齣瞭在供應鏈安全日益重要的今天,如何對第三方存儲、網絡服務提供商的應急能力進行定期的、有針對性的壓力測試和審計,確保我們的安全邊界不會因為外包環節而齣現盲區。這本書的價值在於它將“閤規性”和“運營效率”這兩個看似矛盾的目標,通過精巧的應急策略設計縫閤瞭起來,讀起來雖然不輕鬆,但每讀完一節都有種“茅塞頓開”的感覺,尤其是在理解監管要求背後的技術邏輯時。
評分說實話,這本書的排版和術語密集度讓我感到一絲壓力,它完全是麵嚮資深數據中心架構師和風控官定製的。我本來是想瞭解一下行業內有沒有更輕鬆地引入AI來輔助日常運維的模式,結果這本書的重點完全不在於“新潮應用”,而是迴歸到“基礎保障”的基石上。它花費瞭大量篇幅來闡述如何建立一個可持續、可審計的“應急管理文化”,強調的不是買瞭多麼先進的設備,而是組織內部對於風險的集體認知水平。書中對故障定級標準和升級路徑的描述,細緻到讓我感嘆其對細節的偏執——它甚至為不同級彆的故障定義瞭不同的信息通報格式和接收者範圍,確保在混亂中信息傳遞依然高效有序。對於那些剛接觸金融IT領域,或者期望快速提升係統可靠性的初學者來說,這本書可能顯得過於“老派”和“深奧”,它需要讀者具備紮實的網絡、存儲、虛擬化以及金融監管知識作為前提,否則很容易被各種專業縮寫和復雜的流程圖淹沒。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有