书籍作者:程小丹 | ISBN:9787121383830 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:10045 |
创建日期:2021-02-14 | 发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
《从运维菜鸟到大咖,你还有多远:数据中心设施运维指南》自2016年面世后,得到行业的高度认可。本书作为《从运维菜鸟到大咖,你还有多远:数据中心设施运维指南》的续集,分享行业同仁在企业级数据中心设施的风险评估、规划、建设管理、测试验证方面的经验和教训。本书由业内专家合力编写,并延续了小说体的风格,可阅读性强,使从业人员有很强的带入感,让读者既提升理论知识,也获得更多现场经验。
程小丹中科仙络咨询服务有限公司 董事长LEED数据中心顾问(中国)委员会 秘书长清华海峡研究院 数据中心智能营造研究中心 主任清华大学电机系毕业,后获印第安纳州立大学MBA,并在哈佛商学院完成TGMP课程。 曾任美国APC大中华区总经理、世纪互联工程公司总裁。
本书适合企业及互联网数据中心管理者、企业科技部门领导,以及承担数据中心设计、建设及运维的人员阅读。
序1
作为曾经招商银行数据中心的总经理,对于数据中心的建设、工程管理、测试、运维、风险管理的各种艰辛有着非常深刻的记忆。数据中心作为基础设施,支撑着招商银行在金融科技应用上的一切努力。我们一直以国际先进理念和标准要求自己。招商银行数据中心是国内最早通过Uptime Institute M&O运维认证的金融机构, 我们也是最早开展对全国分行级数据中心进行定期风险评估的金融机构,新建的总行数据中心也将获得Tier IV 认证。
金融数据中心的规模越来越大,系统越来越复杂,也意味着我们的规划、建设、运营、风险管理水平需要不断提升,以应对管理对象不断上升的规模和复杂度。主动学习和行业分享是让行业共同提升管理水平的关键手段。
我很有幸曾经牵头研发过数据中心服务能力成熟度模型的国家标准GB/T33136,我和我的同事也一直积极参与《从运维菜鸟到大咖,你还有多远》系列图书的写作和审核工作。 我们做这些工作的目的就是把招商银行的管理实践进行总结,并形成更好的行业分享内容,希望在和行业交流的过程中共同提高。
这两年,我在招商银行的业务部门工作,深切感受到金融科技对于银行在数字时代不断创新、提升客户体验的重要性。招商银行历史上就非常重视金融科技,近些年更是把金融科技提升到战略高度,首次把金融科技投入写入公司章程,并成立了金融科技办公室,在制度上保证科技的投入。在这样的大背景下,数据中心的安全高效运行将更加重要。
《从运维菜鸟到大咖,你还有多远》系列图书有着独特的写作风格,它更多地是分享数据中心行业同仁的一线经验和思考。它不是百科全书,也无法给你所有的答案,但我们希望它能激发你的思考,并且从我们的实践中找到一些借鉴。
高旭磊
招商银行零售信贷部总经理
2019年12月
序2
在IT圈中,有这么一群人——他们有着与IT无关的专业背景,从事着与IT无关的日常工作,却仍然是当仁不让的IT人;他们提供了IT系统赖以持续运转的环境,然而他们的工作越优秀、效果越显著就越容易被忽视;他们上知天文、下知地理,“风火水电”无所不通,“一人多岗、一岗多能”对于他们而言是常态的存在。他们,就是数据中心运维技术人员。
狭义的数据中心俗称“机房”,是承载IT设备运行的基础环境。近年来,随着云计算、大数据、人工智能及区块链等技术的大规模应用,计算能力的高速膨胀导致对数据中心的巨大需求。中卫清冷的大漠、贵安幽深的隧洞、千岛湖清澈的水岸,一个个新型数据中心应运而生;张北山口凛冽的寒风、乌兰察布密布的风车,见证着一个个巨型数据中心的拔地而起。每一个数据中心的建设和投产的背后,都有着不同的运维“菜鸟”蜕变为“大咖”的故事。
在新技术的飞速发展下,互联网巨头通过金融、科技与互联网的结合,改变了原来金融服务的路径依赖,打破了原来的地域边界、技术边界的限制,压缩了传统银行的生存空间。加快数字转型对传统银行而言,已经是生存问题而非发展问题。数字化是当前阶段伴随新技术发展的产物,其本质是一个用IT系统和智能设备替代人工的过程。
近年来,广东省联社充分认识到农信系统数字化转型的特殊性,编制了特色化的IT规划蓝图,实施了平台化战略,充分利用华为、阿里云等高科技企业的技术平台,推动IT架构转型,构造了金融云、行业云两个云平台,实现了辖内农商行(农信社)业务种类和服务渠道的科技全覆盖,初步形成了“厚中台、薄前台、稳后台”的IT架构,打造了数字化转型的基础能力。
数据中心是银行数字化转型的重要基础设施。因此,广东省联社也在以全球最高的行业标准来设计和建造新数据中心。我们期待在此过程中,诞生更多属于广东农信的数据中心大咖。
《从运维菜鸟到大咖,你还有多远Ⅱ》由数据中心行业的诸多专家参与编写,文风独特,对于金融行业数据中心的从业者很有启发。我也很高兴我们的同事能够参与这本书的编写,也希望能够与金融行业同事更多地分享金融数据中心设计、建设、运营的经验和心得。
未来,广东省联社将全面凝聚改革正能量,深耕科技发展,持续推进IT架构转型,实施平台化和中台化战略,全力打造现代化的数字化服务平台,以先进的科技水平为金融业务赋能,引领辖内农商行(农信社)实现数字化转型与跨越式发展!
周 丹
广东省农村信用社联合社银信中心副总裁
2020年1月9日于广州
序3
数据中心是有生命的,但她的生命是坚强还是脆弱,取决于我们是如何孕育她(规划设计及建造)、保护她(物理安全)、培养她(日常维护保养及升级改造)、锻炼她(测试和应急演练),并陪她经历人生的关键阶段,从快速成长(浴盆曲线的早期失效期,即设备的磨合期)到豆蔻年华的有能力、有担当(浴盆曲线的偶然失效期),直至青春不再,逐渐力不从心(耗损失效期),仍然要殚精竭虑,绽放最后的光芒,直到生命终结。
数据中心是孤独的,她需要守护她的运维人有耐心、有爱心、有信心、有决心、保持初心,用精心和良心去呵护她。运维是一项需要长期坚持、耐得住寂寞的工作。数据中心运维需要既有一颗如大海一样宽广包容,又有如镜湖一样平静淡定的心。台上一分钟,台下十年功。作为IT生产环境的守护者,日常需要细心识风险、排隐患,一次次化解危机于无形;节假日宝贵的时间窗,更要争分夺秒、通宵达旦实施变更或整改优化。数据中心运维推行的是风险管理和预防性维护策略,做到极致的结果是:她就在那里,无处不在,却没人感觉到她的存在。莫非这就是运维人追求的最高境界?是的。运维人从未走到台前,观众看不到他们,甚至不知道他们,但他们却学会了自娱自乐。有时在巡查、有时在检修、有时在测试演练、有时在应急抢修,时而暗流涌动、时而风平浪静。没有一颗坚强的、冷静的、热爱的心,运维人不会坚守到今天。
数据中心是理性的,她有章法、有规则、有传承,也有创新,需要墨守成规(流程和规范),也需要积极改变(技术和管理工具)。
数据中心是个“圈”,圈外很热闹,圈里也精彩。她把一群人圈在了一起,交流、碰撞、分享、成长,有人离开,也有更多的人加入。圈子越来越大,力量越来越强,有能力、有想法的人也越来越多。“人才这么缺乏,参考资料这么少,不如我们总结一下,写本书吧”,四年前,我和程小丹董事长在一次行业峰会的闭门圆桌会议时,同时有了这个想为行业做点什么的想法。未曾想竟得到了“圈友”们的大力支持和积极响应,于是就有了我们《从运维菜鸟到大咖,你还有多远》的诞生。尽管作者都是各自岗位的中流砥柱,仍然凭着热爱和使命感,志愿利用业余时间加班加点,终将多年经验总结凝聚成文,汇集成书。随后也是因为“圈友”的支持和鼓励,需求旺盛,使得该书多次重印,按照我们之前的设想,先从入门,逐渐进阶,填补数据中心行业生态人才培养参考书的空白。
2019年是不平凡的一年,我们顶住压力,保持初心,砥砺前行,让这一年过得充实而更有意义。《从运维菜鸟到大咖,你还有多远II》也诞生了,她来源于实践,总结于民间,朴实无华,充满地气。
喻茂萍
华为 数据中心首席架构师
2019年12月31日
前 言
四年前,我有幸和一群内心文艺的数据中心运维大咖们一起写作了《从运维菜鸟到大咖,你还有多远》。因为其黄色封面设计,那本书被戏称为“小黄书”。非常开心的是,小黄书得到数据中心行业同仁的认可。出版社的编辑告诉我,小黄书的累计销量一直在稳步增长,已经快到两万册了,在专业类书籍中算表现很好的。在这里,特别感谢所有小黄书读者的厚爱,更要感谢当年参与小黄书写作的专家们。可喜的是,他们中很多人现在已经成为大领导。遗憾的是,他们作为领导更忙了,参与这本书的写作时间更少了。
鉴于小黄书的成功,出版社希望我们可以牵头继续写一个数据中心系列。刚开始我是拒绝的,因为写作是一件很痛苦的事情,可以与怀胎十月的痛苦相比拟。我们也经历了同样的心路历程,于是有了这本书,这次我们希望封面是蓝色的,就叫小蓝书。
小蓝书还是会讲大家已经熟悉的Tom和Peter的故事。这次,Tom与很多数据中心管理者一样,需要面对两个挑战:一是现有数据中心的风险管理;二是新数据中心规划建设的管理流程。
企业数据中心,尤其是金融数据中心的风险管理,本是这本书的主要定位。但是在征集案例素材的过程中,我们发现能够从金融行业业主方面收集上来的案例素材非常少,所幸的是,张广明和叶明哲给我们提供了很多案例素材。最终,风险管理构成了本书的前面的4个章节。
虽然大家都普遍重视风险管理,监管机构也一再强调,但为何在收集案例上这么困难?一方面,即使我们承诺匿名分享,很
目 录
开篇语 1
第一章 新的征途 3
一、久别重逢 4
二、金融科技Fintech 之火 7
三、金融科技的基础架构 10
四、Tom面临的挑战 15
第二章 系统性故障 18
一、重复故障的隐患 19
二、剖析故障原因 22
三、零地线原来这么重要 32
四、这些年,同行在系统性故障上踩过的“坑” 39
第三章 空调水系统 43
一、安装的痛苦经历 44
二、叶老师的水冷系统十条戒律 47
第四章 风险管理 64
一、黑天鹅与灰犀牛 65
二、数据中心风险管理 68
三、自然灾害的案例 71
四、航天航空业的启示 77
第五章 数据中心规划 83
一、选址要素 84
二、选址评估 91
三、需求调研 91
四、规划布局 97
第六章 设计标准 99
一、Uptime Tier Ⅳ和国标A级的比较 100
二、Uptime Tier Ⅲ和国标B级的比较 108
三、设计标准的选择 113
四、LEED认证 114
第七章 托管评估 117
一、托管数据中心需求的提出 118
二、技术评估的重要性 121
三、设计评估 125
第八章 现场评估与迁移 139
一、现场设施设备评估 140
二、运维体系及能力评估 143
三、迁移 146
第九章 新数据中心启动 150
一、数据中心报建 151
二、工程招标 156
三、全程验证的理念导入 160
第十章 项目管理 164
一、项目管理 165
二、项目管理的目标 168
三、全程验证之厂验 177
四、全程验证之工程质量 179
第十一章 联合调试验证 184
一、暖通系统满载能力验证 185
二、电气系统联合调试 188
三、低压母联测试 195
四、全程验证总结 197
五、附件 203
第十二章 交付运维 206
一、航空业的警示 207
二、文档交接 212
三、培训 217
四、自动化运维的展望 222
附录A LEED 可持续数据中心设计建设指南 224
一、LEED可持续数据中心认证介绍 224
二、采用LEED数据中心评估体系的好处 227
三、LEED数据中心认证流程 230
四、LEED数据中心认证体系解读 239