跟牛人学如何做Linux运维[1]

时间 : 16-12-29 栏目 : 提升软实力 作者 : 老薛 评论 : 0 点击 : 1,021 次

腾讯游戏运营管理总监刘栖铜

腾讯互动娱乐事业群的主营业务是游戏,所有腾讯游戏都是由这个事业群做的,估计很多人都玩过,像《英雄联盟》、《全民突击》等。我所在的部门叫运营部,负责所有腾讯游戏的技术运营工作。

简单解释一下,什么叫技术运营工作,这里包括了几个部分:运维,营销开发,数据分析和数据挖掘,用户运营(所谓用户运营,不是传统的客户服务,是一些高端的用户运营。)

比如说在腾讯游戏上一年花八万,就是我们的VIP,我们有专属的服务经理对接,就像银行的VIP用户一样。这里就不展开了,重点说说我所负责的运维管理工作吧:

如上所说,我们所负责的运维工作,是运营部的一部分工作。我们现在运维了几百款游戏,而且数字还在快速增长,特别手游加入以来,每年都有一两百款。

简单介绍一下腾讯游戏运维团队的发展历程:我们团队是2003年随着腾讯代理《凯旋》游戏而成立的,发展到2005年的时候,我们做了一件事情,就是DO分离,DO分离的概念前些年提得比较多,现在大家好像不再提了。回头来看,我们觉得DO分离是很有必要的,因为开发跟运维需要具备的核心能力是不同的。

接下来,在2006年的时候我们做了QO分离,意思就是我们把质量管理团队(QA)和运维分离开了,这个后面我会再讲一下。随着团队进一步扩张,业务进一步增加,2007年的时候我们把DBA专业团队分离出来了。

到2009年的时候发现业务发展很快,老板不给我们这么多人,怎么办?光靠人去填的模式已经运行不下去了,所以当时成立了运维开发团队,专门建设运维工具。同时在2009年我们还成立了一个内部安全团队,这个团队可能很多公司都没有,比较特殊。

因为大家知道游戏行业,有些游戏类道具非常值钱,说不准哪个同学手一抖给自己加个几十万,所以我们成立了内部安全团队,做安全监控,其中也包括权限控制,大家都知道,自动化系统权限控制非常重要,如果这个没控制好就会出现灾难性后果。

时间到了2012年,我们开始提倡运维转型,鼓励运维向运维开发转型,让运维自己开发所需的工具来实现自动化。现在,我们提倡运维服务化和平台产品化,这个后文会提到。

接下来,我从文化、组织、人、流程、工具这几个维度分享一下运维管理的点滴经验。

我们团队的运维文化

运维文化:当一个团队规模较大时,例如我们团队,有两三百人的规模,这个时候我们可能需要一些文化层面的东西来统一大家的思想,让大家在行为上按照我们的文化来思考和执行。

我们目前提倡的文化,叫“运维四化”:服务化、标准化、自动化、产品化。标准化和自动化大家都比较好理解,我就不讲了。重点强调一下我们为什么提出运维的服务化。

为什么要“服务化”?

运维的本质到底是什么?

我从2002年开始做运维,一直到现在,都算是在运维行业里摸爬滚打,以前,我觉得做好发布变更、故障处理,让业务保持运行稳定就是运维的价值,但通过这几年的思考和实践,我觉得那是不够的。

那么运维的本质到底是什么呢?我觉得是服务,是服务于业务,因为运维是用技术解决业务问题,运维的价值要依托于业务才能体现。

运维不是因为技术高深,或者管理了几万台服务器而很牛逼,也不是能玩转很多开源工具而很牛逼,这都不是运维的关键。

我提一个观点:对于运维来说,服务第一,技术第二。运维技术再牛,如果不能服务于业务,帮助业务取得成功,那价值也是有限的。那么怎样服务业务呢?我们总结了四点:

贴近业务:就是我们一定要与业务走得比较近,保持信息的畅通;

理解业务:要知道业务目标是什么,用户群是什么,商业模式是什么样的。之前我见过很多运维,甚至在公司做了半年、一年,还不知道所运维的业务的商业模式是什么,这样的话我们怎么能有针对性地提供服务,去帮助业务成功呢? 理解业务还意味着要站在业务运营的角度思考问题,而不仅仅站在运维的角度思考。

挖掘需求背后的价值:我们经常会收到运营人员提出的需求,在理解业务的基础上,我们要挖掘这些业务需求背后的价值,比如说运营人员让发一个版本,做为运维,我们是不是把这个版本发布完就OK了呢?

肯定是不够的,我们还要去看业务发这个版本的目的是什么?可能是为了拉新用户,也有可能是做个活动去拉收入,或者是修复bug。

每一个版本的目的不一样,运维所做的事情是可以不同的。比如这个版本是拉新用户,我们把版本发布完以后,还可以采集更多的数据,去帮助运营人员分析,看是不是达到了拉新用户的目的。或者协助运营人员分析,这个版本的用户体验对于拉新用户是不是有瓶颈。这都是运维可做的事情,也是业务运营很需要的事情。

扩展服务价值:着眼于业务和服务,我们可以不断挖掘到新的价值点,扩展运维服务的价值。

当然了,这里绝不是说技术不重要,优秀的运维服务需要强大的技术来支持。举个例子,你想协助运营人员做用户体验的分析,这需要较强的技术能力来支撑。因为像上述的版本数据分析对实时性的要求很高,如果你没有及时分析出来,错过了运营时机可能就来不及调整了。

可以说,业务视角和服务意识决定了运维服务可以拓展到哪里,而技术能力则决定了这些服务最终可以实现多少。

前文讲了我们的历程,在2009年,我们做了一些组织分工,我们DBA团队,开发团队,安全团队都从这里分离出来了。


本文标签

除非注明,文章均为( 老薛 )原创,转载请保留链接: http://www.bdkyr.com/softpower/2190.html

随便看看

0