查看原文
其他

腾讯社交网络首次系统性对外披露其运维体系 | 活动通知

2018-01-18 喜大普奔的 高效运维


想知道一人运维一万台服务器的秘密吗?

在运营着QQ所有相关业务的腾讯SNG(社交网络群组)运维团队,这都不是事儿。毕竟十几年来,运维技能已经达到如火纯情的程度。

好消息来了!

腾讯社交网络运维总监聂鑫,精心出品了一整天技术分享,内容如下:

技术架构篇

• 社交业务运维基础技术架构选型与演进

• 万台服务器一人挑的实战技巧

高效运维篇

• 复杂业务的自动化运维精髓

• 海量社交业务多活及调度实战

• 精细化运营成本管理宝典

智能运维篇

• 监控数据的创新应用

• 腾讯运维场景的AI实践


琳琅满目 有 木 有!

心旷神怡 有 木 有!

首先请允许我隆重介绍本次分享的出品人:聂鑫老师

聂鑫

腾讯 社交网络运维总监


个人介绍:

从开发到运维,伴随腾讯社交网络运营部成长的十年,负责过腾讯社交产品所有业务运维工作,目前主要负责QQ、空间等产品运维团队管理工作。

经历多个业务产品的诞生到蓬勃,伴随着运维团队的成长和成熟,见证着腾讯一代代运营技术的创新和发展。


具体精彩议题介绍如下:

《社交业务运维基础技术架构选型与演进》


演讲内容先回溯十多年的运维变化,然后3个阶段重点讲述。从运维响应社交业务迸发开始介绍,运维满足业务需求同时并且切入主线做标准化。运维基础技术持续演进,自动化能力提升,业务高效调度实现,最终实现支撑一人万台运维,高效自动化运维先进体系搭建。业务林林总总,成本压力巨大,除了精细化成本管控的管理机制之外,引入虚拟化技术引入,加速资源流动效率降低成本。


     孙亮

     腾讯社交网络运营部计算资源团队负责人


个人介绍:

孙亮,就职于腾讯SNG事业群社交网络运营部,先后参与空间、QQ社交业务业务运维,负责事业部基础服务运维规划、管理建设,包含操作系统和安全、路由、无状态中间件、虚拟化等技术;兼顾事业群业务成本优化、预核算统筹工作,利用技术和管理手段高效玩转资源管理,面对海量用户访问重压之下积累了丰富的运维经验。



《万台服务器一人挑的实战技巧》


本次分享以QQ、Qzone等社交业务一人运维2万台设备的实战经验为基础,从社交业务的基础架构解密海量服务是如何保证高可用和快速流量切换;在接入层和逻辑层我们坚持了哪些原则去实现服务的整齐划一和高效维护;在面对社交业务春节红包和零点高峰等场景,我们是如何实现近万台设备的快速上线的。


     张黎明

          腾讯社交网络运营部组件运维组负责人


个人介绍:

腾讯高级工程师,负责SNG接入层、逻辑层和公共组件的运营维护。

经历了国内社交平台QQ、Qzone海量服务运维体系不断进化、演变直至成熟的过程,参与了系统环境标准化、大规模公共组件推广运营、社交平台的异地容灾分布、自动化运维系统建设等项目,对运维自动化有着独到且深入的理解和实践,在海量服务运维方面经验丰富。


《复杂业务的自动化运维精髓》


来自腾讯内部的海量社交业务自动化运维案例,真实数据分享,全方位剖析自动化运维的理念、能力和孵化过程。


     杨利东

     腾讯社交网络运营部QQ平台运维组负责人


个人介绍:

十年运维老兵,目前负责织云QQ资料和关系链的后台运维工作。

经历过农牧场、广点通广告业务的大爆发后台支撑以及运维服务体系、架构优化和自动化运维的发展、成熟过程,对海量运维服务体系建设以及自动化体系建设方面有丰富的经验和独特的思考。



《海量社交业务多活及调度实战》


QQ的即时通讯服务一直以稳定高效著称,比如15年的天津港大爆炸事件,或者是平时的地区/IDC级的网络故障,都不会对QQ服务造成影响,这很大程度上得益于QQ后台的多地多活调度能力。本主题将和大家一起探讨海量社交业务的多地多活能力以及在QQ、QQ空间上的实战。


     李剑锋

     腾讯社交网络运营部QQ业务运维组负责人


个人介绍:

腾讯高级工程师,QQ业务运维团队负责人。一名从业时长超过10年的运维老兵,拥有QQ游戏平台、QQ、QQ空间等众多海量用户业务的运维经验,一直致力于海量业务运维质量和效率的提升工作。


《精细化运营成本管理宝典》


在当下这个富媒体时代,QQ空间、相册、和直播带宽流量增长迅速,面临的成本压力越来越大,不同业务如何根据各自产品特点做优化,如何做技术手段选型并落地运营,优化金额每年过亿元,做到真正的有钱不任性。


     范晶晶

      腾讯社交网络运营部  高级工程师 


个人介绍:

十年专注腾讯(QQ、空间)资源管理、预核算、成本优化能力建设,打磨十万台实体机背后的全生命周期自动化闭环管理流程,善于运用技术手段优化运营成本每年数亿元,致力于打造精细化资源管理预核算体系。


《监控数据的创新应用》


SNG监控系统经历大数据转型后迎来AI浪潮。这个主题分享SNG监控系统的演进过程和考量因素。结合实际案例场景展示SNG立体化监控理念和数据化DevOps理念。同时分享SNG在AIOps领域的实践场景,展望未来监控转型方向。


     吴树生

          腾讯社交网络运营部运营开发三组负责人


个人介绍:

腾讯高级工程师,负载SNG监控体系建设。

近十年监控系统开发经历。主导完成SNG 织云monitor海量时序数据存储演进升级、织云多维监控平台建设和全链路日志跟踪系统建设。对监控系统数据采集、处理、统计、存储和异常检查告警有深入的理解和实践。具有构建海量高可用分布式监控系统研发经验。


 《腾讯运维场景的 AI 实践》


本次分享将会结合QQ的运维场景,介绍在日常的运维方面,如何使用机器学习的算法来实现智能运维。例如,如何使用机器学习算法来进行KPI曲线的异常检测,如何使用人工智能算法来进行故障的根因分析和根源分析。


     张戎

     腾讯社交网络运营部机器学习研究员


个人介绍:

张戎,2009年毕业于南京大学数学系,获本科学位。2015年毕业于新加坡国立大学数学专业,获博士学位,后加入腾讯从事机器学习相关工作。

目前主要工作方向是:研究人工智能在推荐系统,业务安全系统,智能运维系统上的使用。调研量子计算的前沿理论。


给您最期待的演讲投上一票吧:


从架构到AI,

从技术运维到业务运营,

这七场市场价值 3800RMB 的经典演讲,

限时票价只要 1799RMB。


别急!先等等:


• 除了这7个分享,您还有50多场运维技术演讲可以选择。

• 除了腾讯运维体系,还可以听到来自阿里、Facebook、京东、华为、摩拜、中国移动、滴滴、蚂蚁金服的技术专家给您讲述实践中的运维新趋势。

• 除了大会演讲资料分享,还有专家在群里答疑解惑。


这样一场运维大会,你是来?还是来?

GOPS 2018 全球运维大会 深圳站

2018年4月13日-14日 深圳市南山区


以上提到的7场演讲属于GOPS全球运维大会深圳站19个专场中的一个。

点击查看大图


第九届GOPS全球运维大会将于2018年4月13日-14日在深圳召开。大会为期2天,侧重方向包括AIOps、运维自动化和 DevOps。


如果你想参加本次腾讯SNG团队 ¥1799 的分享,不如选择更实惠的大会两日标准票,限时早鸟价 ¥1920。

点击查看大图


报名通道

了解大会更多内容,报名参与【腾讯运维体系专场】与2018开年运维技术盛宴【GOPS全球运维大会】请长按二维码进入官网:

长按二维码进入官网


程经理:13071182108

文末福利

请在文末留言中,一句话评论出您对 AIOps 的理解,或者对本次腾讯运维体系分享的期待吧 ~

24小时点赞Top5,可获得《DevOps三十六计》运维珍藏本一本。领奖联系人:静静 130 2108 2989


点击阅读原文,进入大会官网

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存