阿里巴巴 CTO 的修煉——商業(yè)和技術(shù)的共同進化

作者: 2022年04月27日 來源: 瀏覽量:
字號:T | T
程立,花名魯肅,2005年加入支付寶,是支付寶技術(shù)平臺奠基人之一。他也是阿里巴巴招收的第一位博士生,現(xiàn)任阿里巴巴集團CTO。   本文內(nèi)容來自湖畔創(chuàng)研中心的一次技術(shù)高管的培訓(xùn)交流,過程中魯肅非常坦率地探討了一位合
  程立,花名魯肅,2005年加入支付寶,是支付寶技術(shù)平臺奠基人之一。他也是阿里巴巴招收的第一位博士生,現(xiàn)任阿里巴巴集團 CTO。
  本文內(nèi)容來自湖畔創(chuàng)研中心的一次技術(shù)高管的培訓(xùn)交流,過程中魯肅非常坦率地探討了一位合格 CTO應(yīng)該具備的素質(zhì),以及他自己一路摔打成長的心路歷程。
  文 /程立
  本文摘自《云棲戰(zhàn)略參考》第2期
  我的經(jīng)歷
  我的經(jīng)歷很簡單,2004年之前一直在學(xué)校讀書,讀到 30歲。2004年跟著一個師兄做外包項目,為淘寶網(wǎng)做一個重要的架構(gòu)升級——把原來 PHP/MySQL架構(gòu)換成 Java EE架構(gòu)。2005年 2月份正式以實習(xí)生身份加入支付寶。
  2005到 2014年,我主要的崗位是支付寶架構(gòu)師。2013年,當(dāng)時螞蟻的 CTO要回美國,螞蟻當(dāng)時的 CEO彭蕾找我談過話,我當(dāng)時對帶這么大團隊完全沒有信心。我最沒有信心的不是帶技術(shù)團隊,而是 CTO另外一半的職責(zé),作為公司經(jīng)營管理的一部分,怎么跟 CEO對話。
  前任 CTO會在公司管理會議上和業(yè)務(wù)吵得面紅耳赤,我覺得我做不到。后來王堅博士約我去喝茶,他說沒有關(guān)系,每個人都是不一樣的,但是每個人都能用自己的方式解決問題。這給了我信心。
  于是,2013年我開始帶支付寶整個技術(shù)團隊,經(jīng)過一年的考察,在 2014年公司任命我為螞蟻 CTO,2014年到 2019年我一直在這個崗位。
  2018年,公司發(fā)現(xiàn)技術(shù)確實會對在某些業(yè)務(wù)起到更加關(guān)鍵作用,需要更強的技術(shù)背景同學(xué)進入業(yè)務(wù)。當(dāng)時對技術(shù)有很強需求的是螞蟻的國際業(yè)務(wù),就讓我做了兩年螞蟻國際業(yè)務(wù)的 COO。2019年年底,轉(zhuǎn)任阿里巴巴的 CTO。又過了一段時間,菜鳥也需要一位 CTO,就讓我兼任菜鳥 CTO。
  商業(yè)與技術(shù)共同進化之旅 @螞蟻
  我挑了幾個螞蟻 CTO工作的節(jié)點,非常好地印證了“商業(yè)和技術(shù)的共同進化”。最早期支付寶非常簡單,就是要做一個互聯(lián)網(wǎng)的第三方支付平臺,技術(shù)只要能把業(yè)務(wù)需求實現(xiàn)就好了,項目最大特點就是快、輕量。
  2005年,某個國際支付巨頭要進入中國,很多同事很緊張,那時陸兆禧是支付寶的 CEO。他說:這有什么可怕的,他們一個需求兩個月才能實現(xiàn),我們支付寶兩天就能實現(xiàn),他們肯定不是我們的對手。
  到2007年,公司面臨一個技術(shù)分叉點:互聯(lián)網(wǎng)支付一定會成為行業(yè)非常主流的支付方式,我們已經(jīng)能夠看到業(yè)務(wù)的規(guī)模,但需要做一個判斷——該用什么技術(shù)架構(gòu)支撐。
  支付寶最早對技術(shù)架構(gòu)沒有很強的要求,什么好用就什么。我們既有非?;ヂ?lián)網(wǎng)的架構(gòu),脫胎于淘寶網(wǎng);也有非常金融的架構(gòu),2005年我們敲鑼打鼓、披紅掛彩買了一臺小型機處理核心賬務(wù)。
  但在 2007年我們必須做一個判斷,未來我們更像一家銀行,還是更像一家互聯(lián)網(wǎng)公司?幸好后來我們沒有走彎路,我們判斷未來必須要用互聯(lián)網(wǎng)架構(gòu)去解決支付相關(guān)的問題。
  于是我們決定把系統(tǒng)做一個面向未來的架構(gòu)設(shè)計:分布式改造。整整一年時間,我們將核心交易、核心賬務(wù)、核心會員、核心支付,全部分布式化。
  但涉及到一些核心技術(shù)如何解決的問題,比如在這么大的分布式系統(tǒng)里,怎么解決核心事務(wù)的問題——這其實不容易。
  2007年某個國際支付巨頭也曾經(jīng)想解這個問題,結(jié)果系統(tǒng)上線后宕機兩周,CTO離職。在對這個問題的改造過程中,我們也膽戰(zhàn)心驚,但最終還是把這塊硬骨頭啃下來了。
  第二個關(guān)鍵節(jié)點是 2011年,移動業(yè)務(wù)起來了,但移動場景下支付到底是個怎樣的形態(tài),需要做一個非常關(guān)鍵的判斷。當(dāng)用戶拿著手機和商家支付時,到底用什么方式進行?
  那時智能手機的格局并沒有完全定形,一些手機還沒有攝像頭。當(dāng)時公司部署了很多方案,有掃一掃的,當(dāng)時叫悅享拍,拍一下就能完成支付;有叫“咻一咻”的,讓手機發(fā)出聲波,商家接收這個聲音;還有靠藍牙的。幾輪下來之后,其實很多商家裝了咻一咻的設(shè)備,很多商家用二維碼,最后發(fā)現(xiàn)用戶能接受的是掃碼支付。
  2013年,也是我擔(dān)任螞蟻 CTO的第一年,發(fā)生了很多重要的事情。我們內(nèi)部起了非常多的重要項目,編號從 1號到 9號。
  2013年這一年, 1號項目是網(wǎng)商銀行;2號項目是余額寶上線,讓支付寶業(yè)務(wù)實現(xiàn)真正破圈,真正做數(shù)字普惠金融;3號項目是花唄。當(dāng)然還有 456,我們醞釀了很多項目,有成功的,也有不那么成功的。
  這個過程對整個技術(shù)架構(gòu)造成了非常巨大的沖擊,從原來互聯(lián)網(wǎng)支付脫胎的技術(shù)架構(gòu),開始往數(shù)字金融這個方向走。在這個過程中,我反而覺得技術(shù)正好可以發(fā)力,幫助公司技術(shù)實現(xiàn)變革。那一年支付寶開始正式“去 IOE”,最后一臺小型機下線。
  商業(yè)與技術(shù)共同進化之旅 @阿里巴巴
  阿里巴巴的技術(shù)其實非常廣,后半程的發(fā)展會以阿里云為主線。
  第一階段非常清楚,就是技術(shù)支撐商業(yè)發(fā)展,從淘寶網(wǎng)上線開始。那時淘寶網(wǎng)為什么能夠贏,除了它商業(yè)上有很多創(chuàng)新之外,“快”也是非常關(guān)鍵的因素。在這個過程中,CTO要能在業(yè)務(wù)快速增長時,提前在技術(shù)上做布局,讓商業(yè)成長能夠持續(xù)。2004年,我做淘寶架構(gòu)升級外包業(yè)務(wù)的階段其實是淘寶網(wǎng)非常關(guān)鍵的時期,Jave EE架構(gòu)的形成對淘寶的增長奠定了非常好的基礎(chǔ)。
  2009年有一個神來之筆——那個時間點阿里巴巴敢于判斷云是未來,敢于為云寫下第一行代碼。阿里巴巴內(nèi)部很多人都不看好云,但是為什么那時候能判斷對呢?我覺得阿里巴巴有一句話說的非常好:“因為相信,所以看見”。就像電商業(yè)務(wù)也一樣,很早阿里巴巴就判斷電子商務(wù)一定是未來,先發(fā)先至,所以在很長的一段時間,堅定相信這個方向、持續(xù)地走,只要時機到來,就自然可以取得商業(yè)上的成果。技術(shù)其實也一樣,阿里巴巴很早就做了一個判斷:大數(shù)據(jù)、云計算一定是未來,后面所有發(fā)展都以這個為主線。
  現(xiàn)在回頭來看,后面每個關(guān)鍵節(jié)點都是和云相關(guān)的。比如阿里云 2009年寫下第一行代碼后,內(nèi)部找了一圈都找不到客戶,這時候 CEO就指定阿里小貸業(yè)務(wù)必須用阿里云,給阿里云一個場景去打磨,這才給了阿里云一線生機。2010年孫權(quán)是阿里小貸的負(fù)責(zé)人,后來當(dāng)了阿里云的負(fù)責(zé)人。
  我自己印象比較深的是 2013、2014年,經(jīng)過幾年和阿里小貸的打磨,阿里云開始有一點技術(shù)了,大數(shù)據(jù)處理開始慢慢成熟。當(dāng)時有一個很重要的“5K項目”,阿里云開始具備 5000臺機器大集群處理數(shù)據(jù)的能力。具備這個能力之后,公司又做了一個重要決定,阿里巴巴和支付寶所有的數(shù)據(jù)全部要上到阿里云的大數(shù)據(jù)平臺上,那時我正好是螞蟻的 CTO,我舉雙手支持——因為我知道即使不支持,集團也會按下來。阿里云也因此又上了一個臺階。
  2015年,大家都聽過“大中臺、小前臺”,聽上去很牛?!按笾信_、小前臺”背后完成了一件事情:把阿里巴巴和支付寶所有的基礎(chǔ)技術(shù)全部統(tǒng)一到阿里云上,這是個重大的技術(shù)變革,為了完成這個技術(shù)變革,阿里巴巴做了非常好的組織設(shè)計,讓當(dāng)時的阿里巴巴 CTO行癲兼任阿里云 CTO,把技術(shù)收在一起,加強阿里云?!按笾信_、小前臺”策略執(zhí)行了三年,阿里云整個技術(shù)架構(gòu)就非常完整了。阿里巴巴是集全公司之力支持一個技術(shù)戰(zhàn)略的達成。
  2017年之后,這個階段用行癲的話講,是“用技術(shù)創(chuàng)造新商業(yè)”,開始去探索技術(shù)本身能不能成為商業(yè)的一個部分,城市大腦就是典型的由技術(shù)創(chuàng)造的商業(yè)。2017年達摩院成立,同樣是“因為相信,所以看見”。因為我們判斷未來一定是數(shù)字經(jīng)濟,圍繞數(shù)字經(jīng)濟所需要的核心技術(shù)達摩院要進行布局,無論是 AI、計算,還是芯片,都是圍繞數(shù)字經(jīng)濟的核心問題的思考和布局。
  2020年,我已經(jīng)是阿里巴巴集團的 CTO了,我們完成了上云的封頂,所有核心業(yè)務(wù)基本都跑在云上,包括最具挑戰(zhàn)性的業(yè)務(wù),比如搜索、推薦、廣告業(yè)務(wù),云都能支撐,我覺得這是云非常大的技術(shù)進步,也是集團非常重大的技術(shù)變革。
  現(xiàn)在我們進入一個新的時代,要把云和業(yè)務(wù)技術(shù)的邊界定義清楚,邊界就是云原生。我們未來業(yè)務(wù)應(yīng)用全是云原生的應(yīng)用,這是一個云原生時代。另外,云本身也在升級,就是大家都知道的“云釘一體”。
  不同業(yè)務(wù)階段下的三種技術(shù)領(lǐng)導(dǎo)力
  三種技術(shù)領(lǐng)導(dǎo)力,我是受到俞永福的啟發(fā),他覺得企業(yè)發(fā)展就是這樣波浪式的發(fā)展過程:一開始要先找到一個方向,進入一個業(yè)務(wù)的軌道;如果這個方向判斷準(zhǔn)了,企業(yè)就會進入快速增長階段;發(fā)展到一定階段,就必須要脫離現(xiàn)有的慣性,再去找新的發(fā)展方向——就是這么一波波的過程......
  在波浪式發(fā)展過程中,技術(shù)在每個階段起的作用不一樣。在入軌的階段,CTO應(yīng)該是整個公司業(yè)務(wù)一號位班子的成員,是支持一號位的二號位,班子一起看清方向,把業(yè)務(wù)帶入正軌。
  一旦入軌之后,業(yè)務(wù)進入快速增長期,CTO的核心不是看方向,而是怎么做好技術(shù),這時首席架構(gòu)師會變得非常重要,技術(shù)讓業(yè)務(wù)更高速增長、加速成長,業(yè)務(wù)不要被技術(shù)拖慢增速。同時,組織設(shè)計在這個階段和技術(shù)架構(gòu)一樣重要。然后不能等到業(yè)務(wù)停滯時才去判斷未來,CTO要提前判斷未來會發(fā)生什么,第二曲線是什么,設(shè)計一條未來的路線。
  我是覺得整體上組織需要有兩種領(lǐng)導(dǎo)力:一、專業(yè)的領(lǐng)導(dǎo)力:CTO、首席架構(gòu)師、技術(shù)總監(jiān)和 VP;二、組織設(shè)計的管理領(lǐng)導(dǎo)力。CTO在不同時候戴著不同帽子,有時會承擔(dān)一個專業(yè)角色,有的時候會承擔(dān)一個管理的角色,有的時候會承擔(dān)一個戰(zhàn)略的角色。
  很難說一個 CTO是萬能的,CTO一定有強項和短板。比如我自己,我的定位是一個工程師,工程能力是我相對比較強的一項能力,組織是我的弱項。在這個過程中,一個核心班子里需要非常好的配合,具備不同的領(lǐng)導(dǎo)力,給不同的人戴上不同的帽子。
  CTO的職責(zé)
  1.建立商業(yè)與技術(shù)的“共振”連接
  CTO在一個公司中到底扮演什么角色和職責(zé)?
  我覺得第一個非常基礎(chǔ)的職責(zé),是要建立起商業(yè)和技術(shù)連接。前面講到商業(yè)和技術(shù)是共同進化的,而共同進化的過程中兩者要發(fā)生很好的共振連接。為了實現(xiàn)社會價值、客戶價值,企業(yè)要判斷需要怎樣的核心能力?這個判斷不是一個純粹技術(shù)判斷,也不是純業(yè)務(wù)判斷,而是一個公司核心班子共同的判斷。
  這個過程中,CEO和 CTO怎么對話就變得非常關(guān)鍵了,能不能說一樣的語言? CTO要和 CEO問清楚幾個框架性的問題:一是我們公司服務(wù)誰,要把客戶定義的非常清楚;二是我們?yōu)檫@些客戶創(chuàng)造什么樣的核心價值、差異化價值;三是我們的商業(yè)模式,用什么樣的商業(yè)模式實現(xiàn)核心價值;四是為了實現(xiàn)這樣的商業(yè)模式,我們需要什么樣的能力、走過什么路徑、構(gòu)建什么樣的組織。把這些問題理解清楚之后,技術(shù)就能理解業(yè)務(wù)要干什么了。
  我在阿里巴巴接到任何一個新業(yè)務(wù),都一定要對它進行新的理解,后續(xù)可能還會有多的問題、更深入的理解,但這是我做的第一件事情,這是 CTO的職責(zé)。
  2.一張圖、一場仗、一顆心,愿景牽引前行
  很多時候,牽引團隊往前是非常有挑戰(zhàn)的事情,小團隊還可以靠關(guān)系。大團隊里大部分人你都不能認(rèn)識,怎么還能“一張圖、一場仗、一顆心”?這時候就需要有領(lǐng)導(dǎo)力了。
  我分享幾個例子,比較有挑戰(zhàn),也有很多不一樣的方法。
  第一個例子,我在團隊里建立領(lǐng)導(dǎo)力的方式,是跟團隊一起定義非常清晰的目標(biāo)。2013年經(jīng)過一番猶豫之后,我決定接受負(fù)責(zé)螞蟻整個技術(shù)團隊的任命。當(dāng)時我遇到的最大的挑戰(zhàn)就是和團隊之間的信任——本來大家都是平級,突然我要成為這個部門的總負(fù)責(zé)人。當(dāng)時大家給我的反饋是,覺得魯肅做技術(shù)可以,但不懂業(yè)務(wù)技術(shù)。
  我覺得信任是要靠跟大家一起把事情做成,甚至沒有必要讓大家建立起對領(lǐng)導(dǎo)者的認(rèn)同,就看大家能不能相信共同的目標(biāo),并把目標(biāo)實現(xiàn)。2013年,我跟團隊共識了“1234”目標(biāo):
  1.公司從互聯(lián)網(wǎng)平臺向數(shù)字普惠金融平臺轉(zhuǎn)型,我們的技術(shù)架構(gòu)怎么去支撐?需要重新定義支撐數(shù)字普惠金融新的平臺。做平臺架構(gòu)這件事情,至少是我的本行,大家認(rèn)同。
  2.螞蟻哪些核心技術(shù)是我們今年必須要突破的?當(dāng)時定了兩個核心點:一是 OceanBase在這一年能落地;二是我們要把螞蟻的平臺建在云上。
  3.我們能不能在這一年大促的時候?qū)崿F(xiàn) 3萬筆 /秒的支付?大家知道從 2010年開始,每年會有一次大考:大促能扛多高的峰值。前兩年,螞蟻都是非常吃力的去扛。甚至 2012年對團隊來說是個很大的恥辱——大促前 50分鐘系統(tǒng)被沖垮了,50分鐘后才恢復(fù)。2013年大家都想一雪前恥:2012年時峰值是每秒 3000筆,已經(jīng)是性能極限了。我們定一個 10倍的目標(biāo)實現(xiàn) 3萬筆 /秒!
  4.因為我們的服務(wù)不僅僅是支付,還開始提供金融服務(wù),穩(wěn)定性必須像銀行一樣,甚至比銀行更穩(wěn)定。我們定下可運行目標(biāo) 4個 9(99.99%),之前 3個 9都很吃力。
  這四個目標(biāo),大家非常認(rèn)同,雖然都很有挑戰(zhàn)。年底的時候,經(jīng)過大家的努力,四個目標(biāo)里實現(xiàn)了三個半:完成了平臺的轉(zhuǎn)型,余額寶、花唄業(yè)務(wù)都起來了; OceanBase在螞蟻系統(tǒng)里落地了;做到 4個 9;但我們沒有做到 3萬筆 /秒,只做到 1.5萬筆 /秒,是 5倍的提升。之后大家開始建立起對我的信任。
  我到了阿里巴巴之后,第一件事情也是需要大家聚在一起,一起定下目標(biāo)。空降到一個平臺,其實很難給團隊定一個全新的愿景。如果新 CTO上來就先畫一張未來的圖,基本是不太靠譜的,還是要和團隊一起定下非常扎實的目標(biāo)、一起達成目標(biāo)。于是,我選擇先在云這個關(guān)鍵戰(zhàn)略上穩(wěn)中有進,全面上云必須全部完成。二是在云之上,如何從“上云”到“用云”,把云原生做深入,將阿里巴巴中臺做深入,包括 AI中臺、數(shù)據(jù)中臺和業(yè)務(wù)中臺。另外一個目標(biāo)是組織數(shù)字化,阿里巴巴雖然生于數(shù)字時代,但也需要做數(shù)字化升級和轉(zhuǎn)型,阿里巴巴數(shù)字原生商業(yè)系統(tǒng)和數(shù)字原生組織是去年和團隊一起確定的方向。
  CTO和團隊在一起要有一個面向未來的思考,不只是當(dāng)下與業(yè)務(wù)的連接。未來是什么,關(guān)鍵的路徑是什么,核心的幾場仗是什么,這是 CTO的牽引力。
  3.關(guān)鍵決策,掃清前進中的障礙
  CTO需要幫團隊解決問題,掃清一些障礙,做出一些關(guān)鍵的決策。在螞蟻做 CTO時,第一個關(guān)鍵的決策是技術(shù)架構(gòu)往金融方向還是互聯(lián)網(wǎng)方向?最后決策是互聯(lián)網(wǎng)。第二個關(guān)鍵決策是關(guān)于 OceanBase的轉(zhuǎn)型。
  2010年,陽振坤老師帶著團隊開始打造 OceanBase。最早 OceanBase還不是一個真正的數(shù)據(jù)庫,當(dāng)時第一個場景是解決淘寶的收藏夾問題,需要海量數(shù)據(jù)但不需要很強的數(shù)據(jù)處理能力。但到了 2012年,OceanBase面臨一個發(fā)展決策,要不要成為一個真正的數(shù)據(jù)庫。
  螞蟻團隊對 OceanBase的懷疑有合理的理由,我們現(xiàn)在的業(yè)務(wù)對數(shù)據(jù)庫要求這么高, Oracle那么先進的數(shù)據(jù)庫團隊打造了幾十年,才剛剛能滿足我們的業(yè)務(wù)需求。陽老師帶著幾十個人花兩年時間打造一個數(shù)據(jù)庫,能把 Oracle替代掉嗎?
  我覺得王堅博士是很有領(lǐng)導(dǎo)藝術(shù)的,當(dāng)時他做了一個選擇,他說:“把 OceanBase送給支付寶吧?!钡搅宋浵佭@邊就成了我當(dāng)時定的“1234目標(biāo)”中“2”的部分:看 OceanBase能不能再往前發(fā)展。
  當(dāng)時我們采用了什么辦法呢?第一先了解清楚 OceanBase能干什么;第二,既然公司整體不能做,就搞一個小場景,在螞蟻的核心交易里切了 1%的流量給 OceanBase,讓它在 1%流量里證明能力。OceanBase也很珍惜這個舞臺,撐住了 1%的流量,最終在這一年完成了從非關(guān)系型數(shù)據(jù)庫向真正關(guān)系型數(shù)據(jù)庫的轉(zhuǎn)變。2014年我們再大膽往前邁一步,把“雙 11”大促 10%的流量切給它,讓它進核心賬務(wù)系統(tǒng)——賬務(wù)系統(tǒng)比核心交易系統(tǒng)要求更高。當(dāng)時這個決策是有一些冒險的,但現(xiàn)在回頭看,正是這些決策讓 OceanBase有了不一樣的未來。
  后面幾個決策也類似,作為 CTO如何拿捏好風(fēng)險和穩(wěn)定,是非常關(guān)鍵的。
  比如余額寶上線的第一天我們就知道這個產(chǎn)品一定會成功,因為它的客戶價值特別清晰,讓用戶每一塊錢的余額都有收益。但我們沒有料到,它成功得那么快,一個月時間迅速就把原來準(zhǔn)備的系統(tǒng)容量全部用掉了。我們自己還好,因為螞蟻的平臺已經(jīng)完全分布式化了,可以快速擴容。但我們的合作伙伴天弘基金,因為老系統(tǒng)無法支撐余額寶這么快速的增長,擴容成了核心難題。
  于是我們做了一個非常重要的決定:把天弘的系統(tǒng)搬到云上,用分布式架構(gòu)重寫一遍,三個月內(nèi)必須完成。這件事也證明了金融云的價值,金融云的業(yè)務(wù)也就起來了。
  這些都說明,CTO要在關(guān)鍵決策中發(fā)揮作用,幫助團隊下決心并把握好不確定性。
  4.應(yīng)對風(fēng)險,化危為機
  公司的技術(shù)風(fēng)險有幾類。
  第一類,技術(shù)架構(gòu)不能夠支持業(yè)務(wù)發(fā)展,這是業(yè)務(wù)不能接受的風(fēng)險。但這類的風(fēng)險,相對顯而易見。阿里巴巴為什么在 2009年啟動“去 IOE”,就是判斷到這個風(fēng)險早晚會出現(xiàn),“IOE”架構(gòu)已經(jīng)不能支持公司業(yè)務(wù)發(fā)展,必須去掉。螞蟻在 2010年開始啟動“去 IOE”,因為那一年“雙 11”大促讓我們看到原來架構(gòu)基本不能支持業(yè)務(wù)了。
  2010年的“雙 11”大促被我們稱為“人肉云計算”。大促開始,我們看到流量瘋漲,判斷白天肯定會沖破設(shè)計容量,就趕快把服務(wù)器庫存全部加進去了,結(jié)果發(fā)現(xiàn)還是不行,又馬上去“殺”服務(wù),把不必要的服務(wù)全部關(guān)掉,把容量放在核心關(guān)鍵鏈路上,結(jié)果還不夠,我們又去看關(guān)鍵服務(wù)里還有沒有能“殺”的。那年“雙 11”最后幾分鐘,我們的核心賬務(wù)數(shù)據(jù)庫和會計數(shù)據(jù)庫都到了極限,還有 10秒鐘就要掛掉了。最后關(guān)頭,團隊非常果斷,把會計數(shù)據(jù)庫殺掉了。會計記賬本身很重要,但斷個幾分鐘還能承受,核心賬務(wù)不能掛,否則整個業(yè)務(wù)就全部中斷了。就這樣,2010年的“雙 11”大促是硬撐下來的。
  其實后來很長一段時間,都是“人肉云計算”,人在做資源調(diào)配的事情,人來做決策判斷。這太痛苦了,這一切逼著螞蟻非常堅定地?fù)肀г频姆植际郊軜?gòu),要上云。
  第二類風(fēng)險不是技術(shù)架構(gòu)的問題,而是穩(wěn)定性出現(xiàn)重大問題。CTO必須要判斷出這個情況,CEO一定要給 CTO相應(yīng)的資源支持。
  比如螞蟻的“527”。2015年我們實現(xiàn)了整個支付寶系統(tǒng)的異地多活,華南機房和華東機房異地可以做分布式交易,這在金融系統(tǒng)里應(yīng)該是第一次。我們還特地做了斷網(wǎng)演練,直接把華東區(qū)域全部關(guān)掉,華南直接接管業(yè)務(wù),結(jié)果非常成功,大家非常開心。我還給當(dāng)時的 CEO彭蕾發(fā)了一個戰(zhàn)報,說螞蟻首次實現(xiàn)了異地多活,你們可以放心睡覺了,以后任何情況下系統(tǒng)都會穩(wěn)如磐石。
  2015年 5月 27日,我開車在路上收到了報警,通常遇到這種情況團隊就直接處理了,但那個報警就一直響。我就把車停在路邊,才發(fā)現(xiàn)光纖被挖斷了,系統(tǒng)中斷將近 2個小時。原來異地多活,光纖一斷,系統(tǒng)就切不過去了。從那之后,我再也沒有發(fā)過任何一份戰(zhàn)報,沒有和 CEO報過任何一次喜。
  當(dāng)時這個事情對螞蟻技術(shù)團隊打擊非常大,公司受到最大的打擊是客戶的信任。外面有很多文章調(diào)侃螞蟻的技術(shù),螞蟻的技術(shù)形象和外部的信任喪失了。內(nèi)部從我到整個團隊與 CEO的信任也開始出現(xiàn)了危機——以后再講話,別人只聽一半,因為說的話不見得靠譜。
  危機也可以是好事情?!?27”之后,我們做了幾件非常關(guān)鍵的事情,第一,開始跟公司溝通,我們需要在螞蟻成立一個專門的部門,叫技術(shù)風(fēng)險部。這個部門就一個職責(zé),守住螞蟻技術(shù)底盤的風(fēng)險,公司額外撥 10%的技術(shù)資源給到這個團隊。也就是說,我們愿意付出額外 10%的技術(shù)資源專門確保螞蟻系統(tǒng)未來沒有風(fēng)險,這件事情至少幫我們爭取到這個資源。第二,立刻啟動實戰(zhàn)演練,前面說其實我們做過異地多活的斷電演練,但這是有準(zhǔn)備的演練。從那一天開始我們要做無準(zhǔn)備演練,一直到今天。第三,我們確定把 5月 27日這一天作為螞蟻的技術(shù)日,螞蟻未來無論是存在 102年還是更長的時間,所有技術(shù)工程師都要記住這一天,讓我們永遠能夠記住風(fēng)險。
  這三件事情做完,反而讓團隊更加凝聚了,螞蟻技術(shù)的風(fēng)險防控水平有很大的提升,我覺得這是轉(zhuǎn)危為機。
  第三類風(fēng)險,可能是 CTO和 CEO都最擔(dān)心的,一個新技術(shù)出現(xiàn)之后會不會顛覆原有的業(yè)務(wù)模式。不僅是很多發(fā)展中的公司會擔(dān)心,即便阿里巴巴這樣規(guī)模的公司也非常擔(dān)心。當(dāng)一個新技術(shù)出現(xiàn),無論公司大小,都有被完全顛覆的風(fēng)險。螞蟻面對移動互聯(lián)網(wǎng)時代時,我們有一段時間很擔(dān)心,通過好幾年努力定義移動支付,基本上算是渡過這個危機,但當(dāng)時對螞蟻的挑戰(zhàn)還是非常大的。當(dāng)比特幣開始成為一個現(xiàn)象時,我們也是非常擔(dān)心的:它會不會把支付完全顛覆了? 2019年 6月 Libra出現(xiàn),更讓人擔(dān)心了:全球支付會不會被一種新的貨幣重新定義,這是一種降維打擊。
  這時候 CTO必須要站到一號位班子里去,幫助 CEO做判斷。每一次對未來危機的判斷,都可以觸發(fā)未來新的商業(yè)機會。大的策略是:面對任何技術(shù)風(fēng)險不能只是看,要親自去試,需要公司投入一些有價值的浪費。
  第四類風(fēng)險,是溫水煮青蛙。技術(shù)會不會反過來傷害公司,它不像風(fēng)險那么直接,但是如果因為技術(shù)、架構(gòu)或組織問題讓公司效率變慢了,公司會慢慢喪失競爭力、創(chuàng)新力。隨著時間的推移,這是最大的危機。阿里巴巴的中臺就是一個很好的例子,中臺的優(yōu)點在于可以減少很多重復(fù)建設(shè),讓業(yè)務(wù)可以基于中臺快速創(chuàng)新,因為重復(fù)建設(shè)的繁忙約等于效率低下。但阿里巴巴的中臺已經(jīng)非常完善了,開始進入了另外一個階段。目前,業(yè)務(wù)中臺里有面向核心電商的中臺、數(shù)字供應(yīng)鏈的中臺、職能線業(yè)務(wù)中臺、數(shù)據(jù)中臺、AI中臺等一系列技術(shù)中臺。當(dāng)我做一個新業(yè)務(wù)的時候,我需要跟這么多中臺打交道,需要他們?nèi)ブ挝?過程中如果有任何一個中臺支持不能到位,我的業(yè)務(wù)可能就做不成。我們現(xiàn)在開始大力推動中臺能力進一步升級,改善中臺的交付方式,把中臺再升級。這里涉及到很多技術(shù)架構(gòu)的變化。為了防止溫水煮青蛙就是要一直做系統(tǒng)化的梳理,再去一個階段一個階段的解決。
  5.組織設(shè)計與治理——平衡秩序與創(chuàng)新
  一個人當(dāng) CTO的時間越長,專業(yè)能力下降得就越嚴(yán)重。我判斷自己的專業(yè)能力大概每隔兩年會降一級。也有好處,你可以跟團隊一起做,團隊會更強。組織設(shè)計的核心是要既有秩序又能創(chuàng)新。這是有矛盾的,創(chuàng)新是在一個混亂的土壤里長出來的,秩序讓效率高,但會把很多創(chuàng)新吃掉。這個過程有點像踩鋼絲,處理秩序和創(chuàng)新的平衡。
  阿里巴巴圍繞技術(shù)的組織,是有兩條線的。一條線是實的管理線,是分層分布的:
  前臺,面向業(yè)務(wù)的,為客戶贏;中臺,是能力中心,中臺的客戶是前臺,讓前臺更加高效,讓前臺更有競爭力;底層后臺,是強調(diào)技術(shù)先進性的,確保業(yè)務(wù)永續(xù)。這個組織每一層都是獨立的業(yè)務(wù)經(jīng)營單元,現(xiàn)在我們在做一件事情,讓每個獨立的業(yè)務(wù)經(jīng)營單元都有 CTO。這個 CTO會對這個業(yè)務(wù)經(jīng)營單元負(fù)全責(zé)。實線管理機制的核心就是把每一層之間的界面定義清楚。
  這種治理讓每一塊業(yè)務(wù)都很靈活,都可以自主發(fā)展,但又帶來了一個新問題,我們該統(tǒng)一發(fā)展的技術(shù)怎么形成合力,所以我們有另一條虛線:技術(shù)委員會,下設(shè)二三十個核心的技術(shù)小組,把所有的共性領(lǐng)域橫向拉通。通過技術(shù)委員會和技術(shù)小組的專業(yè)領(lǐng)導(dǎo)力,實現(xiàn)策略通、人才通。這兩條線會同時運作,隨著管理線越來越清晰的分層,這條專業(yè)的虛線就會變得非常重要。比如音視頻技術(shù),每個業(yè)務(wù)里都會用到音視頻技術(shù),中臺也有音視頻能力,底層需要優(yōu)化以提升音視頻技術(shù)的競爭力。前臺、中臺和底層跟音視頻相關(guān)的技術(shù)專家組成一個技術(shù)小組,由一個專家?guī)ьI(lǐng)。
  這條虛線會轉(zhuǎn)化成實線的管理決策,我們必須要打通這個鏈路,這個體系的運作會比較有挑戰(zhàn)。作為 CTO,我覺得要在過程中保持非常開放的心態(tài),要信賴每個領(lǐng)域技術(shù)專家的判斷。技術(shù)專家意見不一致時要有獨立思考,做出自己獨立判斷,要知道創(chuàng)新和秩序的平衡點在哪里。
  組織大到一定程度之后就會遇到這樣的問題,我確實也不建議技術(shù)組織還不大時就把組織結(jié)構(gòu)搞的太復(fù)雜,這會帶來額外的管理和溝通成本。
  6.凝心聚氣、薪火相傳
  凝心聚氣其實是最重要,也是最難的,這是一個技術(shù)文化的事情。每隔一段時間,我們都會聚在一起討論阿里巴巴的技術(shù)文化。去年我們討論了一輪,三年前我們也討論過一輪。三年前定下阿里巴巴技術(shù)的 slogan叫“技術(shù)創(chuàng)造新商業(yè)”,再之前的 slogan是“技術(shù)拓展商業(yè)邊界”。
  除了 slogan,阿里巴巴的技術(shù)文化底色是務(wù)實、有一說一,不要打花腔,不要做包裝,事實是什么樣就什么樣,用事實說話。沒有數(shù)據(jù)、沒有事實的時候,就不要說話。如果大家都能踐行這個文化的話,很多事情會變得特別簡單,但其實踐行文化并不容易。
  我們有一些技術(shù)土話,比如“面向未來去思考”、“因為相信,所以看見”,是需要看準(zhǔn)未來,敢于投入,真正做到先發(fā)先至。因為如果別人做、你再去做,永遠是追趕者,會非常累,但看準(zhǔn)未來、敢于投入,也不會輕松。
  這些文化、愿景能不能在一個大的場景里形成共識,尤其這個組織每年都有人離開、有新同學(xué)進來,還能保證一致的文化,其實是非常有挑戰(zhàn)的。但只有文化做好,很多事情才能順理成章。
  CTO可能不是思想家,但一定是行動派
  前面是我思考的 CTO的六個職責(zé),雖然不完整,雖然不可能每件事情都做得非常好,但核心思考是,我是相信 CTO或者說技術(shù)團隊需要跟著公司業(yè)務(wù)發(fā)展不斷進化。我從螞蟻到阿里巴巴,差不多經(jīng)歷了前面六個階段,我稱之為 CTO的六步曲:
  1.跟團隊先一起定義好目標(biāo),先一起做成一些事情。
  2.多了解團隊、了解業(yè)務(wù),知道未來要去哪里,跟團隊一起共創(chuàng)一個愿景,把大家熱情點燃。
  3.CTO的一個核心工作,是怎么能夠讓自己不要成為團隊的天花板,而是把自己當(dāng)成團隊的地板,用人做事。如果 CTO是公司技術(shù)天花板的話,那你把公司技術(shù)就壓在一定的高度和范圍內(nèi),公司技術(shù)永遠是在一個小的、狹窄的領(lǐng)域。當(dāng) CTO的技術(shù)能力是公司的地板時,公司可以通過新同學(xué)擴展邊界。成為 CTO還是用人做事為主,而不是做事用人為主。
  4.一切都很好時,別忘了晴天去修屋頂,永遠居安思危。一旦危機出現(xiàn),樂觀地看待,每個危機背后都有機會,轉(zhuǎn)危為機。
  5.過程中不只看當(dāng)下,也要布局未來,為公司建立技術(shù)縱深。在業(yè)務(wù)發(fā)展早期,技術(shù)的縱深就是一個點。當(dāng)發(fā)展到像阿里巴巴現(xiàn)在這個規(guī)模時,技術(shù)縱深就是一個多面體,必須有充分的、多面的布局,才能支撐一個大公司的發(fā)展。決定布局投入多少,要和 CEO充分對焦。
  6.最后一點,人才。薪火相傳,人才才是公司未來發(fā)展的關(guān)鍵。我記得阿里云曾經(jīng)有一位技術(shù)負(fù)責(zé)人分享說:什么是一家公司技術(shù)的最高境界,就是誰來當(dāng) CTO都能當(dāng)好,我覺得這是我要努力的一件事情。
  如何發(fā)展與培養(yǎng)CTO
  最重要的事情放在最后,就是人才。
  前面講到我們的分層分布治理,每個經(jīng)營單元要有一個小 CTO,這個 CTO怎么培養(yǎng)?基本上我們讓他在戰(zhàn)場里去練,為他設(shè)計發(fā)展路徑,也有“奇點營”這樣的班專門培養(yǎng)業(yè)務(wù)小 CTO。
  當(dāng)然最難的事情就是培養(yǎng)接班人,自己的接班人和團隊的接班人,這件事情其實是我上任第一天就在想的事。但選準(zhǔn)人、選好人,有非常多的挑戰(zhàn)。
  我有兩個小經(jīng)驗:
  1.CTO發(fā)展是“Z”字型的路線。
  直線成為 CTO的人,往往會因為路徑太單一、沒有足夠磨煉而出問題。行癲負(fù)責(zé)過淘寶的業(yè)務(wù),負(fù)責(zé)過 B2B業(yè)務(wù),再做阿里巴巴的 CTO,再做阿里云的總裁。我做過螞蟻的技術(shù),做了兩年螞蟻國際業(yè)務(wù),再做阿里巴巴的 CTO。做過業(yè)務(wù)再回頭看技術(shù),跟 CEO對話會有共同的框架,這一點很關(guān)鍵。
  2.做“L”型職責(zé)設(shè)計。
  CTO最怕做虛了,畢竟這是公司里非常高的位置,每件具體事情都有相應(yīng)的核心骨干幫你負(fù)責(zé),但你手不伸下去就很容易做虛,看不到下面的實際情況,會導(dǎo)致決策出錯。
  阿里巴巴怎么解決這個問題呢?就是給 CTO一橫一縱:橫向管理的 CTO,也給你一個縱向的業(yè)務(wù)技術(shù)一號崗位,保持與一線的對接。比如我現(xiàn)在既是阿里巴巴集團的 CTO,又是菜鳥的 CTO。行癲也曾經(jīng)既是阿里巴巴的 CTO,也是阿里云的 CTO,也是一橫一縱。
  CTO應(yīng)該具備怎樣的特質(zhì)?每個 CTO都有不一樣的風(fēng)格,但有幾點是共通的:一是要求真務(wù)實,真正“No Data No BB”,永遠不是高高在上地做決定,而是做決定時能夠看得到下面,這很重要;二是要有擔(dān)當(dāng),在做關(guān)鍵決策時敢負(fù)歷史責(zé)任,有進取心;三是必須時時自省和開放。如果不具備自省和開放的能力,是很難去進化的;四是一個大組織和大業(yè)務(wù)的 CTO要有全局觀,能夠做架構(gòu),能把各方面、各種信息形成一張大圖。
  曾國藩非常懂用人之道,他這么選人:“專從危難之際,默察樸拙之人,則幾矣”。我特別喜歡這句話,把自己的釘釘簽名都寫為“樸拙”,這是對自己的要求。
  到現(xiàn)在為止,我覺得自己很多方面做得依然不夠,包括對未來的判斷。 CEO和 CTO實際上是要共同成長、共同進化,在工作中形成默契的,這是非常重要的。
全球化工設(shè)備網(wǎng)(http://www.bhmbl.cn )友情提醒,轉(zhuǎn)載請務(wù)必注明來源:全球化工設(shè)備網(wǎng)!違者必究.

標(biāo)簽:

分享到:
免責(zé)聲明:1、本文系本網(wǎng)編輯轉(zhuǎn)載或者作者自行發(fā)布,本網(wǎng)發(fā)布文章的目的在于傳遞更多信息給訪問者,并不代表本網(wǎng)贊同其觀點,同時本網(wǎng)亦不對文章內(nèi)容的真實性負(fù)責(zé)。
2、如涉及作品內(nèi)容、版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間作出適當(dāng)處理!有關(guān)作品版權(quán)事宜請聯(lián)系:+86-571-88970062