前方高能“?!焙芏啵茨切┐髷?shù)據(jù)的豬在跑

文|鄒欣,微軟亞洲研究院研發(fā)經(jīng)理 微博@程序員鄒欣

最近幾年來,市面上有不少關(guān)于大數(shù)據(jù)的宣傳, 凡有飲水處,都能聽到 “big data“, ”data driven decision making” 等等高大上的詞匯。我在中關(guān)村街頭看見有人在溜大數(shù)據(jù)的豬,也吃過大數(shù)據(jù)的豬肉,飽食終日,也想分享一些零碎的感想。

0. 大數(shù)據(jù)的好處

【此處略去 250 萬字】

1. 古已有之。很多現(xiàn)在流行的道理,國人往往說古已有之。 “數(shù)據(jù)驅(qū)動決定”也不例外:

… …先誑之曰:“與若芧,朝三而暮四,足乎?”眾狙皆起怒。俄而曰:“與若芧,朝四而暮三,足乎?”眾狙皆伏而喜?!?《列子》

雖然都是七個“茅”, 但是朝四暮三會導(dǎo)致用戶爽, 那一定是有道理的!

2. 自己的數(shù)據(jù)和別人的數(shù)據(jù)

大部分人對自己的如雷鼾聲聽而不聞,倒是別處有什么小響動,就坐臥不寧,說影響自己休息。一些大公司里不少的經(jīng)理經(jīng)常發(fā)一些其他產(chǎn)品的成敗分析,最新動向,謠言等等,但是自己產(chǎn)品的用戶發(fā)郵件來抱怨,卻沒人處理。

3. 數(shù)據(jù)的可見性 和 成本

當(dāng)我們談大數(shù)據(jù)的時候, 很多人的第一反應(yīng)是,希望看到更多的數(shù)據(jù),甚至所有的數(shù)據(jù),因為看到了所有的數(shù)據(jù),就能做決定了。

例如,兩個人在下陸戰(zhàn)棋, 你不知道對方的具體兵力部署,的確不好做決定。 但是,要看到對方的數(shù)據(jù),需要多少成本呢?你可以用連長,營長去實驗,但是這樣的實驗是有成本的。

有時候自己人傳遞數(shù)據(jù),處理數(shù)據(jù)也是有成本的,我們以前小伙伴們在學(xué)橋牌的時候,本來雙方已經(jīng)叫到4黑桃了,不料南方又叫了一個新花色 “5 草花”! 后來雙方總結(jié)的時候,南說 “我想表達(dá)一下我的草花也挺好...” 表達(dá)是有成本的,這意味著雙方又要為此在 5 階上面尋找合適的定約,增加了許多沒必要的風(fēng)險,最后牌局打宕了。

(下圖只是一個示意)

好,下面給你看所有的數(shù)據(jù),這回所有的棋子都沒有遮掩,雙方的信息都是公開的。那么,這些數(shù)據(jù)展現(xiàn)了什么規(guī)律?下一步黑棋應(yīng)該怎么走?

(這是最高等級的決賽,請讀者慎重考慮。實戰(zhàn)中,黑棋的下一手考慮了 2 小時 57 分鐘,然后一招制敵。這位棋手的大腦在將近 3 小時的時間里收集了什么?計算了什么?)

4. 大數(shù)據(jù)和第一感

一葉落而知天下秋。 這是大數(shù)據(jù)么? 如果大數(shù)據(jù)的專家坐鎮(zhèn),要看到多少落葉,到什么時候才做出 “data driven” 的判斷 — 秋天到了!

大數(shù)據(jù),有人覺得大和紛亂,有人第一感就能看到問題的實質(zhì)。例如 @winter 講得故事:

5. 大數(shù)據(jù)、把握和時間

如果有時間,我們總是可以得到更多的數(shù)據(jù)。 有積極的員工提出新想法,建議在某一個局部先試驗,當(dāng)然這需要資源。 其他人反對說, 你有100% 的把握么? 哦,沒有? 不然繼續(xù)收集數(shù)據(jù),等到有了我們再討論。

等到有充分?jǐn)?shù)據(jù)的時候,就是競爭對手已經(jīng)占領(lǐng)市場,大勢已定,各路專家都寫文章分析它的成功經(jīng)驗的時候。 這時,你拿了數(shù)據(jù)給領(lǐng)導(dǎo)看。 領(lǐng)導(dǎo)說,嗯,有道理啊,當(dāng)然,我們這個時候再進(jìn)入這個市場顯然已經(jīng)太晚了。。。

籃球場上,有隊員要投籃, 他的隊友不是各自做好準(zhǔn)備搶籃板,或者補(bǔ)位,而是問你, 你有100% 的把握投進(jìn)么? 如果沒有,那就傳一會球吧,千萬別 “風(fēng)投”。。。 籃球比賽有24 秒的進(jìn)攻時間限制。大公司往往沒有這樣的限制,在大公司工作的人可以永遠(yuǎn)頭腦風(fēng)暴,收集數(shù)據(jù),分析數(shù)據(jù), 把傳球過去,別人又傳過來,這樣就能度過好幾年。事實上,別人在市場上已經(jīng)打了好幾個來回了。

6. 記一次 SMART 的大數(shù)據(jù)項目

王屋村進(jìn)駐了幾個大數(shù)據(jù)專業(yè)的實習(xí)生,他們品嘗了當(dāng)?shù)靥禺a(chǎn)芝麻燒餅之后,都贊這些燒餅外焦里嫩,焦得金黃,帶有芝麻的香味。 吃完好多燒餅之后,大家打著飽嗝,看著桌面上的芝麻粒兒,決定要對它進(jìn)行大數(shù)據(jù)的剖析和改進(jìn)。 首先,最容易數(shù)據(jù)化的,是芝麻粒兒?!?b>最關(guān)鍵的,是要問出好問題”, 他們從課堂筆記中畫重點的字句里抽出這句話,開始了一系列當(dāng)?shù)厝藦膩頉]問過的問題:

  • 一個燒餅表面附著有多少個芝麻?
  • 當(dāng)燒餅沒有附著任何芝麻的時候,是不能叫“芝麻燒餅”的, 當(dāng)燒餅的芝麻數(shù)到了N 個,用戶就會說這是“芝麻燒餅”, 那么,N 是多少?
  • 數(shù)據(jù)小組的目標(biāo)是:求出N,并優(yōu)化。

他們從MBA 和大數(shù)據(jù)的教材中,論證了這個項目是SMART 的:

Specific: 針對一個具體的問題,避免過于寬泛的 – 王屋村新農(nóng)業(yè)改革前景展望,等問題。

Measureable: 可以衡量的,而不是籠統(tǒng)的 “好吃”,“有嚼勁”。

Actionable: 可以具體操作的 – 增加或減少芝麻的數(shù)量,非??刹?,操的過程可跟蹤,可衡量。

Result: 有結(jié)果的,這個活動可以優(yōu)化資源,減少芝麻的浪費。

Time: 有期限的,實習(xí)期三個月就要搞定。

他們看到這個項目是SMART 的,于是就報告領(lǐng)導(dǎo),領(lǐng)導(dǎo)看到的確是SMART 的,就認(rèn)為是好的。開始行動。 他們在三個月的時間內(nèi)實驗(吃)了各種芝麻量的燒餅,并采訪用戶,衡量用戶味蕾打開程度,做廣泛的用戶調(diào)查,跟蹤芝麻在消化系統(tǒng)的生命流程,等等。

最后,他們用Keynote 軟件分享了他們的大數(shù)據(jù)芝麻燒餅的建議:

N = 7.5

只要七顆半芝麻,用戶即認(rèn)同這個燒餅是 “芝麻燒餅”。為何要有半粒芝麻? 因為大數(shù)據(jù)的平均值就是這樣,同時,我們要做到極致,讓用戶看到燒餅上的半粒芝麻尖叫!

然后他們帶著感恩的心,用技術(shù)了改變世界的的喜悅離開了王屋村,還打包了很多燒餅。

7. 大數(shù)據(jù)是手段還是目的

有些讀者可能以為上面的例子太極端,其實在現(xiàn)實生活中,比這多彩的例子多了去了。 數(shù)據(jù)是我們的手段還是目的?

曾經(jīng)有一個小軟件,這個小軟件可以出現(xiàn)在屏幕的不同位置,給用戶帶來一些價值,用戶反饋還不錯,但是還可以做更多的事情。后來產(chǎn)品組的PM們想通過各種實驗來了解不同位置對用戶的變化

  • 界面初始是隱藏的 | 不隱藏
  • 在任務(wù)欄中顯示 | 不顯示
  • 有時主動彈出窗口 | 永遠(yuǎn)不彈出

人們用常識就可以知道, 如果這個App 不斷地出現(xiàn)在用戶的視野中, 用戶就會用得更多,但是也有用戶會覺得煩,而卸載這個App。 但是好奇的PM們想知道究竟是多少,于是我們做了各種試驗, 過了好幾個月,好了, 我們知道了具體的百分比,的確是和常識差不多。

那現(xiàn)在怎么樣呢?下一步怎么辦?怎么贏得用戶?

大家討論了一會,沒有什么辦法,最后這個項目也不做了。 如果我們把做各種實驗的時間花到給用戶提供更多價值上面,是否會更好?

我們做軟件的目的是贏得用戶, 不服務(wù)這個目標(biāo)的東西都是耍流氓!

8. 當(dāng)你有很多數(shù)據(jù),但是沒有洞察力的時候

KK說 – 當(dāng)你對互聯(lián)網(wǎng)一無所知,卻試圖通過數(shù)據(jù)來弄懂互聯(lián)網(wǎng),那么你很自然地會得出結(jié)論:互聯(lián)網(wǎng)是用來傳輸廣告和黃色內(nèi)容的。

(凱文·凱利(Kevin Kelly )訪談--想法來自何處?)

9. 如何搞到數(shù)據(jù)

在一個平行世界中,亨利福特在研發(fā)汽車的時候,他去找當(dāng)時的主流用戶 — 馬車夫 — 做大數(shù)據(jù)研究。

他和馬車夫同吃同住同生活,他收集大量的數(shù)據(jù),例如馬糞。他在深夜和眾多馬車夫喝酒,開頭腦風(fēng)暴會議,分享了無數(shù)勞動人民的黃色笑話。 馬車夫杰克的暢想深深地打動了他 – 如果馬又能跑,又不會吃草,就好了。

10. 沒有數(shù)據(jù)的地方

跟著數(shù)據(jù)跑,有這么大的錯誤么? 不至于吧?! 數(shù)據(jù)在哪里,公司的生意就在那里,這有錯么?

這當(dāng)然是有價值的,我在第 0 條就說了大數(shù)據(jù)的 250萬字的好處。 你看小朋友們踢足球, 球在哪里,他們就聚集在哪里。 這至少給大家一種參與感。 那么職業(yè)的選手怎么踢球呢?

我們看看 98 年世界杯 荷蘭 vs. 阿根廷的比賽

荷蘭隊球員弗蘭克-德波爾開了一腳長傳,他傳球計劃的落點上,沒有自己的隊友,也沒有防守隊員,那是一個沒有數(shù)據(jù)的地方。 但是,當(dāng)球落下的時候,自己的隊友就到了。

他的隊友博格坎普正跑向那個沒有數(shù)據(jù)的地方(紅衣服的那位):

現(xiàn)在人跑到了,球也到了,博格坎普一停,一晃,挑射。

守門員的手臂還在使勁伸展,三個剛剛到場的后衛(wèi)在看著皮球入網(wǎng),博格坎普的身影劃出一陣紅色的弧線,他開始慶祝了。

沒有數(shù)據(jù)的地方,沒有球的地方,往往是有機(jī)會的地方。

End.

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-06-29
前方高能“?!焙芏?,看那些大數(shù)據(jù)的豬在跑
文|鄒欣,微軟亞洲研究院研發(fā)經(jīng)理 微博@程序員鄒欣

長按掃碼 閱讀全文