“motivations”部分介紹了使用谷歌搜索去評(píng)估收入質(zhì)量以及檢查收入管理的動(dòng)因。一是糟糕的財(cái)務(wù)狀況質(zhì)量,。財(cái)務(wù)狀況質(zhì)量直接影響了報(bào)表使用者做決策,。如果一個(gè)公司的財(cái)務(wù)報(bào)表無法提供真實(shí)有效的信息,那么將影響股東以及客戶的利益,,進(jìn)而給公司帶來負(fù)面影響,。使用谷歌搜索公司產(chǎn)品可以評(píng)估收入結(jié)構(gòu)是否合理,收入的趨勢(shì)是上漲還是下跌,,進(jìn)而評(píng)估公司財(cái)務(wù)表現(xiàn),。二是財(cái)務(wù)信息的延遲收集。及時(shí),、準(zhǔn)確的財(cái)務(wù)信息對(duì)企業(yè)來說是至關(guān)重要的,。企業(yè)財(cái)務(wù)信息是體現(xiàn)整個(gè)企業(yè)經(jīng)營(yíng)情況的重要方法,是企業(yè)管理者進(jìn)行各項(xiàng)決策的重要依據(jù),。所以財(cái)務(wù)信息若是被延遲收集,,將會(huì)影響企業(yè)的各項(xiàng)決策。
“broad research questions”是廣泛的研究問題,。比如,,外部的大數(shù)據(jù)來源是否能有效地預(yù)測(cè)和核實(shí)財(cái)報(bào)各項(xiàng)目。我們可以從以下幾個(gè)方面考慮:這是否是一種新的評(píng)估收入質(zhì)量的方式,;是否是一種新的檢查收入操縱的方式以及搜索量指標(biāo)(SVI)是否包含產(chǎn)品需求量的信息,。全球著名的管理咨詢公司,也是世界上首次系統(tǒng)闡述大數(shù)據(jù)概念和應(yīng)用的公司 McKinsey 定義大數(shù)據(jù)為:數(shù)據(jù)量大小超過典型的數(shù)據(jù)庫(kù)軟件的采集,、存儲(chǔ),、管理和分析等能力的數(shù)據(jù)集,。John Walker S 通過數(shù)據(jù)特點(diǎn)“4V”來定義大數(shù)據(jù),認(rèn)為大數(shù)據(jù)信息應(yīng)該滿足數(shù)據(jù)量巨大(Volume),,數(shù)據(jù)處理速度極快(Velocity),,數(shù)據(jù)形式是多種多樣,而不是局限在結(jié)構(gòu)化的數(shù)據(jù)信息(Variety),,有價(jià)值的信息隱含在海量的數(shù)據(jù)信息中,,需要通過數(shù)據(jù)挖掘的技術(shù)方法提取出來(Value)。大數(shù)據(jù)做宏觀經(jīng)濟(jì)預(yù)測(cè)有其獨(dú)特的優(yōu)勢(shì):(1)及時(shí)性,。通過互聯(lián)網(wǎng)平臺(tái)積累起來的數(shù)據(jù),,就存儲(chǔ)在網(wǎng)絡(luò)空間中,交易的數(shù)據(jù),、價(jià)格等一切信息在交易發(fā)生時(shí),,即刻在網(wǎng)絡(luò)中留下記錄痕跡,可以被一定的方法和技術(shù)提取出來,,用于處理和分析問題,,不存在時(shí)間滯后性。(2)精準(zhǔn)性,。網(wǎng)絡(luò)平臺(tái)提供的數(shù)據(jù),,在事件發(fā)生時(shí)按照實(shí)際的發(fā)生情況記錄信息,減少了人為的操作,,提供了相對(duì)更加原始的數(shù)據(jù),,而非人為搜集后經(jīng)過處理后的數(shù)據(jù)信息,更加準(zhǔn)確,。(3)相對(duì)低成本,。由于網(wǎng)絡(luò)大數(shù)據(jù)均在事件或交易發(fā)生時(shí)自動(dòng)被記錄下來,無須人為調(diào)查和搜集,,通過技術(shù)方法提取出來加以整理得到,,能夠極大程度上降低獲取數(shù)據(jù)的成本。(4)樣本量大,。通過利用互聯(lián)網(wǎng)大數(shù)據(jù)信息,,可以獲取總體或者接近全體的樣本信息,而并非通過統(tǒng)計(jì)抽樣的方式來獲取樣本信息來推斷總體信息,。這樣的大數(shù)據(jù)支持下,,用于計(jì)算的樣本量是海量的,并且能極大地接近全樣本,,直接獲取最為真實(shí)而全面的統(tǒng)計(jì)指標(biāo)信息,。
“what we find”是我們的研究結(jié)果。比如,搜索量指標(biāo)可以預(yù)測(cè)收入,。近日,,谷歌公布了一項(xiàng)重要研究成果——電影票房預(yù)測(cè)模型。該模型能夠提前一個(gè)月預(yù)測(cè)電影上映首周的票房收入,,準(zhǔn)確度高達(dá)94%,。谷歌的票房預(yù)測(cè)模型是大數(shù)據(jù)分析技術(shù)在電影行業(yè)的一個(gè)重要應(yīng)用。隨著互聯(lián)網(wǎng)的發(fā)展,,人們?cè)絹碓搅?xí)慣于在網(wǎng)上搜索電影信息,。據(jù)谷歌統(tǒng)計(jì),從2011到2012年,,電影相關(guān)的搜索量增長(zhǎng)了56%,。谷歌發(fā)現(xiàn),電影相關(guān)的搜索量與票房收入之間存在很強(qiáng)的關(guān)聯(lián),。為了構(gòu)建更加精確的預(yù)測(cè)模型,,谷歌最終采用了四類指標(biāo):(1)(電影放映前一周的)電影的搜索量(2)(電影放映前一周的)電影廣告的點(diǎn)擊量(3)上映影院數(shù)量(4)同系列電影前幾部的票房表現(xiàn)。在獲取到每部電影的這些指標(biāo)后,,谷歌構(gòu)建了一個(gè)線性回歸模型(linear regression model)模型,,來建立這些指標(biāo)和票房收入的關(guān)系。線性模型雖然簡(jiǎn)單,,但已經(jīng)達(dá)到了很高的準(zhǔn)確度(94%),。簡(jiǎn)單且效果好,,是我們?cè)趯?shí)際應(yīng)用中一直追求的,。大數(shù)據(jù)分析在各類行業(yè)收入的應(yīng)用前景使得模糊的行業(yè)經(jīng)驗(yàn)變得更加科學(xué),更加精準(zhǔn),。
“summary of contribution”是貢獻(xiàn)的總結(jié)——識(shí)別外部的大數(shù)據(jù)來源能有效地預(yù)測(cè)和核實(shí)財(cái)報(bào)各項(xiàng)目,。在公司公開財(cái)務(wù)報(bào)表前,這是一項(xiàng)非常便宜的,,用于預(yù)測(cè)財(cái)務(wù)交易的,、提高審計(jì)水平的以及檢查收入操縱的工具。
提問環(huán)節(jié),,邱鵬嘉教授和同學(xué)們討論了除了搜索量指標(biāo)之外的比如營(yíng)銷費(fèi)用對(duì)于收入的影響,。