斑馬數(shù)智,采用“參考”各種數(shù)據(jù)來源去獲取信息的技術(shù)方案,通過將各種數(shù)據(jù)源進(jìn)行整合,以提高數(shù)據(jù)的準(zhǔn)確度。斑馬數(shù)智擁有專業(yè)的數(shù)據(jù)清洗過濾技術(shù),可以有效識別和清除失效和干擾數(shù)據(jù),從而達(dá)到建模分析可用的標(biāo)準(zhǔn)。
斑馬數(shù)智通過Spike Detection和Noise Clean的內(nèi)部過濾技術(shù),可以識別并處理因GPS點(diǎn)漂移或者失效導(dǎo)致的異常數(shù)據(jù),并對GPS噪聲進(jìn)行過濾處理。
不同手機(jī)傳感器精度不同,直接使用誤差會(huì)非常大。斑馬數(shù)智采用動(dòng)態(tài)擴(kuò)展卡爾曼濾波器實(shí)現(xiàn)傳感器信號自動(dòng)降噪,很大限度保留了原始sensor提供的信息,通過對sensor數(shù)據(jù)的分析計(jì)算以判斷或預(yù)測當(dāng)前用戶的行為。
通過業(yè)界高質(zhì)量的基準(zhǔn)地圖,結(jié)合移動(dòng)設(shè)備的禁止和移動(dòng)狀態(tài)得出數(shù)億個(gè)準(zhǔn)確的真實(shí)興趣點(diǎn)。利用神經(jīng)網(wǎng)絡(luò)及馬爾科夫鏈技術(shù),抽取不同行為模式對應(yīng)sensor信號的74種特征及特征變遷規(guī)律,實(shí)現(xiàn)用戶行為判斷。
為滿足處理大數(shù)據(jù)的大規(guī)模性、多維度性、價(jià)值密度低、時(shí)效要求高、數(shù)據(jù)質(zhì)量層次不齊的5V特性,斑馬數(shù)智在基于目前主流的開源大數(shù)據(jù)Hadoop、Spark、 Flink、Tensorflow等平臺基礎(chǔ)上,改造和運(yùn)維搭建了一套支持實(shí)時(shí)/離線數(shù)據(jù)計(jì)算、深度學(xué)習(xí)、價(jià)值挖掘、交互式查詢的大數(shù)據(jù)綜合平臺,可處理PB級別的數(shù)據(jù)。