近日,中國科學(xué)院重慶綠色智能技術(shù)研究院大數(shù)據(jù)挖掘及應(yīng)用中心研究團隊在時間序列的多粒度預(yù)測模型的研究方面取得進展,相關(guān)研究成果發(fā)表在《Chemometrics and Intelligent Laboratory Systems》和《Neurocomputing》國際期刊上發(fā)表。
具有不確定性特征的數(shù)據(jù)集一直以來都是數(shù)據(jù)挖掘領(lǐng)域的難點和熱點問題,傳統(tǒng)的時間序列預(yù)測模型幾乎都是采用數(shù)據(jù)填充等不確定性的方法處理不確定性數(shù)據(jù)集,這使得這些模型在許多領(lǐng)域得不到預(yù)期的預(yù)測精度。大數(shù)據(jù)挖掘研究團隊通過分析不同領(lǐng)域的時間序列數(shù)據(jù)的共同基本特征,以粒計算理論為基礎(chǔ),分別建立了基于水平?;▽傩粤;┖痛怪绷;颖局盗;┑亩嗔6戎R空間,然后結(jié)合模糊時間序列預(yù)測、時間序列近似周期和粒子群優(yōu)化算法等,提出了兩種時間序列的多粒度預(yù)測模型。該模型通過在不同粒度層次上的切換,實現(xiàn)了以確定性方法處理不確定性數(shù)據(jù)集的構(gòu)想,并且在“臺灣加權(quán)股票指數(shù)(TAIEX)”、“城市失業(yè)率”等經(jīng)典的時間序列預(yù)測數(shù)據(jù)集上的模擬實驗中獲得了高精度的預(yù)測結(jié)果。另外,在三峽庫區(qū)長江干流的水質(zhì)預(yù)測模擬試驗中表明,該模型完全可以適應(yīng)三峽庫區(qū)復(fù)雜的時間序列水質(zhì)預(yù)測,為庫區(qū)的水質(zhì)預(yù)測預(yù)警提供依據(jù)。
該研究得到國家科技重大專項“水體污染控制與治理”的資助。
文章鏈接http://www.sciencedirect.com/science/article/pii/S0169743915002427
ttp://www.sciencedirect.com/science/article/pii/S092523121501348X