朱亮 张建萍
[摘 要]旅行需求的序列相关结构是旅行学研讨中长时刻被疏忽的一个问题。在旅行猜测建模中,往往假定线性的或许是某种特定的非线性序列相关结构。这种假定虽然为模型构建带来必定的快捷性,可是很可能会影响猜测的精确性。该研讨引进Bernstein Copula函数描写我国入境旅行需求的序列相关结构,以构建猜测模型进行实证剖析。实证效果表明,Bernstein Copula模型在旅行猜测中具有其优越性。研讨的效果为旅行需求建模供给了一个新的考虑方向。
[要害词]序列相关结构;Bernstein Copula函数;我国入境旅行;旅行需求猜测
[中图分类号]F59
[文献标识码]A
[文章编号]1002-5006(2017)11-0041-08
Doi: 10.3969/j.issn.1002-5006.2017.11.010
导言
旅行需求猜测关于政府和旅行相关企业的战略规划和决议计划拟定来说有着极为重要的效果[1],因而长时刻遭到旅行学界的注重。许多学者都致力于旅行需求猜测模型的研讨,以期进步旅行猜测的精确度。可是,关于不同的建模数据频率、猜测期长度、客源地和目的地来说,旅行需求猜测模型也会体现出不同的猜测才干[2-3]。因而,迄今为止,旅行需求猜测依然是旅行研讨中的热门和难点。
国内外学者从20世纪60年代就开端对旅行需求猜测进行研讨,并取得很多效果[4]。Peng等的总述效果显现,时刻序列模型从80年代开端成为旅行需求建模的干流[5]。这些时刻序列模型首要是单变量模型,依靠旅行需求的序列相关联系,即滞后变量与当期变量之间的相关性,来进行猜测。其间,Box和Jenkins提出的自回归移动均匀(ARMA)模型[6],运用最为广泛,其各种衍生模型也被运用到旅行需求猜测中,如考虑时节性要素的SARIMA模型[6-10]、分数整合的ARFIMA模型[11]、奇特谱剖析模型[12]等。ARMA及其衍生模型因在运用中具有易操作性和易解读性等特征而遭到推重,可是在理论上,这些模型具有两个首要缺点。首要,这些模型的运用需求假定旅行需求遵守特定的累积散布方式(如正态散布);其次,这些模型一般假定旅行需求的当期变量和滞后期变量之间是线性联系。
线性模型虽然简略且简略解说,但线性联系仅仅很多相关联系的一种。Yu等经过剖析一个旅行需求的大数据集,发现旅行需求呈现4种数据特征:安稳的线性趋势,非线性趋势,波浪形趋势和结构突变趋势;这些数据特征会影响旅行需求猜测的精确性[13]。这些数据特征的后3种都归于广义上的非线性特征,因而单纯的运用线性结构来描绘旅行需求的序列相关联系往往是不精确的。为了处理线性结构的局限性,神经网络被引进旅行猜测中,可是神经网络存在网络结构难以断定及过度拟合等问题[14],在旅行猜测中不易推行。其他一些非线性模型,如正弦波回归和稀少高斯回归模型等[15-16],也是事先为旅行需求的序列相关联系假定了某种特定的结构,而不是寻觅序列相关结构的最优表达,因而不具有普适性。
我国旅行资源丰富,是世界上最受欢迎的旅行热门区域之一。近年来,跟着我国入境旅行不断升温,对我国入境旅行需求猜测的研讨开端遭到世界学术范畴的注重。Huang从批改旅行需求散布方式的视点动身,提出根据Skew-t散布的ARMA模型,并与传统的根据正态散布的ARMA模型进行比较,然后查验批改散布方式对我国入境旅行需求猜测的重要性[17]。Yang等则从数据源下手,评论搜索引擎数据对我国入境旅行需求猜测的奉献[18]。国内对入境旅行需求猜测的研讨很多,触及的猜测模型包括各种线性的时刻序列模型[19-20],也包括神经网络等非线性的猜测办法等[21-22]。这些研讨从不同的视点提出优化入境旅行需求猜测模型的可行计划,可是仍未触及对序列相关结构的评论。
据此,本研讨从寻觅相关结构最优表达的思路动身,运用Bernstein Copula函数描绘我国入境旅行需求的序列相关结构,并在此根底上查验序列相关结构的精确描写对入境旅行需求猜测的影响,以期为旅行猜测建模拓荒一个新的视点。
1 序列相关结构与Copula 函数
1.1 序列相关结构
正如导言所述,广泛运用于旅行需求猜测的时刻序列模型首要依靠于旅行需求的序列相关联系,因而,旅行需求的当期变量和滞后变量之间的相关性剖析关于旅行需求猜测建模来说就显得尤为重要。可是,现有研讨一般只注重相关程度的剖析,而将相关方式约束为线性结构或许某种特定的非线性结构,疏忽了对序列相关结构的最优表达进行评论。
关于两个随机变量来说,线性相联系数常被用来剖析它们之间的相关性;可是事实上,只有当联合散布遵守椭圆散布(如高斯散布或t散布)时,联合散布才干由这两个变量间的线性相联系数和边际散布仅有断定[23]。但事实上,随机变量之间的联合散布不必定是椭圆散布;而即便是联合散布遵守椭圆散布的两个随机变量,它们之间的相关性也不必定就是线性结构[24]。这必定论关于旅行需求的序列相关性来说也是适用的。界说随机变量Yt为旅行需求t时刻的当期变量,随机变量Yt-i即为旅行需求的滞后i期的变量。Yt和Yt-i之间的的联合散布不必定遵守椭圆散布;即便在椭圆联合散布的状况下,线性结构也不必定适用于描绘Yt和Yt-i之间的相关性。
1.2 Copula技能对序列相关性的描写
Copula函数实际上是衔接随机变量边际散布的累积散布函数。Copula技能能够协助寻觅或辨认旅行需求序列相关的相关方式,断定序列相关结构,并进一步服务于旅行需求的猜测。现在,Copula技能在剖析不同随机变量相关结构上的高度灵敏性已经在金融、精算和经济学等研讨范畴中得到广泛评论[25-30]。关于任何方式的相关联系,无论是线性仍是非线性的,对称的仍是尾部相关的,都能够找到一个适合的Copula函数来描绘[31]。不仅仅不同随机变量的相关结构剖析,时刻序列中的序列相关结构剖析也相同得益于Copula技能[32-35]。任何方式的序列相关联系也相同能够找到一个适合的Copula函数来描绘。此外,Copula技能的灵敏性还体现在它不约束边际散布的挑选。边际散布是一个相关于联合散布的概念,一般就是指随机变量的累积散布。传统的时刻序列模型中会要求旅行需求遵守特定的累积散布方式(一般是正态散布),而Copula技能对旅行需求的累积散布方式则没有约束。因而,当序列相关结构不是线性结构或旅行需求不满意特定累积散布假定时,能够挑选不同的Copula函数描绘相关方式和挑选不同的累积散布作为边緣散布。从这个意义上讲,Copula是一个更为一般的结构,既有的线性时刻序列模型都能够放到Copula的结构之下而成为一种特例。endprint
由式(3)可看出,Copula技能将旅行需求的序列相关程度和相关结构有机地结合在一起,不只能够经过相联系数来衡量序列相关程度,还能够经过详细的Copula函数方式来描绘序列相关结构,然后更全面地描写旅行需求的序列相关联系。
1.3 Bernstein Copula函数
Copula函数的品种繁复,能够描绘五花八门的相关结构。但在实际操作中,最常用的Copula函数首要是两大类:参数估量的Copula函数和非参数估量的Copula函数。其间,参数估量的Copula函数虽然方式相对简略,可是单个函数所能描写的相关结构有必定的约束,并且有的函数只能描写二维(即双变量)的相关联系,无法处理多维(即三变量或以上)的相关联系。比较较而言,非参数估量的Copula函数,如Bernstein Copula函数,对相关结构的描写更为自在。
Bernstein Copula函数是由Sancetta和Satchell于2004年提出。该函数以Bernstein多项式为根底,能够灵敏地描写多维相关联系[39]。一方面,Bernstein多项式的微分效果是闭型解,在运用Bernstein Copula函数处理多维相关联系时,这一特征会带来运算上的便利性。另一方面,任何一种Copula函数都能够近似地用Bernstein Copula函数来表达。事实上,Bernstein Copula函数能够描绘恣意的相关结构。Sancetta和Satchell的研讨中展现的是对多变量相关结构的描绘,本研讨中将Bernstein Copula函数的运用加以拓宽,用来描绘单变量时刻序列的序列相关结构,并在此根底上构建我国入境旅行需求猜测模型。
Bernstein Copula函数的根本原理,是将一个k+1维(k≥1)的单位向量空间区分为mt×mt-1×…×mt-k等份,并构成(mt+1)×(mt-1+1)×…×(mt-k+1)个交点(包括原点),这些交点即为描绘序列相关联系的要害。假定咱们描绘的是二维(k=1)的相关结构,且mt=mt-1=2,单位向量空间如图1所示。点A是由ut-1及其对应的ut构成的点。Bernstein Copula函数则是用点A到各交点的间隔作为权重,用以描绘ut和ut-1的相关结构。多维相关结构则是在二维状况下加以拓宽。
2 实证剖析
本研讨在R言语环境下对我国入境旅行需求的序列相关结构进行剖析,并在此根底上运用Bernstein Copula函数完成对旅行需求的猜测。详细完成如下:首要要保证旅行需求序列是平稳序列,并查验其马尔科夫性;其次断定旅行需求序列的累积散布,并核算累计密度;再次,运用断定的累积密度调查旅行需求当期变量与滞后变量累积密度的散点图,剖析序列相关结构;最终,运用断定的累积密度和Bernstein Copula函数,构建条件累积散布函数,经过二分法查找算法来完成对旅行需求的猜测。
2.1 数据来历及数据剖析
本研讨以我国入境旅行人数作为旅行需求的署理变量进行实证剖析,评论旅行需求的序列相关结构特征及Bernstein Copula技能对旅行需求猜测的奉献。研讨人员收集了从1998年1月到2015年12月我国入境旅行的游客总量的月度数据(数据来历于我国国家旅行局)。其间,以1998年1月到2012年12月的数据作为练习数据集,进行序列相关的结构剖析,并断定猜测模型的构成。2013年1月到2015年12月的数据则作为验证数据集,进行样本外猜测,以查验模型的猜测精度。
实证研讨的第一步是查验用于剖析和建模的时刻序列是否是平稳序列。本研讨一起参阅ADF(Augmented Dickey-Fuller)单位根查验和KPSS(Kwaitkowski-Philips-Schmidt-Shin)平稳性查验。其间,ADF单位根查验的原假定是序列具有单位根。假如ADF核算值高于临界值,则回绝原假定,以为时刻序列是平稳序列,没有单位根。而KPSS平稳性查验的原假定则是序列是平稳的。假如KPSS核算值低于临界值,则承受原假定,以为序列是平稳的。一起运用单位根查验和平稳性查验的办法称之为断定性数据剖析(confirmatory data analysis),得到的效果稳健性较佳[40]。如表1所示,ADF的效果显现原序列存在单位根,KPSS的效果也显现原序列非平稳。而经过一阶差分后的序列则一起经过ADF和KPSS查验。可是,因为本研讨中所用数据是月度数据,一阶差分后的数据依然存在时节性单位根。如图2a中的自相关图所示,经过一次差分(一阶差分)后的序列依然体现出很强的时节性特征,自相关图每12个滞后期就会呈现一次显着动摇。时节性差分能够消除序列的时节性动摇。可是如表1所示,时节性差分序列的KPSS核算值大于临界值,序列非平稳。因而,本文中对旅行需求序列进行两次差分(一阶差分和时节性差分)。两次差分之后,旅行需求序列到达平稳(表1),且时节性动摇消除(图2b)。因而,后续评论针对的是经过二次差分的我国入境旅行需求时刻序列。
关于平稳的时刻序列,还需保证其归于马尔科夫进程,才干运用Copula函数进行序列相关剖析。Deco和Schürmann的论说中指出,一个时刻序列的p阶自回归模型,或AR(p)模型,假如其残差是白噪声,那么这一时刻序列能够看作是p阶马尔科夫进程[41]。月度数据因为具有时节性改变特征,当期变量往往会遭到12期滞后变量的影响。因而关于月度数据,应优先调查AR(12)模型,查验序列是否是12阶马尔科夫进程。而在时刻序列剖析中,越接近当期变量的滞后期变量对当期变量的影响一般更为显着。因而关于我国入境旅行需求时刻序列,从一个只含有1阶和12阶自回归项的AR(12)模型开端查验其马尔科夫性质。该AR(12)模型的自相关偏相关图和Q查验效果如图3所示。Q查验值在所有12个滞后期上均不顯著,阐明AR(12)模型的残差可看作是白噪声。因而能够以为我国入境旅行需求时刻序列是一个12阶的马尔科夫进程。endprint
在断定序列满意平稳性要求和马尔科夫进程今后,则能够运用卡方查验(Chi-square test)断定旅行需求序列的累积散布。卡方查验的原假定是受测数据遵守给定的散布方式。假如查验效果的卡方值大于对应的临界值,那么就会回绝原假定,以为数据是不遵守给定的散布方式的。关于本研讨中给定的样本量,卡方查验在0.05显着水平上对应的临界值是15.510。一般状况下,假定旅行需求序列是正态散布的。关于本研讨的序列来说,正态散布对应的卡方值为9.738,小于临界值。因而以为该序列遵守正态散布,能够用正态散布函数求解累积密度。值得注意的是,当时刻序列不遵守正态散布的时分,也能够运用卡方查验来查验其他散布方式,并用断定的散布函数求解时刻序列的累积密度。
断定了旅行需求序列的累积散布今后,能够经过调查旅行需求当期变量与滞后变量累积密度的散点图来取得对序列相关结构的直观知道。如图4所示,我国入境旅行需求的序列相关结构应该是一个非对称的结构,散点在图形中部以及右尾部(图形右上方)显得相对会集。而假如序列相关结构是线性的话,那么散点图应该呈现出对称的椭球体结构。散点在图形中的散布也应该较为均匀,不会呈现显着的中部或许尾部会集。因而,能够判别我国入境旅行需求序列相关结构的非线性性要更为杰出。
相关于线性模型来说,Bernstein Copula能描绘这种非线性结构,然后进步需求猜测的精确性。详细的做法是要将图4的三维空间区分为m×m×m等份,运用练习数据集的数据来估量经历Copula,再由已知的ut-1和ut-12来猜测ut。根据Sancetta和Satchell的经历,取m=10对图4进行空间区分[42]。Bernstein Copula办法下的经历Copula能够随三维空间中的散点散布状况不同而不同,因而具有很强的灵敏性,能够描写任何方式的相关结构。
2.2 猜测效果剖析
2.2.1 其他猜测模型与差错点评办法
为了查验Copula技術对进步旅行猜测精确度的奉献,本研讨将Bernstein Copula模型的猜测效果与不同的基准模型的猜测效果进行比较,看哪个模型的猜测差错较小。这些基准模型包括:时节性Na?ve(S-Na?ve)模型,只含1阶和12阶自回归项的AR(12)模型,以及包括1阶自回归项和1阶时节性自回归项的SARIMS(1,0,0)×(1,0,0)12模型。其间,时节性Na?ve模型是旅行猜测研讨中最根本的基准模型,首要是运用上一年同期观测值作为当时的猜测值。AR(12)模型与Bernstein Copula具有相同的自回归项,只不过前者估量的是线性结构序列相关,而后者估量的既能够是线性,又能够是非线性结构的序列相关。因而,两者的比较更能凸显出序列相关结构的挑选对旅行猜测的影响。此外,因为本研讨中运用的是月度数据,还运用SARIMA(1,0,0)×(1,0,0)12进行旅行需求猜测。AR模型和SARIMA模型的估量和猜测均运用Eviews来完成。
为了比较Bernstein Copula模型与其他猜测模型的好坏,本研讨中引进均方根差错(RMSE)和均匀肯定百分比差错(MAPE)作为衡量猜测功能的根据。关于猜测差错的核算,是将差分数据转换成非差分数据后进行。为了便于比较各种猜测模型关于短期猜测和长时刻猜测的猜测才干,本研讨选用递归窗体(recursive window)的猜测办法,并比较1、2、3、6、12、18、24期(月)向前猜测的RMSE和MAPE。其间,超越12月以上的猜测期在旅行职业中被视为是长时刻猜测[12]。
2.2.2 猜测效果比较
表2中给出不同办法的猜测差错状况。总体上看,Bernstein Copula模型的猜测才干比其他3种猜测办法要好。详细来说,经过比较表2中各种模型猜测的RMSE和MAPE能够得到以下定论:(1)关于1期到24期向前猜测,Bernstein Copula模型的MAPE比S-Na?ve模型、AR模型和SARIMA模型要小,阐明Bernstein Copula模型猜测会发生较小的相对差错;(2)虽然1期向前猜测中SARIMA模型的RMSE最小,可是Bernstein Copula模型在其他期向前猜测上的RMSE都是最小,阐明Bernstein Copula模型猜测的肯定差错也比其他3种基准模型要小;(3)单单比较Bernstein Copula和AR模型的猜测效果,能够发现除了1期向前猜测之外,Bernstein Copula模型的RMSE和MAPE显着比AR模型小,而在1期向前猜测中Bernstein Copula模型的MAPE也较小,阐明运用Bernstein Copula模型描绘非线性序列相关结构的确会进步猜测水平。
3 定论
旅行需求序列相关结构是旅行猜测研讨中长时刻被忽视的一个问题。因为缺少一种有用剖析旅行需求序列相关结构的东西,传统的猜测模型只能假定线性的或许是某种特定的非线性结构,使得模型的猜测精确度遭到影响。本研讨中将Bernstein Copula技能引进旅行学研讨中,为旅行需求建模供给一个能够灵敏描绘序列相关结构的东西,并为旅行需求猜测建模提出了一个新的考虑方向。
实证研讨的效果表明,考虑了序列相关结构的Bernstein Copula模型不管是在长时刻猜测仍是在短期猜测上体现都比基准模型要好。与AR模型比较,Bernstein Copula模型仅仅批改了对序列相关结构的描绘,并没有添加额定的变量信息或滞后期信息,即可带来猜测精度的进步。此外,与SARIMA(1,0,0)×(1,0,0)12模型比较,Bernstein Copula模型的猜测效果也要更优。值得一提的是,SARIMA模型中的1阶时节性自回归项实际上近似于12阶和13阶自回归项的线性组合,也就是说,SARIMA模型中具有额定的滞后期信息,可是猜测精度仍不如Bernstein Copula模型,这就更阐明晰序列相关结构的重要性。endprint
Copula技能在剖析旅行序列相关结构上具有优越性,而Bernstein Copula更是在处理高阶序列相关联系上具有较大的灵敏性。这种技能能够和其他技能结合起来,构建更为合理的模型。例如能够和ARIMA模型或许SARIMA模型相结合,在Bernstein Copula函数中参加移动均匀项或许时节变量。这也是未来的研讨中值得注重的方向。
参阅文献(References)
[1] Song H, Witt S F. Forecasting international tourist flows to Macau[J]. Tourism Management, 2006, 27 (2): 214-224.
[2] Witt S F, Song H. Forecasting future tourism flows[A] // Medlik S, Lockwood A . Tourism and Hospitality in the 21st Century [C]. Oxford: Butterworth-Heinemann, 2000:106-118.
[3] Li G, Song H, Witt S F. Recent developments in econometric modeling and forecasting[J]. Journal of Travel Research, 2005, 44: 82-99.
[4] Liao Zhixue, Ge Peng, Ren Peiyu, et al. Research on prediction of tourists quantity in Jiuzhai Valley based on AB@G integration model[J]. Tourism Science, 2013, 28 (4): 88-93. [廖治学, 戈鹏, 任佩瑜,等. 根据AB@G集成模型的九寨溝景区游客量猜测研讨[J]. 旅行学刊, 2013, 28 (4): 88-93.]
[5] Peng B, Song H, Crouch G I. A meta-analysis of international tourism demand forecasting and implications for practice[J]. Tourism Management, 2014, 45: 181-193.
[6] Box G E, Jenkins G M. Time Series Analysis: Forecasting and Control[M]. San Francisco: Holden-Day, 1970.
[7] Goh C, Law R. Modeling and forecasting tourism demand for arrivals with stochastic nonstationary seasonality and intervention[J]. Tourism Management, 2002, 23 (5): 499-510.
[8] Kim J H, Ngo T. Modelling and forecasting monthly airline passenger flows among three major Australian cities[J]. Tourism Economics, 2001, 7 (4): 397-412.
[9] Lim C, McAleer M. 2000. A seasonal analysis of Asian tourist arrivals to Australia[J]. Applied Economics, 2000, 32 (4): 499-509.
[10] Liang Y H. Forecasting models for Taiwanese tourism demand after allowance for Mainland China tourists visiting Taiwan[J]. Computers & Industrial Engineering, 2014, 74: 111-119.
[11] Chu F L. A fractionally integrated autoregressive moving average approach to forecasting tourism demand[J]. Tourism Management, 2008, 29 (1): 79-88.
[12] Hassani H, Webster A, Silva E S, et al. Forecasting US tourist arrivals using optimal singular spectrum analysis[J]. Tourism Management, 2015, 46: 322-335.
[13] Yu G, Schwartz Z, Humphreys B R. Data patterns and the accuracy of annual tourism demand forecasts[J]. Tourism Analysis, 2007, 12 (1-1):15-26.
[14] Tu J V. Advantages and disadvantages of using artificial neural networks versus logistic regression for predicting medical outcomes[J]. Journal of Clinical Epidemiology, 1996, 49 (11): 1225-1231.endprint
[15] Chan Y M. Forecasting tourism: A sine wave time series regression approach[J]. Journal of Travel Research, 1993, 32 (2): 58-60.
[16] Wu Q, Law R, Xu X. A sparse Gaussian process regression model for tourism demand forecasting in Hong Kong[J]. Expert Systems with Applications, 2012, 39 (5): 4769-4774.
[17] Huang Y L. Forecasting the demand for tourism in China by applying the Skew-t Distribution Model[J]. Chinese Economy, 2013, 46(4): 49-62.
[18] Yang X, Pan B, Evans J A, et al. Forecasting Chinese tourist volume with search engine data[J]. Tourism Management, 2015, 46: 386-397.
[19] Shang Lin, Qin Weiliang. Forecasting exchange earning of Chinese inbound tourism using ARIMA-EGARCH Model[J]. Ststistical Education, 2007, (4): 46-48. [尚林, 秦偉良. 根据ARIMA和EGARCH模型的我国入境旅行收汇猜测剖析[J]. 核算教育, 2007, (4): 46-48.]
[20] Weng Gangmin, Zheng Zhuye, Liu Yang. An empirical study on inbound tourism demand forecast based on ARFIMA Model[J]. Commercial Research, 2009, (6): 1-4. [翁钢民, 郑竹叶, 刘洋. 我国入境旅行猜测: 根据ARFIMA模型的研讨[J]. 商业研讨, 2009, (6): 1-4.]
[21] Deng Zutao, Lu Yuqi. The application of BP Neural Network in forecasting Chinas inbound tourist population[J]. Tourism Science, 2006, 20(4): 49-53. [邓祖涛, 陆玉麒. BP神经网络在我国入境旅行人数猜测中的运用[J]. 旅行科学, 2006, 20(4): 49-53.]
[22] Zhang Chen, Zhang Jie. Neural Network ensemble for Chinese inbound tourism demand prediction[J]. Scientia Geographica Sinica, 2011, (10): 1208-1212. [张郴, 张捷. 我国入境旅行需求猜测的神经网络集成模型研讨[J]. 地舆科学, 2011, (10): 1208-1212.]
[23] Patton A J. Modeling Time-varying Exchange Rate Dependence Using the Conditional Copula[R]. San Diego: Department of Economics, University of California, 2001.
[24] Embrechts P, Lindskog F, McNeil A. Modelling Dependence with Copulas[R]. Zurich: Rapport technique, Département de mathématiques, Institut Fédéral de Technologie de Zurich, 2001.
[25] Balakrishnan N, Lai C D. Continuous Bivariate Distributions[M]. Springer: Science & Business Media, 2009.
[26] Embrechts P, McNeil A, Straumann D. Correlation and dependence in risk management: Properties and pitfalls[J]. Risk Management: Value at Risk and Beyond, 2002: 176-223.
[27] Frees E W, Valdez E A. Understanding relationships using copulas[J]. North American Actuarial Journal, 1998, 2 (1): 1-25.
[28] Joe H. Multivariate Models and Multivariate Dependence Concepts[M]. London: CRC Press, 1997.
[29] Klugman S A, Panjer H H, Willmot G E. Loss Models: From Data to Decisions[M]. New Jersey: John Wiley & Sons, 2012.endprint
[30] Nelsen R B. An Introduction to Copulas[M]. New York: Springer Science & Business Media, 2007.
[31] de Melo Mendes B V, Aíube C. Copula based models for serial dependence[J]. International Journal of Managerial Finance, 2011, 7 (1): 68-82.
[32] Beare B K. Copulas and temporal dependence[J]. Econometrica, 2010, 78 (1): 395-410.
[33] Chen X, Fan Y. Estimation of copula-based semiparametric time series models[J]. Journal of Econometrics, 2006, 130 (2): 307-335.
[34] Ibragimov R. Copula-based characterizations for higher order Markov processes[J]. Econometric Theory, 2009, 25 (3): 819-846.
[35] Smith M, Min A, Almeida C, et al. Modeling longitudinal data using a pair-copula decomposition of serial dependence[J]. Journal of the American Statistical Association, 2010, 105 (492): 1467-1479.
[36] Sklar A. Fonctions de Répartition ? N Dimensions Et Leurs Marges [M]. Paris: Université Paris 8, 1959.
[37] Chen X, Fan Y. Estimation of copula-based semiparametric time series models[J]. Journal of Econometrics, 2006, 130(2): 307-335.
[38] Ibragimov R. Copula-based characterizations for higher order Markov processes[J]. Econometric Theory, 2009, 25(3): 819-846.
[39] Sancetta A, Satchell S. The Bernstein copula and its applications to modeling and approximations of multivariate distributions[J]. Econometric Theory, 2004, 20(3): 535-562.
[40] Brooks C. Introductory Econometrics for Finance[M]. Cambridge: Cambridge University Press, 2014.
[41] Deco G, Schürmann B. Information Dynamics: Foundations and Applications[M]. New York: Springer Science & Business Media, 2012.
[42] Sancetta A, Satchell S E. Bernstein Approximations to the Copula Function and Portfolio Optimization [EB/OL]. https://www.repository. cam.ac.uk/handle/1810/284,2016-09-22.
Abstract: Tourism demand modeling and forecasting has long been an attractive topic in the tourism demand literature, because of its great impact on decision making of governments and tourism related businesses. Many researchers have highlighted the necessity of tourism demand forecasting. China is one of the most popular destinations in the world, and the rapid development of the tourism sector in China has caused tourism demand forecasting to become increasingly essential. This paper proposes the Bernstein Copula model as an alternative to analyze serial dependence structure of China inbound tourism demand for forecasting. Forecast endeavors should be underpinned by knowledge of serial dependence structure; however discussion of the latter has been insufficient in the tourism forecasting literature. In the traditional tourism demand forecasting model, the serial dependence structure is always been predetermined, either as the linear structure or some certain nonlinear structure. This restriction can reduce the forecasting accuracy of the traditional models. The proposed Bernstein Copula model is thus appealing, as it possesses some advanced properties which make it applicable and appealing for high dimensional associations. First of all, Bernstein polynomials are closed under differentiation, which leads to the computational convenience of the Bernstein copula for high dimensional associations. Second, any copula can be approximately represented by certain Bernstein copula with only simple restriction on the coefficients. Actually, the Bernstein copula allows for arbitrary dependence structure between dependent variables and covariates. Thirdly, different from many traditional models, the Bernstein Copula does not require the tourism demand variable follow any given distribution (usually normal distribution). Our empirical results indicate that China inbound tourism demand follow normal distribution, but its serial dependence structure is probably nonlinear. To illustrate the benefit of using the Bernstein Copula model for tourism demand forecasting, we compare the forecasting performance of the Bernstein Copula model with those of several benchmarks, including the Seasonal Naive (S-Naive) model, the Autoregressive (AR) model, as well as the Seasonal Autoregressive Integrated Moving Average (SARIMA) model. The compare results show that the Bernstein Copula model produces smaller root mean square error and mean absolute percentage error than the three benchmarks, which indicates that the Bernstein Copula performs better in forecasting China inbound tourism demand. The contribution of this study is not introducing the Bernstein Copula model as the universally best approach for forecasting tourist demand. Instead, it contributes to the existing tourism demand and forecasting research by highlighting the importance of serial dependence structure to tourism demand forecasting. The consideration of the serial dependence structure generalizes the existing time series model into a broaden setting, in which both linear and nonlinear serial associations can be addressed and the restricted distribution assumption of the demand series involved can be released.
Keywords: serial dependence structure; Bernstein Copula function; Chinese inbound tourism; tourism demand forecasting
[責任修改:宋志伟;职责校正:周小芳]endprint