《数据、模型与决策支持》课程是什么?《数据、模型与决策》属于数量性质的课程,侧重于讲解数据资料的搜集、描述、分析
和解释,
以及管理决策方法和技术方面的知识。
管理决策分为两类,
一类是理性决策一类是
行为决策。
数据分析与决策模型中,
不论是以不确定性为特征的统计决策,
还是以确定性为
特征的管理科学优化决策,
和以策略互动为特征的博弈决策,
都可以把它们归结为理性决策
范畴。
既然是理性决策,
必然会要求建立某种决策准则,
然后在既定的准则下通过度量来选
择决策方案。
这一过程一方面要对研究的问题进行结构化处理,
另一方面也需要有相应的数
据资料。前者是为了能够建立决策模型,
后者则是帮助实现计算。
有鉴于此,数据与模型在
决策分析中的重要意义不言而喻。
数据与模型除了共同服务于决策分析以外,
两者之间也存
在密切的关系。
从应用的角度,
统计方法比较强调实证性做法,统计分析与决策中,没有大
量的、
客观准确的数据资料,
统计决策分析只能停留在纯理论的状态,
无法形成具体的分析
结论。
管理运筹优化和博弈决策分析中,
虽然不像统计分析那样,
需要拥有充足的数据,但
是必要的不可控因素比如模型中的有关参数,
其数值资料就必须事先给以确定。
尽管现在的
企业一般都积累了大量的可供开发利用的数据资料,
不过由于这样那样的原因,
数据资料本
身总会存在不系统、不充分、不完备的情况。因此,对于背景数据必须经过科学的编辑、处
理、汇总和提炼,然后才能用于决策分析。对此,模型起着重要的转化作用,通过模型化处
理,
不仅能对数据的价值结构进行改造,
而且还能对决策赋以深层次的分析。
如同生产过程
一样,数据资料好比“原料”
,模型就如“机器”
,把数据原料投入模型机器,经过模型机器
的加工处理,最后就能得到输出结果“产品”
,即管理分析和决策方案。
运用数据资料通过模型从定量角度开展决策分析,目前已得到了十分广泛的发展和应
用,在社会经济管理领域的各个方面都发挥着重要的作用。以企业管理为例,生产运营、库
存管理、质量控制、资源利用、厂址选定、产品开发与设计、设备维护与更新、人员安排、
项目规划、组织设置、信息处理、投资组合、融资方案、市场营销、商情预测、竞争性定价
等方面,
都会使用到数据资料和模型工具,
在社会管理和公共服务领域,
数据处理和模型分
析同样具有重要价值,比如:学校、商店、消防、医院、银行等服务网点的布局、交通道路
规划、
服务窗口优化设置等。正因为如此,在我国的高等教育体系中,
倡导把定量化方法纳
入到经济管理类专业的教育体系中。
管理是人类社会永恒的主题,
无论什么时候,
也无论在
什么样的发展阶段,
管理总是必要的、必不可少的。随着社会经济的不断发展,人们遇到的
管理问题可能更加复杂,
只有懂得科学的管理方法,
才有可能制定出合理的规划和行动方案。
把定量化分析方法引进经济管理类专业的教学体系,体现了社会对人才培养的高标准要求。
企业和社会的未来管理人员,
应该努力地学习管理科学方法,
并在未来的实际工作中自觉地
运用科学方法解决管理问题。
通过课堂的理论学习,以及老师理论结合实际的案例,给别人讲解。
白话一下什么是决策树模型决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。
决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。
分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
Z06-0329水晶吊灯
旅游决策模型是什么?分别是结构模型,仿真模型,定性模型和引力模型。
旅游需求预测
1、旅游需求的时空分布集中性
旅游需求的一个显著特点是随时间变化而变化,另一个特点是每一个旅游目的地都有自己相对稳定的客源地。从数量上来研究和度量旅游需求随时间的变化和客源地的空间分布变化,对旅游规划和经营决策有重要的帮助。
1>旅游需求的时间分布集中性
季节性(时间)强度指数:旅游需求的时间分布集中性是由旅游的季节性所引起的,可以用季节性(时间)强度指数来定量分析。
式中:R为旅游需求的时间分布强度指数
xi为各月游客量占全年的比重
R值越接近于零,旅游需求时间分配越均匀;R值越大,时间变动越大,旅游淡旺季差异越大。R值受到旅游需求变化和所选时段长短特征的影响,所以它适用于不同年份(时段)的比较和不同旅游地(设施)的比较。
高峰指数:用来度量游客某一时期相对于其他时期利用旅游设施游览某旅游地的趋势。计算公式为
式中: Pn为高峰指数;
V1为最繁忙时期的游客数;
Vn为在第n个时期内的游客数
n为参照时段(1=最繁忙时期)
Pn的数值大小不仅取决于高峰程度,还依赖于游客总量和所选定的时段。因此,该指数的一个主要用途是用于对旅游地进行比较或用于考察某一设施随时间变化而出现的高峰趋势。当游客量在所有时期都相同时,Pn=0;当游客量集中在某些时期时,Pn值会增大。n的值,即用于与最繁忙时期作比较的那一时期,在很大程度上是选择的结果,选择工作依靠现有资料,研究目的和研究经验。
2>旅游需求的空间分布集中性
旅游需求的空间分布结构主要指旅游者的地理来源和强度,其集中性可以用地理集中指数来定量分析。其公式为:
式中: G为客源地的地理集中指数
Xi为第个客源地的游客数量
T为旅游地接待游客总量
n为客源地总数
游客来源越少越集中,G值越接近100;G值越小,则客源地越多越分散。对于一个旅游地,客源地越分散,旅游经营越趋于稳定。
2、趋势外推模型
趋势外推模型是以已经发生的事件资料为预测基础,依据一系列的的历史数据资料来推测未来的可能形势。无论哪一种类型的趋势外推模型都有一个共同的假设:历史数据的趋势将在未来一段时间内持续下去。趋势外推模型主要有回归模型和时间序列模型两类。
1>回归分析方法
一元线性回归模型是最简单的也是最常用的趋势外推数学模型,常用于以年为时间单位的旅游需求量的变化。形式为:
y=a+bx
式中:y为因变量,x为自变量,a为常数项;b为y对x的回归系数。关于本模型的具体运算,请参看《常用统计方法》的相关内容。
保继刚(1989)年通过研究建立了北京香山公园游客量的一元线性回归方程:
y=-35047.0088+17.859x
r=0.9828
式中: y为年游客量(万人)
x为年份
r为相关系数
知道1979年到1985年的游客数量分别为291.58,318.75,326.97,361.92,359.73,381.63,405.09;可以运用模型得到1986年的预测值为420.97。(具体参见《旅游地理学》)
2>时间序列模型
时间序列模型主要用于解决对波动性旅游需求的预测,如对受到季节性影响显著的目的地的需求量预测就可以用这一模型。
在时间序列分析中,预测过程首先要通过过去需求量的历史资料求出统计形式的拟合曲线,然后向前延伸这条拟合曲线,用以估计未来时段的需求量。这种拟合曲线通常可以分为三类:水平需求曲线、趋势需求曲线和季节性需求曲线。
常用的水平时间序列模型有一次滑动平均模型和一次指数平滑模型。
常用的趋势需求模型有线形趋势模型,包括线形回归模型、二次滑动平均模型等;非线形趋势模型,如二次回归模型、三次指数平滑模型。
常用的季节性需求模型包括季节性水平模型、季节性交乘趋势模型等。
3、引力模型
引力模型是在城市和区域经济研究中应用最为广泛的模型。20世纪后期,国外一些学者率先将这一模型应用到旅游研究中来,用于游客预测、旅游吸引力确定以及旅游规划等方面。
1966年,Crampon L J首次将引力模型用于旅游研究,他所建立的引力模型也是其他研究者应用的基本引力模型:
式中: Tij为客源地i与目的地j之间旅行次数的某种量度
Pi为客源地i人口规模、财富或旅行倾向的某种量度
Aj为目的地j吸引力或容量的某种量度
Dij为客源地i与目的地j之间的距离
G,b为经验参数
客源地人口可以为某个城市等特定区域的人口数量,或将来要进行旅行的人数,它可以是几个变量的组合。
目的地吸引力可以是美学吸引力、资源容量、旅游地知名度等几个变量的组合。
距离一般是指感知距离,可以用实际距离或旅行时间来进行表示。
其后,有一些学者针对该模型中存在的一些不足,主要针对距离变量又提出了一些修正模型,在此不一一介绍。
4、特尔菲法
特尔菲法是预测模型中最著名,也是最具有争议性的方法之一。当历史资料或数据不够充分,或者当模型中需要相当程度的主观判断时,就需要用特尔菲法预测事件的未来趋势。目前,特尔菲法在软科学领域中得到了广泛的应用,也取得了不少令人满意的效果。决定特尔菲法成功与否的关键在于问卷的设计和选择专家的合格程度。
用特尔菲法预测一般包括以下工作步骤:
1>确定预测的问题,选择征询的专家组
专家组的专家选择要全面,要有代表性,以保证预测的全面和综合。专家人数由问题的复杂程度来决定。一般为40~50人。
2>制定和分发第一轮问卷
问卷由专家完全独立填写,也即专家间没有任何形式的交流,避免互相干扰与影响。第一轮的问卷包括两个部分内容:一是向专家概括介绍所进行的研究项目,另一是请专家鉴定未来可能出现的事件发生的概率、可能发生的时间。
3>第一轮问卷回收,整理结果
过程包括中位数计算,指出两个中间四分数的范围,即中位数两旁包含50%总预测数的范围。
4>第二轮问卷
将第一轮问卷的统计总结附在第二轮问卷上寄给第一轮征询的专家组,各个专家自己第一轮的答卷也复印附上作为参考。询问每一个专家在看完小组的平均结果之后是否希望改变自己的预测。如果专家的预测值不在两个中间四分数之内,而他又不愿意改变自己的原始预测,则要请专家给出理由。
5>回收第二轮的问卷并整理结果
包括新的预测结果以及部分专家不同意第一轮问卷结果的意见。
6>第三轮问卷
将第二轮问卷的结果和意见综合进第三轮,问卷的说明与第二轮相似。主要的不同之处是加上了部分专家不同预测结果的意见。
第三轮问卷的结果出来之后,要决定是否需要作第四轮的问卷调查以获得进一步的预测。如果两次调查后绝大多数预测已经在中位数附近,就没有必要再作下一轮的调查。