假期氛围 – 预算内规划完美旅行
想象一下你正在计划一个梦想假期。也许是毕业后的毕业旅行。你可能会花几天时间研究航班、酒店和租车,以找到最优惠的价格。现在,想想你花多少时间来规划你的财务未来——可能没有那么多,对吧?然而,这两者都需要战略思维、预算和分析。在本课中,我们将展示如何理解数据可以帮助你在这两个领域做出明智的决策。

假期规划 – 5个城市
你正在计划一次假期——但需要控制成本。你正在探索5个选项,并查找4天3夜旅行的航班和酒店费用。
| 城市 | 航班 | 酒店 |
|---|---|---|
| 芝加哥 | $350 | $350 |
| 纽约 | $275 | $450 |
| 蒙特利尔 | $400 | $250 |
| 温哥华 | $375 | $400 |
| 迈阿密 | $450 | $500 |
你会对这些选项中的任何一个感到满意——所以你想根据总价格来做出选择。
解释变量与响应变量
到目前为止,你所做的研究给了你两个解释变量(也称为自变量)。然而,你真正想要找到的是一个响应变量(也称为因变量)。响应变量是解释变量的结果,或者你也可以将其视为解释变量解释响应变量的结果。
在这种情况下,响应变量将是预期的总旅行费用。到目前为止,你认为你需要担心的只是航班和酒店,所以你可以简单地将航班和酒店相加,以获得总费用作为输出。
| 城市 | 航班 | 酒店 | 总费用 |
|---|---|---|---|
| 芝加哥 | $ 350 | $ 350 | $ 700 |
| 纽约 | $ 275 | $ 450 | $ 725 |
| 蒙特利尔 | $ 400 | $ 250 | $ 650 |
| 温哥华 | $ 375 | $ 400 | $ 775 |
| 迈阿密 | $ 450 | $ 500 | $ 950 |
掌握了这些信息后,看来蒙特利尔将是最便宜的选择——那么是时候开始预订航班和打包行李了吗?

潜在变量
在你预订旅行之前,你向你的旅行阿姨确认一下,以确保在选择目的地之前没有忘记任何事情。她快速看了一眼,说你缺少了食物预算,这可能会对旅行产生重大影响。
当然——你也认为食物很重要!在4天内,你可能每天会花大约75美元在食物上(所以4天总共300美元),所以你可以将其加入总预算中。
| 城市 | 航班 | 酒店 | 食物 | 总费用 |
|---|---|---|---|---|
| 芝加哥 | $ 350 | $ 350 | $ 300 | $ 1,000 |
| 纽约 | $ 275 | $ 450 | $ 300 | $ 1,025 |
| 蒙特利尔 | $ 400 | $ 250 | $ 300 | $ 950 |
| 温哥华 | $ 375 | $ 400 | $ 300 | $ 1,075 |
| 迈阿密 | $ 450 | $ 500 | $ 300 | $ 1,250 |
在每一行添加300美元会使总成本更高,但这并不会改变决定——蒙特利尔仍然是最便宜的。你再次和你的姑姑核对,她指出了你食品预算的一个大问题:蒙特利尔和温哥华都在加拿大,而加拿大的食品价格比美国贵得多。即使在控制了两国之间的汇率时,加拿大的食品价格也可能高出30%(在撰写本文时)。
这意味着“在加拿大”是你模型中的一个潜在变量——“食品”可能是计算总成本时的一个解释变量,但你旅行的城市是否在加拿大则是计算食品预期成本时的一个解释变量!一旦你在模型中加入“食品成本差异”,“在加拿大”就不再是潜在的——你把它拖到了光明之下。

| 城市 | 航班 | 酒店 | 食品乘数 | 食品总计 | 总成本 |
|---|---|---|---|---|---|
| 芝加哥 | $ 350 | $ 350 | 100% | $ 300 | $ 1,000 |
| 纽约 | $ 275 | $ 450 | 100% | $ 300 | $ 1,025 |
| 蒙特利尔 | $ 400 | $ 250 | 130% | $ 390 | $ 1,040 |
| 温哥华 | $ 375 | $ 400 | 130% | $ 390 | $ 1,165 |
| 迈阿密 | $ 450 | $ 500 | 100% | $ 300 | $ 1,250 |
考虑到这一点,蒙特利尔不再那么便宜——看起来你将飞往芝加哥!

深入了解食品成本
在和你的姑姑一起决定你想去哪里后,你仍然对食品成本感到紧张,并真正确定你的食品预算。
为了帮助估算你去芝加哥旅行的食品预算,你探索了你最喜欢的食品外卖应用。你搜索了当地餐馆,寻找你在逗留期间可能想点的菜肴。经过一个小时的浏览,你整理出了一份20个诱人选择的清单,这个数量远远超过你在实际旅行中可能点的数量。

| 食品 | 价格 |
|---|---|
| 饺子 | $ 9 |
| 面包牛排三明治 | $ 13 |
| 意大利子 | $ 9 |
| 彩虹冰淇淋 | $ 5 |
| 甜甜圈 | $ 7 |
| 维苏威鸡 | $ 17 |
| 意大利牛肉三明治 | $ 10 |
| 炸鸡 | $ 16 |
| 鲁本三明治 | $ 8 |
| 特色塔可 | $ 14 |
| 芝加哥热狗 | $ 6 |
| 意大利宽面条阿尔弗雷多 | $ 22 |
| 牛排晚餐 | $ 50 |
| 特大号深盘比萨 | $ 53 |
| 墨西哥卷饼 | $ 9 |
| 芝加哥风味爆米花 | $ 17 |
| 熏虾 | $ 9 |
| 美味汉堡 | $ 22 |
| 麻婆豆腐 | $ 20 |
| 酒吧风格比萨 | $ 33 |
在您的旅行中,您可能无法尝试所有这些餐厅,并且一旦您抵达芝加哥,您可能会发现其他美味的选择。然而,这个列表为您在访问期间估算食品开支提供了一个有价值的起点。
使用频率分布可视化数据
为了确定您感兴趣的餐点的整体费用,您可以创建一个图表,将不同价格点的可选项数量进行分类。

您挠挠头——不确定您在这里学到了什么。最常见的价格是$9,但大多数价格只出现一次。
为了获得更有用的图表,您需要使用直方图。直方图将数据点分组为相等大小的区间或“箱”。这在视觉上表示每个区间内数据点的频率,提供了整体数据分布的更清晰的图像。

这个直方图将您所有的餐点选项按$8的增量分组——因此每个箱的大小覆盖$8的范围。您可以看到,在便宜的范围内有很多选择,在$37到$45之间的愿望清单上没有任何东西,然后在愿望清单的高端有几个非常昂贵的项目。
这帮助您看到的是,您想购买的大多数项目将会相当便宜——现在我们可以计划实际的预算了!
集中趋势的度量
您计划每天早上花$8买咖啡和糕点作为早餐,因此现在您需要知道午餐和晚餐的花费。您可以通过三种方式来规划这个费用:均值、中位数和众数。

均值
均值是所有价格的平均值。要计算均值,我们可以将愿望清单上的所有项目相加,然后除以总数。在西格玛符号中,这可以表示为:

西格玛符号(Σ)表示将集合中的每个项目相加,从底部的数字到顶部的数字。至于具体要加什么,它表示每个项目的B(值)(” i“表示每个项目)。”n“表示集合中的总项目数——所以这意味着:
- 对于列表中的每个项目(i),获取其值
- 并将所有值相加
- 因为i = 1在底部,并且是累加到n在顶部,这意味着从列表的第一个到最后一个项目
- 然后乘以1 / 项目总数
将所有项目相加并除以20,我们发现愿望清单中项目的平均成本为$17.45。这意味着您可以为早餐预算$8,午餐和晚餐各预算$17.45,因此您需要计划每天$42.90,或者整个4天的旅行预算为$171.60。不错!
中位数
计算餐点的代表性成本的另一种方法是找到中位数或“中间数字”。我们已经在直方图中看到,高端有一些非常昂贵的选项,可能会扭曲您的平均值。要找到中位数,请将所有价格按顺序排列,并找到列表中的中间数字。
| 食物 | 价格 |
|---|---|
| 彩虹锥冰淇淋 | $ 5 |
| 芝加哥热狗 | $ 6 |
| 甜甜圈 | $ 7 |
| 鲁本三明治 | $ 8 |
| 波兰饺子 | $ 9 |
| 意大利子 | $ 9 |
| 墨西哥卷饼 | $ 9 |
| 烟熏虾 | $ 9 |
| 意大利牛肉三明治 | $ 10 |
| 面包屑牛排三明治 | $ 13 |
| 特色塔可 | $ 14 |
| 炸鸡 | $ 16 |
| 维苏威鸡 | $ 17 |
| 芝加哥风味爆米花 | $ 17 |
| 麻婆豆腐 | $ 20 |
| 阿尔弗雷多意大利面 | $ 22 |
| 美食汉堡 | $ 22 |
| 酒吧风格比萨 | $ 33 |
| 牛排晚餐 | $ 50 |
| 特大深盘比萨 | $ 53 |

在这种情况下,有两个中间数字——13和14。如果你在比较一个包含偶数的列表(中间有两个数字),中位数就是中间两个数字的平均值。13和14的平均值是13.5,所以这是我们的中位数——甚至比平均值便宜!
众数
你也可以尝试看看你在大多数餐点上将花费多少现金——这就是众数。有两种方式来看待众数——真实众数或统计众数。
真实众数就是在数据集中出现频率最高的值。在我们最初的列表中,众数是9,因为这个价格出现得最频繁。
然而,由于我们不会点原始列表上的确切项目,因此可以通过直方图得出更准确的众数表示。通过识别频率最高的区间(最高的条形),我们可以确定你可能会获得的餐点的最常见价格范围。
在这里,我们可以看到从$5到$13的区间是最大的区间——所以我们立刻知道我们的大多数餐点可能会非常便宜。这让我们感到好,因为我们可能不会超出预算——而且一些额外的小吃也没问题!
平均偏差
我们可以用这些数字做一个额外的练习,以帮助我们理解我们的支出可能会如何进行——平均偏差。
平均偏差是列表中每个项目与列表平均值的差异。换句话说,它帮助我们理解使用平均值是否是一个好的测量——如果平均偏差非常大,这意味着平均值在告诉我们预期方面并不好,因为样本中有太多变异。
要计算平均偏差,首先需要取样本中每个项目的绝对值,减去样本平均值。在西格玛符号中,这可以表示为:

这看起来类似于平均值的西格玛符号——实际上,带有横杠的x实际上表示这一系列数据的平均值。但在这种情况下,我们是将这一系列中每个项目的绝对值与该系列的平均值相减后相加。然后,我们将其除以该系列中的项目数量。
| 食物 | 价格 | 与平均价格的绝对差异 |
|---|---|---|
| 波兰饺子 | $ 9.00 | $ 8.45 |
| 面包屑牛排三明治 | $ 13.00 | $ 4.45 |
| 意大利子 | $ 9.00 | $ 8.45 |
| 彩虹锥冰淇淋 | $ 5.00 | $ 12.45 |
| 甜甜圈 | $ 7.00 | $ 10.45 |
| 维苏威鸡 | $ 17.00 | $ 0.45 |
| 意大利牛肉三明治 | $ 10.00 | $ 7.45 |
| 炸鸡 | $ 16.00 | $ 1.45 |
| 鲁本三明治 | $ 8.00 | $ 9.45 |
| 特色塔可 | $ 14.00 | $ 3.45 |
| 芝加哥热狗 | $ 6.00 | $ 11.45 |
| 阿尔弗雷多意大利面 | $ 22.00 | $ 4.55 |
| 牛排晚餐 | $ 50.00 | $ 32.55 |
| 特大深盘比萨 | $ 53.00 | $ 35.55 |
| 墨西哥卷饼 | $ 9.00 | $ 8.45 |
| 芝加哥风味爆米花 | $ 17.00 | $ 0.45 |
| 烟熏虾 | $ 9.00 | $ 8.45 |
| 美味汉堡 | $ 22.00 | $ 4.55 |
| 麻婆豆腐 | $ 20.00 | $ 2.55 |
| 酒吧风格比萨 | $ 33.00 | $ 15.55 |
请记住,餐点的平均(算术)价格为 $17.45。要计算每个餐点价格的偏差,我们确定其实际价格与平均价格之间的差异。
接下来,我们计算这些偏差的平均值,结果是平均偏差为 $9.53。这个值为预算提供了有价值的见解。例如,如果您更喜欢用现金支付,平均偏差可以帮助您估算合理的预期餐费范围。
由于平均餐点价格为 $17.45,平均偏差为 $9.53,我们可以预期大多数餐点的价格将在 $7.92 和 $26.98 之间。这个信息可以帮助您知道需要准备多少现金。
平均偏差的概念在规划您将如何在预算的其他领域花费钱时具有更广泛的应用。例如,它可以帮助您估算即将到来的购物旅行的可能支出范围,即使您没有精确的物品清单。
结论:利用数据做出更明智的财务决策
通过了解数据如何运作——无论是度假费用还是您的日常开支——您可以做出更明智的财务选择。集中趋势的度量和解释变量与响应变量等概念可以帮助您分析任何情况,从预算旅行到规划您的财务未来。计划真实或虚构的假期和旅行是有趣的,但为更好的财务未来做规划同样可以带来回报。