ch4 信息搜寻与最优信息决策

news/2024/10/7 4:35:32

重点

  • 贝叶斯信念
  • 信息搜寻预期收益(大题)

课程内容

了解信息决策的基本原理,重点掌握信息搜寻理论的分析框架及其在具体实践中的应用。
§ (1)信息与一般决策过程
§ (2)不确定性与信息离散分布
§ (3)信息搜索模型
§ (4)最优信息决策

信息与决策

nothing important

  • 客观信息与主观信息(信念)
  • 完全信息与不完全信息
  • 公共信息与私人信息
  • 决策树与条件期望

最优信息决策理论

理论模型

行动空间(Action):\(\Omega = \{ 1,2,\dots, x \}\)

状态空间(State):是隐藏未知的,相当于上一章的不确定性\(\mathcal{S} = \{ 1,2,\dots, s \}\)

信念:代表状态出现的概率,\(\pi : \mathcal{S} \to \mathbb{R}\)

在上述描述一下,决策准则即采取行动使得期望收益/效用最大化

\[\arg \max_x \mathbb{E} [u(s;x)] = \sum_{s=1}^s u(s;x) \cdot p(s) \]

img

在获取消息之后,会更新信念,然后再次进行决策

\[\arg \max_x \mathbb{E}_{s|m} [u(s;x)] = \sum_{s=1}^s u(s;x) \cdot p(s|m) \]

\[p(s|m) = \frac{p(m|s)p(s)}{\sum_{s=1}^s p(m|s)p(s)} \]

上述过程叫做贝叶斯信念修正

  • 贝叶斯信念修正的隐含命题:
    • 先验概率的大小决定了“消息”的价值空间,在主观确定性事件中,信息价值为零;
    • 消息越丰富,消息对主观价值的修正越大,后验分布产生“变异”的可能性越大;
    • 小概率消息,或称奇异消息(消息初始概率 qm 较小的消息)更能造成信念修正,符合主观上人们的猎奇心态和细节的关注。

信息价值

即信念更新之后的期望收益的差值

\[\omega_m = \mathbb{E}_{s|m} [u(s;x)] - \mathbb{E} [u(s;x)] \]

信息搜索模型

价格离散

定义:同质商品在市场中价格不同的现象

  • 价格离散的原因

    • 价格在一定市场中的波动,难以观测到准确的市场价格,存在讨价还价的空间
      • 信息不对称
      • 信息老化
    • 市场经营和销售条件差别
    • 商品异质性
  • 价格离散的影响

    • 获得价格离散程度和波动的知识成为有利可图,出现一批从事信息搜集和分析的服务机构,信息服务机构应运而生
  • 价格离散的经济意义

    • 市场信息的不完备性,对市场了解的人成为市场代理人或信息服务提供商;
    • 信息搜集行为
    • 诱发和刺激了信息搜索行动

信息搜寻理论

经济学家认为,信息是人们做出决策的基础。信息是有代价的,获得信息要付出金钱与时间,这就是寻找信息的成本,称为信息搜寻成本。
信息也会带来收益,有更充分的信息可以做出更正确的决策,这种决策会使经济活动的收益更大,这就是信息搜寻收益

信息搜寻预期收益

随着搜寻次数的增加,期望收益会逐渐增加,但是增加的幅度会逐渐减小,最终会收敛到一个值

而搜寻成本是一个递增的函数,因此最优的搜寻次数是使得搜寻收益减去搜寻成本最大的次数

例题看最后

工作搜索模型

pass

信息搜寻与决策案例分析

pass

例题

贝叶斯信念更新

img

img

核心点在于如何计算后验概率\(p(s | m)\)

\[p(s | m ) = \frac{p(s,m)}{p(m)} = \frac{p(m|s)p(s)}{\sum_{s=1}^s p(m|s)p(s)} \]

其中第一个矩阵是指\(p(m|s)\)的概率,名字叫数据似然

第二个矩阵是指\(p(s,m)\)

第三个矩阵是指\(p(s | m)\)

依据式子带入即可算出最终的后验概率,即可计算下一题的信息价值

信息价值

img

\[\omega_m = \mathbb{E}_{s|m} [u(s;x)] - \mathbb{E} [u(s;x)] \]

即获取信息之后的信息收益与之前的信息差异的差值

信息搜寻预期收益

img

img

\[EU = [1- (\frac{1}{2})^n] \cdot 5 - 0.5n \]

收益最大的时候即为,搜寻的边际收益=搜寻的边际成本时

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hjln.cn/news/42869.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

scoop-软件包管理器

scoop scoop官网 https://scoop.sh/ 项目github地址 https://github.com/ScoopInstaller/Scoop 安装scoop Set-ExecutionPolicy RemoteSigned 修改脚本执行策略 Invoke-RestMethod -Uri https://get.scoop.sh | Invoke-Expression 安装scoop安装软件gitscoop及buck…

计划任务执行批处理脚本,运行记录显示“上次运行结果(0x1)”

计划任务执行cmd脚本时,执行不成功,并且“上次运行结果(0x1)”。 解决方案: 任务启动的【操作】窗口,添加【起始于】属性,属性值是bat所在文件夹路径。

Attacking organizations with big scopes: from zero to hero -- by Hussein Daher

SRC意识:1.模仿与抄袭某个知识点,某个writeup,某个主题,某个赏猎报告等;2.对现网中所有实际SRC目标进行遍历;3.枯草且乏味的持之以恒的坚持前面的第1步与第2步。 错误的SRC意识:学了OWASP TOP 10和BP官网靶场的所有漏洞主题之后依旧在SRC方面没有表现出应该具备的自信心…

利用SpringBeanUtil 来获取 IOC 容器中的bean

有时候在代码中,不希望使用自动注入,而是手动获取Spring容器以及Spring容器中的某个对象 1、首先写一个class实现ApplicationContextAware#import org.springframework.beans.BeansException; import org.springframework.context.ApplicationContext; import org.springfram…

pytest的数据驱动和参数传递

4.1参数化介绍 常见使用场景:简单注册功能,也就是输入用户名、输入密码、单击注册,而测试数据会有很多个,可以通过测试用例设计技术组织出很多测试数据,例如用户名都是字母,密码也都是字母,或者都是数字,也可是它们的组合,或是边界值长度的测试数据等。 这时可以通过参…

在使用@Transactional注解声明事务时,会有以下四种情况:哪几种会失效呢 ?

不同情形在不同类中,事务方法A调用非事务方法B,事务具有传播性,事务生效; 在不同类中,非事务方法A调用事务方法B,事务生效; 在同一个类中,事务方法A调用非事务方法B,事务生效; 在同一个类中,非事务方法A调用事务方法B,事务失效,这是由于使用Spring AOP代理造成的,…

斜率优化DP简单总结“土地购买”题解

今天刚刷完了斜率优化DP,简单从头回顾一下。 \[首先,能写出DP方程应该是最重要的,毕竟斜率只是用来优化的 \]那么一个DP方程能用斜率优化,具备一种形式: \[f[i]+s1[i]+A[i]*B[j]=f[j]+s2[j] \]其中,f[i]表示所求值,(s1[i]、A[i])与(s2[j]、B[j])分别表示只与i或j有关…

记一次编译GCC的经历

背景 因为有在Linux环境编译C++程序的需求,故我于近日在电脑上安装了WSL。鉴于APT(Ubuntu的包管理器)提供的GCC版本较老(确切来说,APT会根据Ubuntu版本来下载并安装某个版本的GCC,不一定为最新,例如对Ubuntu 22.04而言,从APT获取的最新版本GCC为11.2.0),我便尝试自己…