ch4 信息搜寻与最优信息决策

ch4 信息搜寻与最优信息决策

news/2024/10/7 4:35:32

重点

贝叶斯信念
信息搜寻预期收益（大题）

课程内容

了解信息决策的基本原理，重点掌握信息搜寻理论的分析框架及其在具体实践中的应用。
§ （1）信息与一般决策过程
§ （2）不确定性与信息离散分布
§ （3）信息搜索模型
§ （4）最优信息决策

信息与决策

nothing important

客观信息与主观信息（信念）
完全信息与不完全信息
公共信息与私人信息
决策树与条件期望

最优信息决策理论

理论模型

行动空间（Action）：\(\Omega = \{ 1,2,\dots, x \}\)

状态空间（State）：是隐藏未知的，相当于上一章的不确定性\(\mathcal{S} = \{ 1,2,\dots, s \}\)

信念：代表状态出现的概率，\(\pi : \mathcal{S} \to \mathbb{R}\)

在上述描述一下，决策准则即采取行动使得期望收益/效用最大化

\[\arg \max_x \mathbb{E} [u(s;x)] = \sum_{s=1}^s u(s;x) \cdot p(s) \]

在获取消息之后，会更新信念，然后再次进行决策

\[\arg \max_x \mathbb{E}_{s|m} [u(s;x)] = \sum_{s=1}^s u(s;x) \cdot p(s|m) \]

\[p(s|m) = \frac{p(m|s)p(s)}{\sum_{s=1}^s p(m|s)p(s)} \]

上述过程叫做贝叶斯信念修正

贝叶斯信念修正的隐含命题：
- 先验概率的大小决定了“消息”的价值空间，在主观确定性事件中，信息价值为零；
- 消息越丰富，消息对主观价值的修正越大，后验分布产生“变异”的可能性越大；
- 小概率消息，或称奇异消息（消息初始概率 qm 较小的消息）更能造成信念修正，符合主观上人们的猎奇心态和细节的关注。

信息价值

即信念更新之后的期望收益的差值

\[\omega_m = \mathbb{E}_{s|m} [u(s;x)] - \mathbb{E} [u(s;x)] \]

信息搜索模型

价格离散

定义：同质商品在市场中价格不同的现象

价格离散的原因
- 价格在一定市场中的波动，难以观测到准确的市场价格，存在讨价还价的空间
  - 信息不对称
  - 信息老化
- 市场经营和销售条件差别
- 商品异质性
价格离散的影响
- 获得价格离散程度和波动的知识成为有利可图，出现一批从事信息搜集和分析的服务机构，信息服务机构应运而生
价格离散的经济意义
- 市场信息的不完备性，对市场了解的人成为市场代理人或信息服务提供商；
- 信息搜集行为
- 诱发和刺激了信息搜索行动

信息搜寻理论

经济学家认为，信息是人们做出决策的基础。信息是有代价的，获得信息要付出金钱与时间，这就是寻找信息的成本，称为信息搜寻成本。
信息也会带来收益，有更充分的信息可以做出更正确的决策，这种决策会使经济活动的收益更大，这就是信息搜寻收益

信息搜寻预期收益

随着搜寻次数的增加，期望收益会逐渐增加，但是增加的幅度会逐渐减小，最终会收敛到一个值

而搜寻成本是一个递增的函数，因此最优的搜寻次数是使得搜寻收益减去搜寻成本最大的次数

例题看最后

工作搜索模型

pass

信息搜寻与决策案例分析

pass

例题

贝叶斯信念更新

核心点在于如何计算后验概率\(p(s | m)\)

\[p(s | m ) = \frac{p(s,m)}{p(m)} = \frac{p(m|s)p(s)}{\sum_{s=1}^s p(m|s)p(s)} \]

其中第一个矩阵是指\(p(m|s)\)的概率，名字叫数据似然

第二个矩阵是指\(p(s,m)\)

第三个矩阵是指\(p(s | m)\)

依据式子带入即可算出最终的后验概率，即可计算下一题的信息价值

信息价值

\[\omega_m = \mathbb{E}_{s|m} [u(s;x)] - \mathbb{E} [u(s;x)] \]

即获取信息之后的信息收益与之前的信息差异的差值

信息搜寻预期收益

\[EU = [1- (\frac{1}{2})^n] \cdot 5 - 0.5n \]

收益最大的时候即为，搜寻的边际收益=搜寻的边际成本时

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hjln.cn/news/42869.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈，一经查实，立即删除！

相关文章

scoop-软件包管理器

scoop-软件包管理器

scoop scoop官网 https://scoop.sh/ 项目github地址 https://github.com/ScoopInstaller/Scoop 安装scoop Set-ExecutionPolicy RemoteSigned 修改脚本执行策略 Invoke-RestMethod -Uri https://get.scoop.sh | Invoke-Expression 安装scoop安装软件gitscoop及buck…

阅读更多...

计划任务执行批处理脚本，运行记录显示“上次运行结果（0x1）”

计划任务执行批处理脚本，运行记录显示“上次运行结果（0x1）”

计划任务执行cmd脚本时，执行不成功，并且“上次运行结果（0x1）”。解决方案：任务启动的【操作】窗口，添加【起始于】属性，属性值是bat所在文件夹路径。

阅读更多...

Attacking organizations with big scopes: from zero to hero -- by Hussein Daher

Attacking organizations with big scopes: from zero to hero -- by Hussein Daher

SRC意识：1.模仿与抄袭某个知识点，某个writeup，某个主题，某个赏猎报告等；2.对现网中所有实际SRC目标进行遍历；3.枯草且乏味的持之以恒的坚持前面的第1步与第2步。错误的SRC意识：学了OWASP TOP 10和BP官网靶场的所有漏洞主题之后依旧在SRC方面没有表现出应该具备的自信心…

阅读更多...

利用SpringBeanUtil 来获取 IOC 容器中的bean

利用SpringBeanUtil 来获取 IOC 容器中的bean

有时候在代码中，不希望使用自动注入，而是手动获取Spring容器以及Spring容器中的某个对象 1、首先写一个class实现ApplicationContextAware#import org.springframework.beans.BeansException; import org.springframework.context.ApplicationContext; import org.springfram…

阅读更多...

pytest的数据驱动和参数传递

pytest的数据驱动和参数传递

4.1参数化介绍常见使用场景：简单注册功能，也就是输入用户名、输入密码、单击注册，而测试数据会有很多个，可以通过测试用例设计技术组织出很多测试数据，例如用户名都是字母，密码也都是字母，或者都是数字，也可是它们的组合，或是边界值长度的测试数据等。这时可以通过参…

阅读更多...

在使用@Transactional注解声明事务时，会有以下四种情况：哪几种会失效呢？

在使用@Transactional注解声明事务时，会有以下四种情况：哪几种会失效呢？

不同情形在不同类中，事务方法A调用非事务方法B，事务具有传播性，事务生效；在不同类中，非事务方法A调用事务方法B，事务生效；在同一个类中，事务方法A调用非事务方法B，事务生效；在同一个类中，非事务方法A调用事务方法B，事务失效，这是由于使用Spring AOP代理造成的，…

阅读更多...

斜率优化DP简单总结“土地购买”题解

斜率优化DP简单总结“土地购买”题解

今天刚刷完了斜率优化DP，简单从头回顾一下。 \[首先，能写出DP方程应该是最重要的，毕竟斜率只是用来优化的 \]那么一个DP方程能用斜率优化，具备一种形式： \[f[i]+s1[i]+A[i]*B[j]=f[j]+s2[j] \]其中，f[i]表示所求值，（s1[i]、A[i]）与（s2[j]、B[j]）分别表示只与i或j有关…

阅读更多...

记一次编译GCC的经历

记一次编译GCC的经历

背景因为有在Linux环境编译C++程序的需求，故我于近日在电脑上安装了WSL。鉴于APT（Ubuntu的包管理器）提供的GCC版本较老（确切来说，APT会根据Ubuntu版本来下载并安装某个版本的GCC，不一定为最新，例如对Ubuntu 22.04而言，从APT获取的最新版本GCC为11.2.0），我便尝试自己…

阅读更多...

推荐文章

最新文章