Rust性能分析之测试及火焰图,附(lru,lfu,arc)测试

news/2024/9/22 9:52:59

性能测试,在编写代码后,单元测试及性能测试是重要的验收点,好的性能测试可以让我们提前发现程序中存在的问题。

测试用例

在Rust中,测试通常有两部分,一部分是文档测试,一部分是模块测试。
通常我们在函数定义的开始可以看到以///三斜杠开头的就是文档注释发布的时候会将自动生成到docs.rs中,其中以///包含的代码片断会就判断为文档测试,这样子就可以把功能与测试完美的结合在一起。
以下是Lru的例子:

/// LRU 全称是Least Recently Used,即最近最久未使用的意思
/// 一个 LRU 缓存普通级的实现, 接口参照Hashmap保持一致
/// 设置容量之后将最大保持该容量大小的数据
/// 后进的数据将会淘汰最久没有被访问的数据
///
/// # Examples
///
/// ```
/// use algorithm::LruCache;
/// fn main() {
///     let mut lru = LruCache::new(3);
///     lru.insert("now", "ok");
///     lru.insert("hello", "algorithm");
///     lru.insert("this", "lru");
///     lru.insert("auth", "tickbh");
///     assert!(lru.len() == 3);
///     assert_eq!(lru.get("hello"), Some(&"algorithm"));
///     assert_eq!(lru.get("this"), Some(&"lru"));
///     assert_eq!(lru.get("now"), None);
/// }
/// ```
pub struct LruCache<K, V, S> {/// 存储数据结构map: HashMap<KeyRef<K>, NonNull<LruEntry<K, V>>, S>,/// 缓存的总容量cap: usize,/// 双向列表的头head: *mut LruEntry<K, V>,/// 双向列表的尾tail: *mut LruEntry<K, V>,
}

模块测试,在lru.rs文件底下会定义:#[cfg(test)] mod tests,这个将变成模块化测试

#[cfg(test)]
mod tests {use std::collections::hash_map::RandomState;use super::LruCache;#[test]fn test_insert() {let mut m = LruCache::new(2);assert_eq!(m.len(), 0);m.insert(1, 2);assert_eq!(m.len(), 1);m.insert(2, 4);assert_eq!(m.len(), 2);m.insert(3, 6);assert_eq!(m.len(), 2);assert_eq!(m.get(&1), None);assert_eq!(*m.get(&2).unwrap(), 4);assert_eq!(*m.get(&3).unwrap(), 6);}
}

我们将在执行cargo test的时候将会自动运行这些函数进行测试:可以显示如下内容:

   Compiling algorithm v0.1.5 (D:\my\algorithm)Finished test [unoptimized + debuginfo] target(s) in 1.95sRunning unittests src\lib.rs (target\debug\deps\algorithm-3ecde5aa4c430e91.exe)running 142 tests
test arr::circular_buffer::tests::test_iter ... ok
...test result: ok. 142 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.16s    Doc-tests algorithmrunning 147 teststest src\cache\lruk.rs - cache::lruk::LruKCache (line 65) ... ok
...test result: ok. 147 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 11.03s   

如果出错则会指出错误内容。

bench测试

在Rust中的bench可以测出每次迭代的耗时,但bench模块需要启用#![feature(test)],即无法在stable版本的进行性能测试。
我们需要安装nightly版本,那么我们运行

rustup install nightly

如果需要在国内加速可以设置

$ENV:RUSTUP_DIST_SERVER='https://mirrors.ustc.edu.cn/rust-static' 
$ENV:RUSTUP_UPDATE_ROOT='https://mirrors.ustc.edu.cn/rust-static/rustup'

安装完之后我们可以用临时启用nightly版本进行运行,当前我们建立了benches/lru.rs文件
以下是bench的部分内容

#![feature(test)]extern crate test;use algorithm::{ArcCache, LfuCache, LruCache, LruKCache};
use test::Bencher;static BENCH_SIZE: usize = 10000;macro_rules! do_test_bench {($cache: expr) => {for i in 0..BENCH_SIZE {$cache.insert(i, i);$cache.get(&i);}};
}#[bench]
fn calc_lru(b: &mut Bencher) {b.iter(|| {let mut lru = LruCache::new(BENCH_SIZE / 2);do_test_bench!(lru);})
}

我们可以运行来进行bench测试

rustup run nightly cargo bench --bench lru

测试结果可以看出执行时间的变化

running 4 tests
test calc_arc  ... bench:   4,361,427.70 ns/iter (+/- 983,661.07)
test calc_lfu  ... bench:   3,170,039.17 ns/iter (+/- 571,925.64)
test calc_lru  ... bench:   1,306,854.55 ns/iter (+/- 198,070.97)
test calc_lruk ... bench:   1,282,446.16 ns/iter (+/- 226,388.14)

但是我们无法看出命中率这些参数,单纯时间的消耗并缓存结构并不公平。

测试命中率

我们将从速度和命中率两个维度来衡量,但是数据集目前不是很优,看不到Lfu及Arc的大优势。
完整代码放置在:https://github.com/tickbh/algorithm-rs/blob/master/examples/bench_lru.rs

顺序的数据集

插入数据的时候就快速获取该数据

名字 耗时 命中率
LruCache 4121 100.00%
LruKCache 3787 100.00%
LfuCache 12671 100.00%
ArcCache 13953 100.00%

前部分数据相对高频

插入数据的时候就获取之前插入的随机数据

名字 耗时 命中率
LruCache 3311 77.27%
LruKCache 4040 77.47%
LfuCache 10268 93.41%
ArcCache 10907 89.92%

相对来说,在非高频的场景中,Lfu需要维护频次的列表信息,耗时会Lru高很多,但是高频的访问场景中命中率的提高相对于cpu的消耗是可以接受的。

此处编写测试的时候不想大量的重复代码,且我们的实例并没有trait化,此处我们用的是运用宏处理来指的处理:

macro_rules! do_test_bench {($name: expr, $cache: expr, $num: expr, $evict: expr, $data: expr) => {let mut cost = vec![];let now = Instant::now();let mut all = 0;let mut hit = 0;for v in $data {if v.1 == 0 {all += 1;if $cache.get(&v.0).is_some() {hit += 1;}} else {$cache.insert(v.0, v.1);}}cost.push(now.elapsed().as_micros());println!("|{}|{}|{:.2}%|", $name, cost.iter().map(|v| v.to_string()).collect::<Vec<_>>().join("\t"), hit as f64 * 100.0 / all as f64);};
}

后续调用均可调用该宏进行处理:

fn do_bench(num: usize) {let evict = num * 2;let mut lru = LruCache::<usize, usize, RandomState>::new(num);let mut lruk = LruKCache::<usize, usize, RandomState>::new(num);let mut lfu = LfuCache::<usize, usize, RandomState>::new(num);let mut arc = ArcCache::<usize, usize, RandomState>::new(num / 2);println!("|名字|耗时|命中率|");println!("|---|---|---|");// let data = build_freq_data(evict);let data = build_high_freq_data(evict);// let data = build_order_data(evict);do_test_bench!("LruCache", lru, num, evict, &data);do_test_bench!("LruKCache", lruk, num, evict, &data);do_test_bench!("LfuCache", lfu, num, evict, &data);do_test_bench!("ArcCache", arc, num, evict, &data);
}

进行数据优化

编写代码尽量的不要过早优化,先实现完整功能,然后再根据火焰图耗时占比来进行热点函数优化。所以此时我们需要实现火焰图的显示:

安装火焰图https://github.com/flamegraph-rs/flamegraph

cargo install flamegraph 

在这里我使用的wsl启用的debian系统,安装perf

sudo apt install -y linux-perf

然后安装完之后就可以执行:

cargo flamegraph --example bench_lru

如果出现以下提前错误,则证明没有正确的连接perf版本,可以拷贝一个或者建一个软连接

/usr/bin/perf: line 13: exec: perf_5.15.133: not found
E: linux-perf-5.15.133 is not installed.

那么用如下的解决方案:

cp /usr/bin/perf_5.10 /usr/bin/perf_5.15.133

如果是macOs需要安装dtrace,如果未安装直接进行安装即可

brew install dtrace

此处需注意,macOs权限控制,需要用sudo权限。

然后运行完之后就可以得到一个flamegraph.svg的火焰图就可以查看耗时的程序了。

总结

好的测试用例及性能测试是对一个库的稳定及优秀的重要标准,尽量的覆盖全的单元测试,能及早的发现bug,使程序更稳定。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hjln.cn/news/46767.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

FreeRTOS简单内核实现7 阻塞链表

增加阻塞链表和溢出阻塞链表,完善 RTOS 内核调度流程0、思考与回答 0.1、思考一 如何处理进入阻塞状态的任务? 为了让 RTOS 支持多优先级,我们创建了多个就绪链表(数组形式),用每一个就绪链表表示一个优先级,对于阻塞状态的任务显然要从就绪链表中移除,但是阻塞状态的任…

危急值上报及闭环管理全解析

什么是危急值制度? 危急值制度是指对提示患者处于生命危急状态的检查、检验结果建立复核、报告、记录等管理机制,以保障患者安全的制度。 管理体系(组织体系+制度建设+管理要素+宣教培训) 针对管理体系中的组织体系、制度建设、管理要素、宣教培训多为线下的制度、流程建立。…

手术分级管理制度

01手术分级管理体系 ● 医院手术分级管理实行院、科两级负责制 ● 医院医疗技术临床应用管理委员会总体负责全院手术分级管理工作,日常工作由医务办公室负责组织、协调,主要职责包括: (一)制定手术分级管理制度规范,定期检查提出改进要求 (二)审定手术分级管理目录,定…

总体估计中的相关公式 | 高一使用

总体估计中的相关公式和相关性质前言 相关公式 【人教 2019 A 版 \(P_{215}\) 练习 2】 数据 \(x_1\),\(x_2\), \(\cdots\), \(x_n\) 的方差为 \(s_x^2\), 数据 \(y_1\), \(y_2\), \(\cdots\), \(y_n\) 的方差为 \(s_y^2\), \(a\)、 \(b\) 为常数. 证明: (1) . 如果 \(…

LangChain结合LLM做私有化文档搜索

我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对于新的知识或者私有化的数据LLM一般无法作答,此时LLM会出现“幻觉”。针对“幻觉”问题,一般的解决方案是采用RAG做检索增强。我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对…

深入分析四层/七层网关

1 简要介绍 随着云计算、大数据和物联网技术的迅猛发展,网络通信的复杂性和需求日益增加。在这种背景下,网关技术作为网络通信中的重要组成部分,扮演着关键的角色。 作为连接不同网络或协议的桥梁,四层网关和七层网关是两种常见且重要的类型。本文将对这两种网关进行深入分…

dotnet C# 使用 using 关键字释放 IDisposable 的结构体是否会装箱

在 C# 里面的 using 关键字可以非常方便调用 IDisposable 接口的 Dispose 方法,进行一些资源的释放或实现有趣的逻辑的执行配合 using 关键字使用的类型需要继承 IDisposable 接口,根据基础的 C# 知识,大家都知道 using 关键字其实会自动在 IL 层拆开为在 finally 里面调用 …

VSCode修改扩展和用户文件夹目录位置(Windows)

原文链接:https://blog.csdn.net/weixin_53510183/article/details/126906182 文章目录`VSCode`便携版(不推荐)缺点`VSCode`安装版(推荐)终端使用`code .` 命令打开项目 问题解决办法终极解决办法!(强烈推荐)vscode的扩展和用户数据都是默认在C盘下的 extensions:C:\Users\.vs…