【哈希表】2024D-内存冷热标记
【哈希表】2024D-内存冷热标记
题目描述与示例
本题练习地址:https://www.algomooc.com/problem/P2814
题目描述
现代计算机系统中通常存在多级的存储设备,针对海量workload的优化的一种思路是将热点内存页优先放到快速存储层级,这就需要对内存页进行冷热标记。
一种典型的方案是基于内存页的访问频次进行标记,如果统计窗口内访问次数大于等于设定阈值,则认为是热内存页,否则是冷内存页。
对于统计窗口内跟踪到的访存序列和阈值,现在需要实现基于频次的冷热标记。内存页使用页框号作为标识。
输入描述
第一行为输入为N
,表示访存序列的记录条数,0 < N < 10000
。
第二行为访存序列,空格间隔的N
个内存页框号,页框号范围0-65535
,同一页框号可能重复出现,出现的次数即为对应页框号的频次。
第三行为热内存页的频次阈值T
,正整数,范围1 < T < 10000
输出描述
第一行输出标记为热内存的内存页个数,如果没有被标记为热内存的,则输出0
。
如果第一行>0
,则接下来按照访问频次降序输出内存页框号,一行一个,频次一样的页框号,页框号小的排前面。
示例
输入
10
1 2 1 2 1 2 1 2 1 2
5
输出
2
1
2
说明
内存页1
和内存页2
均被访问了5
次,达到了阈值5
,因此热内存页有2
个。内存页1
和内存页2
的访问频次相等,页框号小的排前面。
解题思路
需要记录每一个编号出现的频次,显然应该使用哈希表计数器来进行统计,得到cnt
。
统计完之后,还需需根据每一个页面的出现频次和阈值筛去所有的冷内存页,得到新的哈希表cnt_filter
。即
cnt = Counter(nums)
cnt_filter = {k: v for k, v in cnt.items() if v >= t}
获得cnt_filter
中的所有key
储存在变量ans
中,即为所有的热内存页。
然后对ans
进行排序,先按照出现频次逆序排序,再按照编号大小升序排序。即
ans = list(k for k in cnt_filter.keys())
ans.sort(key = lambda k: (-cnt_filter[k], k))
代码
Python
# 题目:【哈希表】2023C-内存冷热标记
# 分值:100
# 作者:许老师-闭着眼睛学数理化
# 算法:哈希表/排序
# 代码看不懂的地方,请直接在群上提问
from collections import Counter
# 输入数组长度
n = int(input())
# 输入内存页框号数组
nums = list(map(int, input().split()))
# 输入阈值t
t = int(input())
# 计算nums中每一个编号的出现次数
cnt = Counter(nums)
# 将cnt中所有v小于t的k过滤掉,cnt_filter中均为出现次数大于等于阈值t的k
cnt_filter = {k: v for k, v in cnt.items() if v >= t}
# cnt_filter的长度即为热内存页的个数
print(len(cnt_filter))
# 获得cnt_filter中的所有编号,构成一个数组
ans = list(k for k in cnt_filter.keys())
# 对ans进行排序,先按照出现频次逆序排序,再按照编号大小升序排序
ans.sort(key = lambda k: (-cnt_filter[k], k))
# 对ans排序完毕后,逐行输出num
for num in ans:
print(num)
Java
import java.util.*;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int n = scanner.nextInt();
int[] nums = new int[n];
for (int i = 0; i < n; i++) {
nums[i] = scanner.nextInt();
}
int t = scanner.nextInt();
Map<Integer, Integer> cnt = new HashMap<>();
for (int num : nums) {
cnt.put(num, cnt.getOrDefault(num, 0) + 1);
}
Map<Integer, Integer> cntFilter = new HashMap<>();
for (Map.Entry<Integer, Integer> entry : cnt.entrySet()) {
if (entry.getValue() >= t) {
cntFilter.put(entry.getKey(), entry.getValue());
}
}
System.out.println(cntFilter.size());
List<Integer> ans = new ArrayList<>(cntFilter.keySet());
ans.sort((a, b) -> {
int freqCompare = cntFilter.get(b).compareTo(cntFilter.get(a));
if (freqCompare == 0) {
return a.compareTo(b);
}
return freqCompare;
});
for (int num : ans) {
System.out.println(num);
}
}
}
C++
#include <iostream>
#include <vector>
#include <unordered_map>
#include <algorithm>
using namespace std;
int main() {
int n;
cin >> n;
vector<int> nums(n);
for (int i = 0; i < n; i++) {
cin >> nums[i];
}
int t;
cin >> t;
unordered_map<int, int> cnt;
for (int num : nums) {
cnt[num]++;
}
unordered_map<int, int> cntFilter;
for (auto& kv : cnt) {
if (kv.second >= t) {
cntFilter[kv.first] = kv.second;
}
}
cout << cntFilter.size() << endl;
vector<int> ans;
for (auto& kv : cntFilter) {
ans.push_back(kv.first);
}
sort(ans.begin(), ans.end(), [&](int a, int b) {
if (cntFilter[a] == cntFilter[b]) {
return a < b;
}
return cntFilter[a] > cntFilter[b];
});
for (int num : ans) {
cout << num << endl;
}
return 0;
}
时空复杂度
时间复杂度:O(NlogN)
。排序所需时间复杂度。
空间复杂度:O(N)
。哈希表所占空间