题目集总目录
学习指路博客 数据结构学习笔记<9> 散列查找
# 11 - 散列 1 电话聊天狂人 (25 分)
本题链接
一定要做。如果不知道怎么下手,可以看 “小白专场”,将详细给出 C 语言实现的方法
# 思路
散列查找,插入的时候若键值已存在改改操作就好,直接用之前的模板
# 代码
| #include <iostream> | |
| #include <cmath> | |
| #include <utility> | |
| using namespace std; | |
| const int MaxSize = 100000; | |
| typedef int Index;// 散列后的下标 | |
| // 散列单元状态类型,分别对应:有合法元素、空单元、有已删除元素 | |
| typedef enum {Legitimate, Empty, Deleted} EntryType; | |
| struct Person { | |
|     string str; | |
| int num; | |
| bool operator!=(const Person& p) { | |
| return str != p.str; | |
|     } | |
| } per; | |
| typedef Person DataType;// 数据的类型 | |
| struct HashNode { // 散列表单元类型 | |
| DataType data; // 存放元素 | |
| EntryType flag; // 单元状态 | |
| }; | |
| struct HashTable { // 散列表类型 | |
| int TableSize; // 表长 | |
| HashNode *Units; // 存放散列单元的数组 | |
| }; | |
| typedef HashTable *ptrHash; | |
| // 返回大于 N 且不超过 MaxSize 的最小素数,用于保证散列表的最大长度为素数 | |
| int NextPrime(int N) { | |
| int i, p = (N%2) ? N+2 : N+1;// 从大于 N 的下一个奇数 p 开始 | |
| while(p <= MaxSize) { | |
| for(i = (int)sqrt(p); i > 2; i--) | |
| if(!(p %i)) break;// 不是素数 | |
| if(i == 2) break;//for 正常结束,是素数 | |
| else p += 2;// 试探下一个奇数 | |
|     } | |
| return p; | |
| } | |
| // 创建一个长度大于 TableSize 的空表。(确保素数) | |
| ptrHash CreateTable(int TableSize) { | |
|     ptrHash H; | |
| int i; | |
| H = new HashTable; | |
| H->TableSize = NextPrime(TableSize); | |
| H->Units = new HashNode[H->TableSize]; | |
| for(int i = 0; i < H->TableSize; ++i) | |
| H->Units[i].flag = Empty; | |
| return H; | |
| } | |
| // 返回经散列函数计算后的下标  | |
| Index Hash(DataType Key, int TableSize) { | |
| unsigned int h = 0; // 散列函数值,初始化为 0 | |
| string str = Key.str; | |
| int len = str.length(); | |
| for(int i = 0; i < len; ++i) | |
| h = (h << 5) + str[i]; | |
| return h % TableSize; | |
| } | |
| // 查找 Key 元素,这里采用平方探测法处理冲突 | |
| Index Find(ptrHash H, DataType Key) { | |
| Index nowp, newp; | |
| int Cnum = 0;// 记录冲突次数 | |
| newp = nowp = Hash(Key, H->TableSize); | |
|     // 若该位置的单元非空且不是要找的元素时发生冲突 | |
| while(H->Units[newp].flag != Empty && H->Units[newp].data != Key) { | |
| ++Cnum;// 冲突增加一次 | |
| if(++Cnum % 2) { | |
| newp = nowp + (Cnum+1)*(Cnum+1)/4;// 增量为 + i^2,i 为 (Cnum+1)/2 | |
| if(newp >= H->TableSize) | |
| newp = newp % H->TableSize; | |
| } else { | |
| newp = nowp - Cnum*Cnum/4;// 增量为 - i^2,i 为 Cnum/2 | |
| while(newp < 0) | |
| newp += H->TableSize; | |
|         } | |
|     } | |
| return newp;// 返回位置,该位置若为一个空单元的位置则表示找不到 | |
| } | |
| // 插入 Key 到表中 | |
| bool Insert(ptrHash H, DataType Key) { | |
| Index p = Find(H, Key); | |
| if(H->Units[p].flag != Legitimate) { | |
| H->Units[p].flag = Legitimate; | |
| Key.num = 1; | |
| H->Units[p].data = Key; | |
| return true; | |
| } else {// 该键值已存在 | |
| H->Units[p].data.num++; | |
| return false; | |
|     } | |
| } | |
| int main() { | |
| int N; | |
| cin >> N; | |
| N *= 2; | |
| ptrHash H = CreateTable(N+1); | |
| for(int i = 0; i < N; ++i) { | |
| cin >> per.str; | |
| Insert(H, per); | |
|     } | |
|     string minstr; | |
| int maxnum = 0; | |
| int sum = 0; | |
| for(int i = 0; i < H->TableSize; ++i) { | |
| HashNode h = H->Units[i]; | |
| if(h.flag != Legitimate) continue; | |
| if(h.data.num > maxnum) {// 有更狂的 | |
| sum = 1; | |
| minstr = H->Units[i].data.str; | |
| maxnum = H->Units[i].data.num; | |
| } else if(h.data.num == maxnum) { | |
| sum++; | |
| if(h.data.str < minstr) minstr = h.data.str; | |
|         } | |
|     } | |
| if(sum == 1) { | |
| cout << minstr << ' ' << maxnum << endl; | |
| } else cout << minstr << ' ' << maxnum << ' ' << sum << endl; | |
| return 0; | |
| } | 
# 测试点

# 11 - 散列 2 Hashing (25 分)
本题链接
2014 年考研上机复试真题,比较直白,一定要做;
# 思路
有几个坑,1 不算素数,如果 M 为 1 的话要特判。这题因为没有删除操作直接输出下标,所以只要维护一个数组标记是否存过数。
# 代码
| #include <iostream> | |
| #include <cmath> | |
| using namespace std; | |
| const int maxn = 100005; | |
| typedef long long ll; | |
| int TableSize; | |
| bool a[maxn]; | |
| bool isPrime(int m) { | |
| if(m <= 1) return false; | |
| int k = (int)sqrt(m); | |
| for(int i = 2; i <= k; ++i) { | |
| if(m % i == 0) return false; | |
|     } | |
| return true; | |
| } | |
| int NextPrime(int m) { | |
| if(m % 2 == 0 || m == 1) | |
| m++; | |
| while(!isPrime(m)) m += 2; | |
| return m; | |
| } | |
| int Hash(int x) { | |
| return x % TableSize; | |
| } | |
| void Insert(int x) { | |
| int p = Hash(x); | |
| if(!a[p]) { // 该位置没有元素 | |
| a[p] = true; | |
| cout << p; | |
| } else { | |
| int newp = p; | |
| int i; | |
| for(i = 1; i <= TableSize; ++i) { | |
| newp = (p+i*i) % TableSize; | |
| if(!a[newp]) { | |
| a[newp] = true; | |
| cout << newp; | |
| return; | |
|             } | |
|         } | |
| cout << '-'; | |
|     } | |
| } | |
| int main() { | |
| int M, N, x; | |
| cin >> M >> N; | |
| TableSize = NextPrime(M); | |
| for(int i = 0; i < N; ++i) { | |
| cin >> x; | |
| Insert(x); | |
| if(i == N-1) cout << endl; | |
| else cout << ' '; | |
|     } | |
| return 0; | |
| } | 
# 测试点

# 11 - 散列 3 QQ 帐户的申请与登陆 (25 分)
本题链接
数据结构教材中的练习题,可以用散列,也可以用排序,有兴趣 + 有时间的,建议两种都试一下。选做;
# 题目大意
实现 QQ 新帐户申请和老帐户登陆的简化版功能。主要就是判断账号存在与否以及密码是否对应
# 思路
一开始用常规散列查找,移位法和平方探测法后两个样例一直错误,于是改成了用 STL 中 map 来替代…
# 代码
用 STL 中的 map 做的话,非常简洁
| #include <iostream> | |
| #include <string> | |
| #include <map> | |
| using namespace std; | |
| int main() { | |
| map<string, string> user;// 账号密码 | |
| int N; | |
| string o, us, pw; | |
| cin >> N; | |
| for(int i = 0; i < N; ++i) { | |
| cin >> o >> us >> pw; | |
| if(o == "L") {//Login | |
| if(user.find(us) == user.end()) | |
| cout << "ERROR: Not Exist" << endl; | |
| else if(user[us] == pw) | |
| cout << "Login: OK" << endl; | |
| else cout << "ERROR: Wrong PW" << endl; | |
| } else if(o == "N") {//New | |
| if(user.find(us) != user.end()) | |
| cout << "ERROR: Exist" << endl; | |
| else { | |
| user[us] = pw; | |
| cout << "New: OK" << endl; | |
|             } | |
|         } | |
|     } | |
| return 0; | |
| } | 
# 测试点

# 11 - 散列 4 Hashing - Hard Version (30 分)
本题链接
很好玩的一道题哦,需要思考一下,想通了就很容易 —— 于是有时间就想想吧~实在想不通也没关系,下周习题课会讲的。
# 题目大意
- 已知散列函数 H (x) = x% N 以及用线性探测法解决冲突问题
- 先给出散列映射的结果,反求输入顺序- 当元素 x 被映射到 H (x) 位置后,发现这个位置已经有 y 了,则 y 一定是在 x 之前被输入的
 
# 思路
拓扑排序!其实是将散列映射和拓扑排序融合在了一起~
# 代码
注意有个坑,入度都为 0 即不确定谁先输出时,挑最小的输出,所以这里用优先队列代替小顶堆来存,并用 map 记录对应下标~
| #include <iostream> | |
| #include <cstring> | |
| #include <string> | |
| #include <queue> | |
| #include <map> | |
| using namespace std; | |
| const int maxn = 1005; | |
| int N; | |
| int a[maxn], In[maxn]; | |
| int edge[maxn][maxn]; | |
| map<int, int> HashIndex; | |
| void Topsort() {// 拓扑排序 | |
| for(int i = 0; i < N; ++i) { | |
| for(int j = 0; j < N; ++j) { | |
| if(edge[i][j] == 1) { | |
| In[j]++; | |
|             } | |
|         } | |
|     } | |
| priority_queue<int, vector<int>, greater<int> > q; | |
| for(int i = 0; i < N; ++i) { | |
| if(In[i] == 0 && a[i] >= 0) { | |
| q.push(a[i]); | |
|         } | |
|     } | |
| while(!q.empty()) { | |
| int num = q.top(); | |
| q.pop(); | |
| cout << num; | |
| int v = HashIndex[num]; | |
| for(int i = 0; i < N; ++i) { | |
| if(v == i || edge[v][i] == -1) continue;// 检查以 v 为起点的所有边 | |
| if(--In[i] == 0) q.push(a[i]); | |
|         } | |
| if(q.empty()) cout << endl; | |
| else cout << " "; | |
|     } | |
| } | |
| int main() { | |
| memset(edge, -1, sizeof(edge)); | |
| memset(In, 0, sizeof(In)); | |
| cin >> N; | |
| for(int i = 0; i < N; ++i){ | |
| cin >> a[i]; | |
| HashIndex[a[i]] = i; | |
|     } | |
| for(int i = 0; i < N; ++i) { | |
| if(a[i] < 0) continue; | |
| int Hash = a[i] % N; | |
| if(a[Hash] >= 0 && a[Hash] != a[i]) {// 该位置已被占有 | |
| for(int j = Hash; j != i; j = (j+1) % N) { | |
| edge[j][i] = 1; | |
|             } | |
|         } | |
|     } | |
| Topsort(); | |
| return 0; | |
| } | 
# 测试点

# Kmp 串的模式匹配 (25 分)
本题链接
大家可以把找来的各种模式匹配算法都在这里测试一下,看看效果如何。
# 思路
没啥好说的,KMP 就完事了
# 代码
| #include <iostream> | |
| #include <string> | |
| #include <cstring> | |
| #include <algorithm> | |
| using namespace std; | |
| typedef long long ll; | |
| #define div 1000000007 | |
| const int maxn = 1000005; | |
| const int inf = 0x3f3f3f; | |
| int N,M; | |
| int nxt[maxn]; | |
| void getnxt(string t) { | |
| int len = t.length(); | |
| int i = 0, j = -1; | |
| nxt[0] = -1; | |
| while (i < len) { | |
| if (j == -1 || t[i] == t[j]) { | |
| i++, j++; | |
| if (t[i] == t[j]) | |
| nxt[i] = nxt[j]; //next 数组优化 | |
|             else | |
| nxt[i] = j; | |
| } else | |
| j = nxt[j]; | |
|     } | |
| } | |
| int KMP(string s, string t) {//s 为文本串,t 为模式串 (短的那个) | |
| getnxt(t); | |
| int len1 = s.length(); | |
| int len2 = t.length(); | |
| int i = 0, j = 0, ans = 0; | |
| while (i < len1) { | |
| if (j == -1 || s[i] == t[j]) { | |
| i++, j++; | |
| if (j >= len2) { | |
| return i-j; | |
|             } | |
| } else | |
| j = nxt[j]; | |
|     } | |
| return -1; | |
| } | |
| int main(){ | |
| ios::sync_with_stdio(false); | |
| string String, Pattern; | |
| cin >> String; | |
| cin >> N; | |
| for(int i = 0; i < N; ++i) { | |
| memset(nxt, 0, sizeof(nxt)); | |
| cin >> Pattern; | |
| int k = KMP(String, Pattern); | |
| if(k == -1) cout << "Not Found" << endl; | |
| else cout << String.substr(k) << endl; | |
|     } | |
| return 0; | |
| } | 
# 测试点

