给定两个整数集合,它们的相似度定义为:N**c/N*t×100%。其中Nc是两个集合都有的不相等整数的个数,Nt*是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。

输入格式:

输入第一行给出一个正整数N(≤50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(≤104),是集合中元素的个数;然后跟M个[0,109]区间内的整数。

之后一行给出一个正整数K(≤2000),随后K行,每行对应一对需要计算相似度的集合的编号(集合从1到N编号)。数字间以空格分隔。

输出格式:

对每一对需要计算的集合,在一行中输出它们的相似度,为保留小数点后2位的百分比数字。

输入样例:

1
2
3
4
5
6
7
3
3 99 87 101
4 87 101 5 87
7 99 101 18 5 135 18 99
2
1 2
1 3

输出样例:

1
2
50.00%
33.33%

思路:

  • 看数据范围:集合中的数据最大为10^9^,大致算一下,因为2^27^ < 10^9^ < 2^36^ ,有可能超int范围,所以用long long存储比较保险
  • 采用set数组,在存入每个集合中的元素时顺便去重(分析样例可发现),调用求解交集函数,将数据存储起来,最后输出。不要忘记输出百分号
  • 如果交集函数和并集函数都使用,会超时,利用数量关系可以推导,即并集元素个数 = 两集合元素个数之和 - 两集合交集元素个数。

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <algorithm>
#include <iostream>
#include <set>
using namespace std;

typedef long long ll;

int main() {
int n, m, k;
ll num;
cin >> n;
set<ll> st[n];
for (int i = 0; i < n; i++) {
cin >> m;
while (m--) {
cin >> num;
st[i].insert(num);
}
}
cin >> k;
while (k--) {
int a, b;
cin >> a >> b;
set<ll> s;
//输入的下标是从1开始的,而当初存储是按从0开始的,所以-1
set_intersection(st[a - 1].begin(), st[a - 1].end(), st[b - 1].begin(),
st[b - 1].end(), inserter(s, s.begin()));
int len1 = s.size();
int len2 = st[a - 1].size() + st[b - 1].size() - len1;
printf("%.2lf%%\n", len1 * 100.0 / len2);
}
return 0;
}