【2021天梯赛训练-5】7-8 集合相似度

给定两个整数集合，它们的相似度定义为：N**c/N*t×100%。其中Nc是两个集合都有的不相等整数的个数，Nt*是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。

输入格式：

输入第一行给出一个正整数N（≤50），是集合的个数。随后N行，每行对应一个集合。每个集合首先给出一个正整数M（≤104），是集合中元素的个数；然后跟M个[0,109]区间内的整数。

之后一行给出一个正整数K（≤2000），随后K行，每行对应一对需要计算相似度的集合的编号（集合从1到N编号）。数字间以空格分隔。

输出格式：

对每一对需要计算的集合，在一行中输出它们的相似度，为保留小数点后2位的百分比数字。

输入样例：

3
3 99 87 101
4 87 101 5 87
7 99 101 18 5 135 18 99
2
1 2
1 3

输出样例：

1 2	50.00% 33.33%

思路：

看数据范围：集合中的数据最大为10^9^，大致算一下，因为2^27^ < 10^9^ < 2^36^ ，有可能超int范围，所以用long long存储比较保险
采用set数组，在存入每个集合中的元素时顺便去重（分析样例可发现），调用求解交集函数，将数据存储起来，最后输出。不要忘记输出百分号
如果交集函数和并集函数都使用，会超时，利用数量关系可以推导，即并集元素个数 = 两集合元素个数之和 - 两集合交集元素个数。

代码：

#include <algorithm>
#include <iostream>
#include <set>
using namespace std;

typedef long long ll;

int main() {
    int n, m, k;
    ll num;
    cin >> n;
    set<ll> st[n];
    for (int i = 0; i < n; i++) {
        cin >> m;
        while (m--) {
            cin >> num;
            st[i].insert(num);
        }
    }
    cin >> k;
    while (k--) {
        int a, b;
        cin >> a >> b;
        set<ll> s;
        //输入的下标是从1开始的，而当初存储是按从0开始的，所以-1
        set_intersection(st[a - 1].begin(), st[a - 1].end(), st[b - 1].begin(),
                         st[b - 1].end(), inserter(s, s.begin()));
        int len1 = s.size();
        int len2 = st[a - 1].size() + st[b - 1].size() - len1;
        printf("%.2lf%%\n", len1 * 100.0 / len2);
    }
    return 0;
}