整数保序的离散化(C/C++)

news/2024/7/7 1:11:01 标签: c++, 开发语言, 算法, c语言

目录

1. 离散化的概念

1.1 离散化的运用思路

1.2 离散化的方法

1.2.1 排序

 1.2.2 确定一个元素离散化后的结果

1.3 案例分析

1.3.1

 1.3.2 区间和 (来源:Acwing)


1. 离散化的概念

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。
例如:
原数据:1,999,100000,15;

处理后:1,3,4,2;
原数据:{100,200},{20,50000},{1,400};
处理后:{3,4},{2,6},{1,5};

1.1 离散化的运用思路

以下离散化均指整数保序的离散化。

根据离散化的定义,我们能够发现需要如果数据需要做离散化的处理,那么该数据的值域跨度是非常大的,但是分布很稀疏。因为值域的跨度相当大,自身并不能作为数组的下标保存对应的属性。但是如果只需要这些数据的相对属性,那么就可以对数据进行离散化处理。

1.2 离散化的方法

这里只讲常用的方法:重复元素离散化的结果相同。

我们只需要确保两个事情不变:

首先:保证离散化之后的数据尽可能地小而且非负。

其次:离散后的数据要保持原本的大小关系,原本相等的也要保持相等,否则就是错误的离散。

因此,找出原数据在序列中的序位 (可以直接理解为排第几) 就是离散化的关键。

1.2.1 排序

离散化就是确定找出原数据在序列中排第几嘛,因此我们直接对其排序就好了,排完序便可直接根据该数据所在位置的下标确定其离散化的结果。但是显然单单排序是不够的,如果原数据中有重复元素,那么相同的数据就会有不同的离散化结果,这是不被允许的。因此,对排好序的数组我们还要进行去重的操作。

假设原数组为 array。

对于C++:排序用sort,去重用unique,删除末尾重复的元素用erase,即:

array.erase(unique(array.begin(), array.end()), array.end())

 对于C语言:用 qsort 排序,用双指针算法去重就行。

 1.2.2 确定一个元素离散化后的结果

比如:将数据:1 5 3 2 2 3,进行排序,去重,删除后,得到结果:1 2 3 5,比如我们想要知道 5 离散化后的结果是多少,该怎么做呢?答案就是二分查找哦。5 对应的下标就是 5 离散化的结果。这里就是标准的二分查找模板。

二分查找请参考:http://t.csdn.cn/CVAGj

int binary_search1(int* nums, int numsSize, int target)
{
	int l = 0, r = numsSize - 1;
	while (l < r)
	{
		int mid = l + r >> 1;
		if (nums[mid] >= target)
		{
			r = mid;
		}
		else
		{
			l = mid + 1;
		}
	}
	return l;
}

1.3 案例分析

1.3.1

题目描述:

现有数列 A1,A2,A3 ··· ,An,数列中可能有重复元素。现在要求输出该数列的离散化数列,重复元素离散化后的数字相同。

输入:

第一行,一个整数 n (1 <= n <= 10 ^ 5)

第二行,n个整数整数,每个整数的取值为:[-10^9, 10^9]。

输出:

一行,包括 n 个整数。表示数列对应的离散化数列,重复元素离散化后的数字相同。

样例输入:

6

1 23424 242 65466 242 0

样例输出:

1 3 2 4 2 0

int binary_search1(vector<int>& nums, int target)
{
	int l = 0, r = nums.size() - 1;
	while (l < r)
	{
		int mid = l + r >> 1;
		if (nums[mid] >= target)
		{
			r = mid;
		}
		else
		{
			l = mid + 1;
		}
	}
	return l;
}


int main()
{
	vector<int> array;
	vector<int> a;

	int n;
	cin >> n;
	int num;

	for (int i = 0; i < n; i++)
	{
		scanf("%d", &num);
		array.push_back(num);
		a.push_back(num);

	}
	//排序
	sort(array.begin(), array.end());
	//去重和删除
	array.erase(unique(array.begin(), array.end()), array.end());

	for (int i = 0; i < a.size(); i++)
	{
		int ret = binary_search1(array, a[i]);
		cout << ret << " ";
	}
	cout << endl;

	system("pause");
	return 0;
}

 1.3.2 区间和 (来源:Acwing)

假定有一个无限长的数轴,数轴上每个坐标的数都是0.

现在我们首先进行 n 次操作,每次操作将某一位置 x 上的数加上 c 。

接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l, r] 之间所有数的和。

输入格式:

第一行包含两个整数 n 和 m。

接下来 n 行,包含两个整数 x 和 c。

再接下来 m 行,每行包含两个整数l 和 r。

输出格式:

共 m 行,每行输出一个询问中所求的区间内数字和。

数据范围:

-10 ^ 9 <= x <= 10 ^ 9 ,

1 <= n , m <= 10 ^ 5 ,

-10 ^ 9 <= l <= r <= 10 ^ 9 ,

-10000 <= c <= 10000

const int N = 300010;

//这里用来存在c的位置加上x 和每一次询问的区间,当然也可以用结构体
typedef pair<int, int> PI;

//在x的位置加上c不止一次,数组存
vector<PI> add;
//询问的区间不止一次,数组存
vector<PI> query;
//存所有添加的值c,需要离散化
vector<int>alls;
//保存离散化后的结果
int a[N];
//求区间和会用到前缀和的,创建一个前缀和数组
int s[N];


int n, m;

//这里离散化的值是从1开始的,为了对应求前缀和时也是从1开始
int binary_search1(int target)
{
	int l = 0, r = alls.size() - 1;
	while (l < r)
	{
		int mid = l + r >> 1;
		if (alls[mid] >= target)
		{
			r = mid;
		}
		else
		{
			l = mid + 1;
		}
	}
	return l + 1;
}


int main()
{

	cin >> n >> m;
	
	for (int i = 0; i < n; i++)
	{
		int x, c;
		cin >> x >> c;
		//记录每一次添加的位置和值
		add.push_back({ x,c });
		//加上c的位置x是需要离散化的
		alls.push_back(x);
	}

	//m次询问
	for (int i = 0; i < m; i++)
	{
		int l, r;
		cin >> l >> r;
		//记录每一次询问
		query.push_back({ l,r });

		//输入的区间同样需要离散化
		alls.push_back(l);
		alls.push_back(r);
	}
	
	//排序,去重,删除
	sort(alls.begin(), alls.end());
	alls.erase(unique(alls.begin(), alls.end()), alls.end());

	for (pair<int, int> i : add)
	{
		//将x位置加上c的x进行离散化
		int x = binary_search1(i.first);
		//a数组中的下标就代表离散化的值哈,值代表x的位置
		a[x] += i.second;
	}

	//前缀和处理
	for (int i = 1; i <= alls.size(); i++)
	{
		s[i] = s[i - 1] + a[i];
	}

	//处理询问
	for (pair<int, int> i : query)
	{
		int l = binary_search1(i.first);
		int r = binary_search1(i.second);

		cout << s[r] - s[l - 1] << endl;
	}

	return 0;
}

 


http://www.niftyadmin.cn/n/94644.html

相关文章

修改shell的命令提示符

以下内容源于C语言中文网的学习与整理&#xff0c;非原创&#xff0c;如有侵权请告知删除。 一、命令提示符格式 从虚拟控制台登陆后&#xff0c;或者从桌面环境的终端进入shell后&#xff0c;就可以看见shell的命令提示符&#xff0c;这意味着可以输入命令了。注意&#xff…

力扣-市场分析

大家好&#xff0c;我是空空star&#xff0c;本篇带大家了解一道简单的力扣sql练习题。 文章目录前言一、题目&#xff1a;1158. 市场分析二、解题1.错误示范①提交SQL运行结果2.正确示范①提交SQL运行结果3.错误示范②提交SQL运行结果4.正确示范②提交SQL运行结果5.其他总结前…

白帽黑客入行应该怎么学?零基础小白也能轻松上手!

这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续落地&#xff0c;网络安全行业地位、薪资随之水涨船高。 1为什么网络安全行业是IT行业最后的红利&#xff1f; 根据腾讯安全发布的《互联网安全报告》&#xff0c;…

哪些骨传导运动蓝牙耳机好,分享几款不错的骨传导耳机

​骨传导耳机在运动中有很多优势&#xff0c;它是一款不入耳的耳机&#xff0c;适合在跑步、骑行、爬山等运动中使用&#xff0c;如果你是一个爱运动的人&#xff0c;骨传导耳机是不错的选择。由于骨传导技术不需要塞入耳朵中就能听到音乐&#xff0c;所以不会产生任何不适感。…

华为OD机试题,用 Java 解【最小施肥机能效】问题

最近更新的博客 华为OD机试 - 猴子爬山 | 机试题算法思路 【2023】华为OD机试 - 分糖果(Java) | 机试题算法思路 【2023】华为OD机试 - 非严格递增连续数字序列 | 机试题算法思路 【2023】华为OD机试 - 消消乐游戏(Java) | 机试题算法思路 【2023】华为OD机试 - 组成最大数…

怎么在LinkedIn领英安全添加到3万个好友?

根据领英最新公布的数据&#xff1a;领英全球用户数已经达到8.3亿&#xff0c;超5800万个公司主页&#xff0c;可以说是世界上最-大的business database。 这就不难理解为什么越来越多的外贸人&#xff0c;开始认真尝试和重视在领英开发客户&#xff0c;因为领英确实是外贸人&a…

AcWing蓝桥杯辅导课:第一讲递推与递归

AcWing 92. 递归实现指数型枚举 思路&#xff1a; 方法一&#xff1a; 暴力枚举 用二进制加位运算枚举每一个状态&#xff0c;输出即可&#xff0c;时间复杂度为 O(N2N)O(N2^N)O(N2N) 代码&#xff1a; import java.util.Scanner;/*** Description* Author: PrinceHan* Cre…

劳保防护用品穿戴检测 python

劳保防护用品穿戴检测算法通过pythonOpencv深度学习技术&#xff0c;劳保防护用品穿戴检测算法对现场人员防护穿戴用品进行全天候检测&#xff0c;当检测到未按照要求进行穿戴&#xff0c;立即对现场违规人员进行抓拍。Python是一种由Guido van Rossum开发的通用编程语言&#…