2012年3月 – 火星猫の窝

深度优化：学习SSE指令

程序跑的太慢怎么办？之前我给出的答案是：用x64环境编译执行程序；用多线程、多进程模式；用CUDA加速。而现在，又有了一种新的解决方案：用CPU的SSE、SSE2等指令集。

因为处理图像数据时大量用到浮点数操作，而且都是一连串一起使用的，所以，用SSE2加速可以取得较好的效果。参见http://dev.gameres.com/Program/Other/sseintro.htm的相关代码，自己模仿了一下，发现很容易写：


int calc_simi(float *feat)

{

	int i,j;

	float *a,*b,t;

	float min_dst = 99999;

	float dst;

	int id=0;

	for(i=0;i
其中dic是一个二维矩阵，目的是求出当前feat向量和二维矩阵中哪一行向量的差最小，返回这个id。calc_simi是普通的实现，calc_simi_sse是利用sse2指令集实现的。
废话不多说，看时间测试时间：
			x86	x64

precise			1224	371

fast			301	302

precise_sse		146	114

fast_sse		148	119
其中，precise和fast对应编译器选项当中浮点数精度要求（因为发现结果木有差异。。），_sse代表利用了sse指令集（编译器优化当中不要选使用sse2，这样会变慢……），x86和x64代表编译环境，由此可以发现，sse会快，而且在x64下比fast浮点运算还快了2.5倍左右！因为sse2每次处理4个浮点数，所以最多也就快4倍，效果很显著了~
so，最终版的优化看来会结合sse2、多线程技术吧（因为CUDA和sse2冲突，而sse2稳定……）



	
		作者  hymike发布于 2012年3月31日分类 猫の心情于深度优化：学习SSE指令留下评论




	
		

	
		搜索：
		
	
	


		
		近期文章

		
											
					2026春节珠海澳门行
									
											
					2025日本之旅
									
											
					2024日本之旅
									
											
					2023日本之旅
									
											
					久违的长途旅行流水账 – 成都5日游
									
					

		
近期评论
一位WordPress评论者发表在《世界，您好！》
nitroglycerine发表在《百日维新》
诗安发表在《国脉128，方向新村路》
DOS发表在《猴年目标》
enchy发表在《上海房价、城市规划、互联网金融》
归档

			
					2026年2月
	2024年10月
	2023年7月
	2023年3月
	2021年5月
	2021年1月
	2020年2月
	2019年5月
	2019年3月
	2018年8月
	2018年5月
	2018年3月
	2017年10月
	2017年6月
	2017年4月
	2017年2月
	2017年1月
	2016年12月
	2016年10月
	2016年8月
	2016年2月
	2015年11月
	2015年8月
	2015年7月
	2015年1月
	2014年6月
	2014年4月
	2014年1月
	2013年11月
	2013年10月
	2013年9月
	2013年8月
	2013年7月
	2013年6月
	2013年5月
	2013年3月
	2012年12月
	2012年9月
	2012年8月
	2012年7月
	2012年6月
	2012年5月
	2012年4月
	2012年3月
	2012年2月
	2012年1月
	2011年12月
	2011年11月
	2011年10月
	2011年9月
	2011年8月
	2011年7月
	2011年6月
	2011年5月
	2011年4月
	2011年3月
	2011年2月
	2011年1月
	2010年11月
	2010年10月
	2010年9月
	2010年8月
	2010年7月
	2010年6月
	2010年5月
	2010年4月
	2010年3月
	2010年2月
	2010年1月
	2009年12月
	2009年11月
	2009年10月
	2009年9月
	2009年8月
	2009年7月
	2009年6月
	2009年5月
	2009年4月
	2009年3月
	2009年2月
	2009年1月
	2008年12月
	2008年11月
	2008年10月
	2008年9月
			

			
分类

			
					Gprs

	未分类

	未分类

	猫の学术

	猫の心情

	猫の故事

	猫の游戏

	猫の生活

	猫の电影&动画

	猫の网站

	猫の铁路、地铁

	猫の音乐

	猫言猫语

			

			
其他操作

		
						登录
			条目feed
			评论feed

			WordPress.org



		
			
			
			
								火星猫の窝
								
					自豪地采用WordPress