在某些情况下,为了提升程序的执行效率,需要将程序绑定到指定的cpu核心上。根据微软官方文档,windows提供了两个win32函数:setthreadaffinitymask和setprocessaffinitymask,用于设置指定线程或进程的处理器关联掩码,从而实现线程或进程对处理器的绑定。
SetThreadAffinityMask函数用于设置指定线程的处理器关联掩码,使线程在指定的CPU核心上运行。其函数定义如下:
DWORD_PTR SetThreadAffinityMask( [in] HANDLE hThread, [in] DWORD_PTR dwThreadAffinityMask);
该函数需要传递两个参数:
- hThread:指向要设置处理器关联的线程句柄。如果要设置当前线程的关联掩码,可以使用GetCurrentThread()函数获取句柄。
- dwThreadAffinityMask:处理器的关联掩码,是一个DWORD_PTR类型的值,长度为8个字节(64位),每个bit代表一个CPU核心。例如,要将线程绑定到第0个核心,则dwThreadAffinityMask = 0B_0001(0x01);绑定到第1个核心,则dwThreadAffinityMask = 0B_0010(0x02);绑定到第2个核心,则dwThreadAffinityMask = 0B_0100(0x04);绑定到第3个核心,则dwThreadAffinityMask = 0B_1000(0x08)。如果要绑定到多个核心,比如第1和第2个核心,则dwThreadAffinityMask = 0B_0110,对应的十六进制数为0x06。
调用示例首先需要引入Win32 API:
[DllImport("kernel32.dll")]static extern UIntPtr SetThreadAffinityMask(IntPtr hThread, UIntPtr dwThreadAffinityMask);[DllImport("kernel32.dll")]static extern IntPtr GetCurrentThread();
由于dwThreadAffinityMask的值是按照2的n次幂递增,与通常习惯指定第n个核心不符,并且不同设备的CPU核心数不一样,指定CPU核心时可能超出CPU核心数量,因此可以对指定CPU核心做简单的处理:
static ulong SetCpuID(int lpIdx){ ulong cpuLogicalProcessorId = 0; if (lpIdx >= System.Environment.ProcessorCount) { lpIdx = 0; } //通过移位运算转换lpIdx->dwThreadAffinityMask:0->1,1->2,2->4,3->8,…… cpuLogicalProcessorId |= 1UL << lpIdx; return cpuLogicalProcessorId;}
接下来可以进行测试:
ulong LpId = SetCpuID((int)lpIdx);SetThreadAffinityMask(GetCurrentThread(), new UIntPtr(LpId));Stopwatch stopwatch = new Stopwatch();stopwatch.Start();for (int i = 0; i < 100000000; i++){ // 执行一些操作}stopwatch.Stop();Console.WriteLine("Elapsed time: " + stopwatch.ElapsedMilliseconds + " ms");
效果如图所示:
SetProcessAffinityMask函数与SetThreadAffinityMask非常相似,不同之处在于其作用于整个进程,可以决定进程内的所有线程共同运行在指定的处理器上。其函数定义如下:
BOOL SetProcessAffinityMask( [in] HANDLE hProcess, [in] DWORD_PTR dwProcessAffinityMask);
和SetThreadAffinityMask一样,也需要传递两个参数,只不过第一个参数传递的是进程的句柄。
总结:在某些场景下,可以通过SetThreadAffinityMask和SetProcessAffinityMask提高程序执行效率,主要基于以下几个原因:
- 提高性能:通过将线程绑定到特定的处理器,可以减少线程在不同处理器之间的切换开销,尤其是在多核系统中,有助于提升程序的执行效率。
- 避免缓存抖动:确保线程始终在同一个处理器上运行,可以减少缓存未命中,因为相关的数据更可能保留在该处理器的高速缓存中。
- 实时系统和并发控制:在需要严格控制线程执行位置的场景下,比如实时系统或者某些并发控制策略中,通过设定处理器关联可以满足特定的调度需求。
需要注意的是,SetThreadAffinityMask和SetProcessAffinityMask并不是独占CPU核心,如果关联的CPU核心本身负载就很高,这个时候程序执行效率反而会降低。