C#调用Windows API精准控制鼠标位置并模拟左键点击的完整示例工程

原创于 2026-06-25 07:09:10 发布 · 37 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#C#鼠标控制 #SendInput模拟 #Windows API鼠标

该文章已生成可运行项目，

本文还有配套的精品资源，点击获取

简介：这个资源包提供一套开箱即用的C#鼠标行为控制方案，能直接设置屏幕任意坐标点的鼠标位置，并支持左键单击、双击、按下、释放等基础操作。底层通过Windows API的SendInput函数实现，比mouse_event更稳定且兼容现代系统。包含一个带详细注释的核心类库SimulateMouse，一个可直接运行的控制台演示程序，以及配套的Word文档说明（C#程序模拟鼠标操作.doc），涵盖参数含义、管理员权限要求、常见报错原因（如UAC拦截、高DPI缩放影响）和调试建议。还附带一个Python GUI辅助脚本simulate_mouse_gui.py（需Python环境），方便快速测试坐标定位效果。整个项目基于.NET Framework构建，不依赖第三方NuGet包，解压后无需编译即可查看源码或运行示例。适合用于自动化测试脚本、无障碍辅助工具、RPA流程中的鼠标交互模块，也适合作为Windows输入模拟的学习范例。

1. 项目概述：为什么“精准控制鼠标”不是调用一个MoveCursor那么简单？

在Windows平台做自动化，很多人第一反应是“找个库，SetCursorPos一下不就完了？”——我试过，也踩过坑。真正把鼠标稳稳当当地挪到屏幕（1920, 1080）这个点上，再干净利落地左键单击一次，背后要处理的远不止坐标数字本身。这不是写个Console.WriteLine就能跑通的玩具功能，而是牵扯到系统输入模型、DPI感知、用户账户控制（UAC）、窗口焦点隔离、消息队列调度、以及API选型的历史包袱的一整套底层协作机制。

你手头这个资源包，核心关键词是“C#鼠标控制”、“SendInput模拟”、“Windows API鼠标”，它没走NuGet上那些封装得密不透风的第三方库路线，而是直连Windows原生输入管道。这意味着你看到的每一行代码，都是和USER32.DLL、INPUT结构体、WM_MOUSEMOVE消息在面对面打交道。它不帮你屏蔽复杂性，但正因如此，你才能看清：为什么有时候鼠标明明SetCursorPos成功了，点击却像打在棉花上；为什么在4K高分屏上，你算好的(100, 100)坐标点，实际落点偏移了整整30像素；为什么以普通用户权限运行的程序，在某些安全策略下，根本无法向另一个进程的窗口注入鼠标事件。

这个工程的价值，不在于它“能做”，而在于它“告诉你为什么能做，以及为什么有时候做不了”。它包含一个可直接运行的控制台演示程序，让你三秒内验证基础功能；一个命名清晰、注释密度极高的SimulateMouse类库，每个方法都标注了对应Windows API的函数名、参数含义、返回值检查逻辑，甚至标出了哪些字段在不同Windows版本中行为有差异；还有一份配套的Word文档，不是泛泛而谈“需要管理员权限”，而是明确写出：当你遇到ERROR_ACCESS_DENIED (5)时，大概率是UAC虚拟化在拦截SendInput调用，解决方案不是盲目提权，而是检查目标窗口是否属于更高完整性级别的进程（比如任务管理器、注册表编辑器），此时你需要的是ChangeWindowMessageFilterEx配合WM_INPUT消息过滤，而不是简单右键“以管理员身份运行”。

更务实的是，它附带了一个Python写的GUI辅助脚本simulate_mouse_gui.py。别小看这个小工具——它不是用来替代C#主程序的，而是解决一个最痛的痛点：坐标定位调试。你在代码里写MoveTo(850, 420)，但你根本不确定这个点在屏幕上对应哪里。这个Python脚本启动后会画一个半透明十字线，实时显示当前鼠标坐标，并支持键盘方向键微调，按回车即触发一次左键点击。你一边看着屏幕上的十字线，一边改C#代码里的数字，效率提升不是一倍两倍，是质变。这种“所见即所得”的调试闭环，才是新手能快速上手、老手能高效排障的关键。

所以，如果你的目标是写一个RPA流程里的鼠标点击模块，或者给残障同事开发一个无障碍辅助小工具，又或者只是想彻底搞懂Windows里“鼠标是怎么被程序‘捏’在手里的”，那么这个资源包不是一份“能用就行”的示例，而是一张通往Windows输入子系统内核的详细地图。它不回避复杂性，但把复杂性拆解成了你能理解、能验证、能修改的每一个具体步骤。

2. 核心设计思路与API选型深度解析

2.1 为什么弃用mouse_event，坚定选择SendInput？

在Windows API的输入模拟家族里，mouse_event和SendInput就像一对同源异途的兄弟。mouse_event诞生于Win95时代，接口极其简单：mouse_event(dwFlags, dx, dy, dwData, dwExtraInfo)，传几个标志位和坐标就完事。而SendInput是Vista之后大力推广的现代化接口，要求你构造一个INPUT结构体数组，再一次性提交给系统。

初学者常问：“既然mouse_event更短，干嘛不用？”——我用它做过一个自动点击网页按钮的工具，上线三天，客户反馈“有时点不中，有时连点两次”。抓日志发现，问题出在mouse_event的隐式相对坐标模式和消息队列竞争上。

mouse_event默认使用相对坐标（MOUSEEVENTF_MOVE），它移动的是“鼠标指针的增量”，而非绝对屏幕位置。这意味着，如果在调用mouse_event的瞬间，系统里还有其他程序（比如一个后台更新的杀毒软件）也在悄悄移动鼠标，你的dx/dy就会叠加在它的偏移量上，最终落点完全失控。更致命的是，mouse_event是“火药桶式”触发：每次调用都立即生成一个WM_MOUSEMOVE或WM_LBUTTONDOWN消息，直接塞进目标窗口的消息队列。如果目标窗口正在处理一个耗时操作（比如渲染一个大表格），你的点击消息就会被卡在队列里，等它出来时，按钮可能已经消失了。

SendInput则完全不同。它采用绝对坐标模式（通过MOUSEINPUT结构体中的dx/dy字段配合MOUSEEVENTF_ABSOLUTE标志），并且其核心设计哲学是“批处理+原子性”。你构造的INPUT数组，系统会保证其中所有输入事件（比如先MOUSEEVENTF_MOVE到某点，再MOUSEEVENTF_LEFTDOWN，再MOUSEEVENTF_LEFTUP）作为一个不可分割的原子单元执行。中间不会被其他程序的输入事件插队。这从根本上杜绝了“点歪了”和“点重了”的问题。

更重要的是，SendInput是微软官方认定的、唯一能绕过UIPI（User Interface Privilege Isolation）限制的输入API。UIPI是Vista引入的安全机制，它禁止低完整性级别（IL）的进程向高IL进程（如以管理员身份运行的任务管理器）发送模拟输入。mouse_event会被UIPI无情拦截，返回ERROR_ACCESS_DENIED；而SendInput只要你的进程拥有SE_INPUTDesktop_PRIVILEGE（通常普通用户进程默认就有），就能穿透这层隔离。这也是为什么资源包文档里反复强调“SendInput比mouse_event更稳定且兼容现代系统”——这不是一句空话，而是微软在API设计层面给出的明确信号。

2.2 SimulateMouse类库的三层抽象设计

SimulateMouse类库不是把SendInput的P/Invoke声明简单包装一层就完事。它采用了清晰的三层职责分离：

第一层：底层P/Invoke封装（UnsafeNativeMethods.cs）
这里只做一件事：把SendInput、GetCursorPos、SetCursorPos这些Windows API，用C#的[DllImport]准确地“翻译”过来。关键细节在于INPUT结构体的定义：
```csharp
[StructLayout(LayoutKind.Sequential)]
public struct INPUT
{
public uint type; // INPUT_MOUSE = 0
public MOUSEINPUT mi;
}

[StructLayout(LayoutKind.Sequential)]
public struct MOUSEINPUT
{
public int dx; // 绝对坐标需映射到0-65535范围
public int dy; // 同上
public uint mouseData; // 滚轮数据等
public uint dwFlags; // MOUSMEVENTF_* 标志
public uint time; // 时间戳，0表示系统自动填充
public IntPtr dwExtraInfo; // 额外信息，通常为IntPtr.Zero
}
`` 注意dx/dy字段：SendInput的绝对坐标不是直接用像素值，而是必须映射到0-65535这个固定范围。这是为了兼容所有DPI缩放比例。计算公式是：mappedX = (int)((double)screenX / SystemParametersInfo(SPI_GETWORKAREA).Width * 65535.0)。类库内部把这个映射逻辑封装在了NormalizeCoordinate`方法里，避免使用者每次都手动算。

第二层：坐标系统适配层（CoordinateHelper.cs）
这是新手最容易栽跟头的地方。Windows有三套坐标系：
1. 屏幕物理像素坐标：比如我的27寸4K显示器，原生分辨率是3840x2160；
2. DPI缩放后的逻辑坐标：系统设置为150%缩放时，一个逻辑像素等于1.5个物理像素；
3. SendInput要求的归一化坐标（0-65535）。
CoordinateHelper类负责在这三者之间无缝转换。它会主动探测当前主显示器的DPI缩放比例（通过Graphics.DpiX/Y），并获取真实工作区尺寸（排除任务栏），确保你传入MoveTo(100, 100)时，它知道这100个逻辑像素，在150%缩放下对应多少物理像素，再映射成多少归一化值。没有这一层，你在高DPI屏幕上写的坐标，永远是错的。
第三层：语义化操作层（SimulateMouse.cs）
这是给开发者用的友好接口。它把底层的INPUT数组构造、SendInput调用、错误检查全部封装起来，暴露的是人类能读懂的方法：
csharp public static void MoveTo(int x, int y, bool absolute = true); public static void LeftClick(int x = -1, int y = -1); // -1表示当前位置 public static void LeftDoubleClick(int x = -1, int y = -1); public static void LeftDown(int x = -1, int y = -1); public static void LeftUp(int x = -1, int y = -1);
每个方法内部都做了严谨的防御性编程：检查x/y是否在有效屏幕范围内（防止负数或超出边界导致SendInput静默失败）；调用SendInput后检查返回值，如果为0，立刻抛出带有Marshal.GetLastWin32Error()详情的异常；对于LeftClick，它内部是严格按LEFTDOWN -> LEFTUP两个事件顺序构造INPUT数组，确保原子性。

这种分层，让使用者既能“开箱即用”，也能在需要时深入任意一层去定制，比如你想实现一个“带加速度的平滑鼠标移动”，就可以直接复用CoordinateHelper的映射逻辑，自己构造一个INPUT数组序列。

2.3 全局钩子（Hook）的设计意图与安全边界

资源包里提到的“全局钩子示例”，很容易被误解为“我要监听所有鼠标事件”。实际上，这里的“全局钩子”特指WH_MOUSE_LL（低级鼠标钩子），它是Windows提供的、唯一不需要注入DLL到目标进程就能监听系统级鼠标消息的机制。

它的设计意图非常明确：不是为了替代SendInput，而是为了构建一个“监控-响应”闭环。比如，你的自动化工具需要在用户点击某个特定区域时暂停执行，或者你想记录下用户手动操作的所有坐标轨迹用于后续分析。WH_MOUSE_LL钩子就是干这个的。

但必须划清安全红线：
- WH_MOUSE_LL只能监听，不能篡改或阻止鼠标事件。你收到WM_MOUSEMOVE消息，可以记录坐标，但不能把它改成WM_LBUTTONDOWN发回去。想篡改，必须用WH_MOUSE（需要DLL注入，风险极高，且现代Windows Defender会直接拦截）。
- 它的回调函数必须在Unmanaged上下文中执行，且必须极快返回（<10ms），否则会拖慢整个系统的鼠标响应。因此，钩子回调里只做最轻量的事：记录时间戳、坐标、按键状态，然后把数据推到一个线程安全的队列里，由另一个工作线程去处理。资源包里的示例正是这样做的，避免了常见的“钩子卡死鼠标”问题。

3. 实操过程详解：从零开始构建一个可靠的鼠标控制模块

3.1 环境准备与权限确认

在动手写任何一行代码前，请务必完成这两项检查，它们能帮你避开80%的“为什么我的代码不工作”类问题。

第一步：确认.NET Framework版本与目标平台
资源包明确说明“基于.NET Framework环境验证通过”。这意味着你必须使用Visual Studio的.NET Framework项目模板（不是.NET Core/.NET 5+），目标框架至少为.NET Framework 4.0（SendInput在4.0中已完全可用）。在VS中新建项目时，选择“控制台应用(.NET Framework)”，不要选“.NET Core”或“.NET 5/6/7/8”。这是因为SendInput的P/Invoke声明依赖于System.Runtime.InteropServices在Framework下的特定行为，跨平台.NET中虽然也能调用，但DPI适配逻辑需要重写。

第二步：理解并验证UAC与UIPI的影响
这是最隐蔽的“拦路虎”。打开你的Windows“用户账户控制设置”，将其拖到“从不通知”档位，然后运行你的程序。如果这时一切正常，但调回默认档位（仅当应用尝试更改计算机时通知）就失败，那基本可以确定是UIPI在作祟。

验证方法很简单：用Process Explorer（微软官方免费工具）打开你的C#程序进程，查看其“Integrity Level”（完整性级别）。正常情况下是Medium。再打开一个你试图向其发送鼠标事件的目标窗口（比如记事本），查看它的完整性级别。如果目标是High（比如你右键“以管理员身份运行”的记事本），那么你的Medium进程调用SendInput向它发送事件，就会被UIPI拦截，SendInput返回0，GetLastError()返回5（ERROR_ACCESS_DENIED）。

解决方案不是让你的程序也提权（这违背最小权限原则），而是改变交互策略：
- 如果目标窗口是你自己的程序，可以在其Main方法开头添加SetThreadExecutionState(ES_CONTINUOUS | ES_SYSTEM_REQUIRED | ES_AWAYMODE_REQUIRED)来延长系统唤醒状态，但这对UIPI无效；
- 更务实的做法是，接受“无法向高IL进程注入输入”这一事实，将你的自动化流程设计为：先用SendInput操作一个Medium IL的中介窗口（比如一个你自己的无边框透明窗体），再由这个中介窗体通过PostMessage向目标高IL窗口发送WM_COMMAND等受信任的消息。资源包的Word文档里详细记录了这个变通方案的代码片段。

3.2 核心类库SimulateMouse的逐行解析

我们以LeftClick方法为例，进行逐行代码级解读，这能让你彻底明白“一行高级API调用背后发生了什么”。

public static void LeftClick(int x = -1, int y = -1)
{
    // 1. 坐标预处理：如果未指定坐标，则获取当前鼠标位置
    if (x == -1 || y == -1)
    {
        var currentPos = GetCursorPosition(); // 调用GetCursorPos API
        x = currentPos.X;
        y = currentPos.Y;
    }

    // 2. 坐标合法性校验：防止越界导致SendInput静默失败
    var screenBounds = Screen.PrimaryScreen.Bounds;
    if (x < screenBounds.Left || x > screenBounds.Right ||
        y < screenBounds.Top || y > screenBounds.Bottom)
    {
        throw new ArgumentOutOfRangeException($"Coordinates ({x}, {y}) are outside the primary screen bounds ({screenBounds}).");
    }

    // 3. DPI感知坐标归一化：这才是最关键的一步
    var normalized = CoordinateHelper.NormalizeTo65535(x, y);

    // 4. 构造INPUT数组：两个事件，一个按下，一个释放
    var inputs = new INPUT[2];

    // 事件1：左键按下
    inputs[0].type = INPUT_MOUSE;
    inputs[0].mi.dx = normalized.X;
    inputs[0].mi.dy = normalized.Y;
    inputs[0].mi.mouseData = 0;
    inputs[0].mi.dwFlags = MOUSEEVENTF_MOVE | MOUSEEVENTF_ABSOLUTE | MOUSEEVENTF_LEFTDOWN;
    inputs[0].mi.time = 0;
    inputs[0].mi.dwExtraInfo = IntPtr.Zero;

    // 事件2：左键释放
    inputs[1].type = INPUT_MOUSE;
    inputs[1].mi.dx = normalized.X;
    inputs[1].mi.dy = normalized.Y;
    inputs[1].mi.mouseData = 0;
    inputs[1].mi.dwFlags = MOUSEEVENTF_MOVE | MOUSEEVENTF_ABSOLUTE | MOUSEEVENTF_LEFTUP;
    inputs[1].mi.time = 0;
    inputs[1].mi.dwExtraInfo = IntPtr.Zero;

    // 5. 原子性提交：SendInput保证这两个事件按序、无干扰执行
    uint result = UnsafeNativeMethods.SendInput((uint)inputs.Length, inputs, INPUT.Size);

    // 6. 严格的错误检查：SendInput返回值是成功发送的事件数，不是布尔值！
    if (result != (uint)inputs.Length)
    {
        int lastError = Marshal.GetLastWin32Error();
        throw new Win32Exception(lastError, $"SendInput failed. Expected {inputs.Length} events, but sent {result}. Error code: {lastError}");
    }
}

这段代码的精妙之处在于第6步的错误检查。很多教程只写if (result == 0)，这是严重错误的。SendInput的返回值是成功放入系统输入队列的事件数量。如果你构造了2个事件，但result返回1，意味着第一个LEFTDOWN成功了，第二个LEFTUP失败了——这会导致鼠标左键永远处于“按下”状态！你的程序会以为点击完成了，但用户看到的是鼠标图标变成了“忙”状态，再也点不了别的地方。资源包的实现严格检查result == inputs.Length，确保原子性。

3.3 控制台演示程序的实战演练

控制台程序Program.cs是学习的最佳起点。它没有花哨的界面，只有清晰的菜单和即时反馈。我们来完整走一遍它的典型用法：

编译并运行：在VS中打开项目，按Ctrl+F5（不调试运行）。你会看到一个黑色命令行窗口，显示：
```
C# Mouse Simulator Demo
========================
Move mouse to center of primary screen
Left click at current position
Left double click at (500, 300)
Press and hold left button at (100, 100), then release after 2 seconds
Exit
```
测试坐标归一化：选择选项3。程序会执行SimulateMouse.LeftDoubleClick(500, 300)。注意，这里传入的是逻辑坐标(500, 300)。如果此时你的显示器是125%缩放，CoordinateHelper会自动计算出对应的物理像素（比如625, 375），再映射成归一化值（比如12345, 7890），最后通过SendInput发出。你可以用simulate_mouse_gui.py打开，把十字线移到屏幕(500, 300)逻辑位置，然后按回车，对比两者是否一致。
测试原子性点击：选择选项4。程序会先调用SimulateMouse.LeftDown(100, 100)，然后Thread.Sleep(2000)，最后SimulateMouse.LeftUp(100, 100)。重点观察这2秒内：你尝试用物理鼠标点击其他地方，会发现系统响应依然流畅——因为SendInput的事件是排队执行的，你的物理操作不会被阻塞。而如果你用两个独立的mouse_event调用，中间Sleep时，物理鼠标操作可能会被延迟响应。
制造并排查错误：故意选择一个超出屏幕的坐标，比如在选项3中，把代码改成LeftDoubleClick(10000, 10000)。运行后，程序会抛出ArgumentOutOfRangeException，并清晰地告诉你坐标超出了主屏幕边界。这就是前面提到的“坐标合法性校验”的价值——它把一个难以调试的静默失败，转化成了一个立刻能定位的异常。

3.4 Python GUI辅助脚本simulate_mouse_gui.py的妙用

这个脚本是整个资源包里最被低估的“生产力神器”。它的源码只有不到50行，但解决了自动化开发中最耗时的环节：坐标定位调试。

它的核心逻辑是：
- 使用tkinter创建一个全屏、半透明（attributes("-alpha", 0.3)）、无边框（overrideredirect(True)）的窗口；
- 在窗口中央绘制一个红色十字线；
- 通过pyautogui.position()（或win32api.GetCursorPos()）实时读取鼠标物理坐标；
- 将物理坐标转换为当前屏幕的逻辑坐标（自动适配DPI），并显示在十字线旁；
- 绑定键盘事件：方向键微调十字线位置（每次1像素），Enter键触发一次pyautogui.click()，Esc键退出。

使用场景举例：
你想让自动化程序点击微信电脑版的“文件传输助手”聊天窗口。你打开微信，启动simulate_mouse_gui.py，它会在屏幕上画出一个淡红色十字线。你用鼠标拖动这个十字线，让它精确对准“文件传输助手”的头像，此时脚本窗口左上角会显示类似X: 245 Y: 187的坐标。你把这个(245, 187)直接复制，粘贴到你的C#代码里：SimulateMouse.LeftClick(245, 187)。整个过程不到10秒，精准度远超肉眼估算。

提示：simulate_mouse_gui.py依赖pyautogui和pypiwin32。安装只需两条命令：pip install pyautogui 和 pip install pypiwin32。它不参与你的核心业务逻辑，只是一个纯粹的“坐标尺”，用完即弃，却能极大提升开发效率。

4. 常见问题与排查技巧实录

4.1 “点击没反应”问题速查表

这是新手遇到频率最高的问题。请按以下顺序逐一排查，90%的情况都能定位：

现象	可能原因	排查方法	解决方案
`SendInput`返回0，`GetLastError()`为5 (`ERROR_ACCESS_DENIED`)	UIPI拦截（向高IL进程发送输入）	用`Process Explorer`查看目标窗口和你的程序的Integrity Level	不向高IL窗口直接发送输入；改为操作一个`Medium` IL的中介窗口，或改用`PostMessage`发送受信任消息
`SendInput`返回正确的事件数（如2），但目标窗口无反应	目标窗口未获得焦点，或被其他窗口遮挡	在调用`LeftClick`前，先用`SetForegroundWindow`激活目标窗口句柄	获取目标窗口句柄（`FindWindow`），调用`SetForegroundWindow`，等待`GetForegroundWindow()`返回该句柄后再发送输入
鼠标移动到了正确位置，但点击动作发生在错误的位置	DPI缩放未适配，传入了物理像素而非逻辑像素	检查`SimulateMouse.MoveTo`调用时传入的坐标，是否经过`CoordinateHelper`处理	严格使用`SimulateMouse`类库提供的方法，不要自己调用`SetCursorPos`；确保`CoordinateHelper`的DPI探测逻辑生效
点击动作有明显延迟，或多次点击才生效	`SendInput`被系统节流（Throttling）	在`SendInput`调用前后添加`Stopwatch`计时，观察耗时	这是Windows的保护机制，无法绕过；优化策略是减少不必要的`SendInput`调用，将多个操作合并为一个`INPUT`数组

4.2 高DPI缩放下的坐标漂移问题详解

这是一个典型的“看似简单，实则深坑”的问题。假设你的开发机是1080p屏幕，100%缩放，你测出点击按钮的坐标是(320, 240)。你把程序打包给一个用Surface Pro 7（2736x1824，225%缩放）的同事，他运行后，鼠标总是点在按钮上方一大块空白处。

原因在于：SendInput的dx/dy字段，要求的是相对于整个虚拟屏幕（Virtual Screen）的归一化坐标，而Virtual Screen的尺寸是所有显示器物理分辨率的总和，再乘以各自的DPI缩放因子。一个100%缩放的1920x1080显示器，其虚拟屏幕尺寸就是1920x1080；但一个225%缩放的2736x1824显示器，其虚拟屏幕尺寸是(2736*2.25) x (1824*2.25) ≈ 6156 x 4104。

CoordinateHelper.NormalizeTo65535方法的正确实现，必须分三步：
1. 获取当前鼠标所在显示器的HMONITOR句柄；
2. 调用GetMonitorInfo获取该显示器的rcMonitor（物理像素矩形）和dwFlags（是否为主显示器）；
3. 计算归一化值：mappedX = (int)((double)(x - rcMonitor.Left) / (rcMonitor.Right - rcMonitor.Left) * 65535.0)。

资源包里的CoordinateHelper正是这样实现的。如果你自己写，漏掉了第1、2步，直接用Screen.PrimaryScreen.Bounds，那么在多显示器、不同DPI缩放的混合环境下，坐标必然漂移。

4.3 全局钩子（WH_MOUSE_LL）的性能陷阱与规避

低级鼠标钩子WH_MOUSE_LL的回调函数，是在你的进程主线程中执行的。这意味着，如果回调函数里做了任何耗时操作（比如File.WriteAllText写日志、HttpClient.GetAsync发网络请求），整个系统的鼠标移动都会变得卡顿。

我在一个早期版本中，曾试图在钩子回调里直接把每次鼠标移动的坐标存入SQLite数据库。结果是：鼠标指针移动时出现明显的“跳跃感”，就像帧率掉到了10FPS。Process Monitor抓取显示，每次WriteFile调用都耗时超过50ms。

正确的做法是“快进快出”：
- 钩子回调里只做三件事：1）读取MSLLHOOKSTRUCT里的pt.x/pt.y；2）调用DateTime.Now.Ticks获取时间戳；3）将这三个值（x, y, ticks）压入一个ConcurrentQueue<(int, int, long)>。
- 启动一个独立的Task.Run工作线程，循环TryDequeue这个队列，将数据批量写入文件或数据库。

资源包里的钩子示例正是采用了这种模式。它甚至提供了一个MouseHookManager类，封装了钩子的安装、卸载和事件委托，让你只需订阅MouseHookManager.MouseMoved事件，就能在UI线程安全地收到坐标更新，完全不用操心线程同步。

4.4 RPA集成中的“防检测”经验分享

如果你把这套鼠标控制用在RPA（机器人流程自动化）场景中，特别是面对银行网银、政府服务平台这类有反爬机制的网站，光靠精准点击还不够，还需要模拟“人类行为”。

随机化点击延迟：不要每次都是Thread.Sleep(100)。我用的是一个简单的正态分布随机数生成器，让延迟在80ms到250ms之间波动，均值150ms，标准差30ms。这比均匀分布更接近真人操作。
添加微小的坐标抖动：在LeftClick(x, y)之前，加入x += Random.Shared.Next(-3, 4); y += Random.Shared.Next(-3, 4);。人类的手不可能每次都点在同一像素上，3像素以内的随机偏移，既不影响功能，又能绕过一些基于“点击坐标过于精准”的简单检测。
模拟鼠标移动轨迹：SendInput本身不支持贝塞尔曲线移动，但你可以自己实现。将MoveTo分解为10-20个中间点，每个点调用一次SendInput（构造单个MOUSEEVENTF_MOVE事件），点与点之间用Thread.Sleep(5-15)间隔。资源包的Word文档里，附有一个SmoothMouseMove的扩展方法示例，代码清晰，可直接复用。

5. 实战扩展：从基础点击到构建一个完整的自动化工作流

掌握了SimulateMouse的核心能力，下一步就是把它嵌入到更大的自动化场景中。这里分享一个我用它构建的、真实投产的“发票信息自动录入”工作流，它完美体现了如何将基础鼠标操作升华为可靠的企业级工具。

5.1 工作流全景图

整个流程分为三个阶段：
1. 准备阶段：用户手动打开浏览器，导航到发票上传页面，点击“选择文件”按钮，弹出系统文件对话框；
2. 自动化阶段：我们的C#程序接管，自动在文件对话框中定位到发票PDF文件，点击“打开”；
3. 验证阶段：程序等待网页加载完成，截图识别上传成功的绿色提示条，若识别失败则重试。

SimulateMouse主要承担第2阶段的“文件对话框操作”。

5.2 文件对话框精准定位的关键技巧

系统文件对话框（OpenFileDialog）是一个标准的Windows通用控件，但它没有公开的、稳定的UI Automation（UIA）元素ID。用FindWindow找它的句柄很困难，因为类名是#32770（对话框通用类），标题又经常变化（“打开”、“选择文件”、“请选择要上传的文件”）。

我的解决方案是图像识别+坐标偏移：
- 首先，用Graphics.CopyFromScreen截取整个屏幕；
- 然后，在截图中搜索一个高度稳定的特征图案：文件对话框左上角的“关闭”按钮（一个灰色的×图标）；
- 一旦找到这个图标在截图中的坐标(iconX, iconY)，那么“文件名输入框”的位置就是(iconX + 120, iconY + 60)，“打开”按钮的位置就是(iconX + 400, iconY + 280)（这些偏移量是通过simulate_mouse_gui.py反复测量得出的，对所有Windows版本都通用）；
- 最后，调用SimulateMouse.MoveTo(targetX, targetY)和SimulateMouse.LeftClick()完成操作。

这个技巧的关键在于，它不依赖于窗口句柄或UIA树，只依赖于屏幕上可见的、不变的像素图案。即使Windows更新了文件对话框的UI，只要那个×图标还在左上角，整个流程就依然健壮。

5.3 错误恢复与日志审计

一个生产级的自动化工具，必须有完善的错误恢复机制。我在主流程中加入了：
- 三重重试：任何一次SendInput失败，都记录日志并等待1秒后重试，最多3次；
- 超时熔断：整个文件对话框操作设定30秒超时，超时后强制关闭对话框（keybd_event(VK_ESCAPE, 0, 0, 0)），避免卡死；
- 结构化日志：每一步操作（移动鼠标到X,Y，点击，等待N毫秒）都记录到一个CSV文件，包含时间戳、操作类型、坐标、是否成功、错误信息。当客户报告“某次上传失败”时，我只需打开日志，就能精准定位到是哪一步、哪个坐标出了问题。

我个人在实际操作中的体会是：SimulateMouse类库的价值，不在于它有多炫酷的功能，而在于它把所有底层的坑——DPI、UIPI、坐标归一化、错误检查——都给你填平了。你拿到的不是一个“能用”的玩具，而是一个“敢用”的基石。我把它集成进公司的RPA平台已有两年，每天处理上千张发票，从未因为鼠标控制本身的问题导致流程中断。它的稳定性，来自于对Windows输入模型深刻的理解，和对每一个细节近乎偏执的打磨。如果你也在做类似的自动化项目，不妨就从这个资源包开始，把它当作你通往Windows底层世界的第一块稳固踏脚石。

本文还有配套的精品资源，点击获取