KernelVault 创意方案:把手机变成离线运行的隐私资产保险箱


开场:我们不是缺文件管理器,而是缺一个可信的本机整理员

手机里真正难管理的资料,往往不是普通照片,而是那些“以后一定会用到、但现在很难找”的东西:电子发票、合同截图、证件照片、付款凭证、会议材料、聊天记录、录音、下载文档。
这些资料有两个共同点:第一,找起来麻烦;第二,不太想上传到云端让远程服务帮忙识别。KernelVault 的创意切入点就是把这件事放回手机本机完成:不联网、不上传,用端侧 AI 把散落在手机里的图片、文档、音频和视频整理成本地可搜索、可审计、可解释的隐私资产库。

一句话概括:
KernelVault = 本机资产索引 + 本地 AI 标签摘要 + 隐私风险保险箱
它输出的核心结果固定为:
{tags, summary, privacy}
也就是:这是什么、里面大概有什么、是否需要留意。
应用场景
场景一:找回“去年买显卡的电子发票”
普通相册按时间排序,文件管理器按目录和文件名查找,但大多数用户不会记得发票具体保存在哪个 App、哪一天下载、文件名叫什么。KernelVault 会先把授权范围内的资料纳入本地索引,再通过标签、摘要、FTS 和本地向量召回,让用户可以用更自然的关键词找到目标资料。

适用资料包括:
- 电子发票、收据、报销凭证。
- 合同、报价单、简历、报告。
- 证件照片、授权截图、账号凭据。
- 聊天截图、会议截图、应用界面截图。
场景二:快速判断一张截图是否值得放进保险箱
很多截图本身没有清楚的文件名,但里面可能包含身份证号、订单号、手机号、地址、账号、金额或合同条款。KernelVault 不直接替用户删除文件,而是把高风险和需留意资料集中到保险箱,让用户自己决定下一步处理。

保险箱首版的边界很克制:它是 App 内风险标记和审计工作台,不是系统级隔离沙盒,也不会默认移动、删除或改写原始文件。
场景三:在详情页确认 AI 到底识别了什么
很多 AI 产品容易给出一个“看起来很聪明”的结果,但用户不知道它从哪里来。KernelVault 在详情页把结果拆成文件类型、AI 标签、人工标签、摘要、风险等级和识别来源。用户能看懂 AI 的结论,也能用人工标签和备注覆盖建议。

场景四:向用户证明“只在本机”
隐私产品最怕只喊口号。KernelVault 在防线页集中展示媒体授权、后台维护、系统通知和本机处理证明,让用户知道 App 读了什么、正在做什么、哪些能力依赖本地模型。

用户痛点
痛点一:资料越来越多,但手机搜索仍然很粗糙
相册能按时间浏览,文件管理器能按目录浏览,但用户真正想问的是“那张报销发票在哪里”“上次签的合同截图在哪里”“身份证复印件是不是还在相册里”。这些问题需要内容层面的理解,而不是只看文件名和时间。
痛点二:云端识别方便,但敏感资料上传成本很高
云相册和云盘可以做更强的内容识别,但用户需要把敏感资料交给远端服务。对证件、合同、票据、财务资料和聊天截图来说,这个心理成本很高。KernelVault 的设计底线是 Android Manifest 不声明 INTERNET 权限,识别、索引、搜索和备份都在本机完成。
痛点三:AI 结果如果不能解释,就很难被信任
用户不只想知道“这是高风险”,还想知道为什么高风险、识别来源是什么、是否可以人工修正。KernelVault 把 AI 输出拆成可读字段,并保留快速整理、本地模型识别、人工修正、导入索引等来源,避免把所有结论混成一个黑盒标签。
痛点四:全库深度 AI 很容易拖慢手机
端侧大模型不是没有代价。全库照片和文档如果一上来都跑视觉模型,很容易造成耗时过长、内存压力过大、甚至被系统后台策略中断。KernelVault 采用“先快后准”的路线:先快速整理进库,再对高价值资料做本机 AI 精修,剩余任务交给后台分批补全。
技术方案
KernelVault 的技术目标不是做一个炫技 Demo,而是做一条在普通 Android 真机上更稳的本地智能链路。
模型选型
当前方案把模型能力拆成两类:
| 能力 | 模型方向 | 作用 |
|---|---|---|
| 视觉理解 | Qwen-VL 系列 MNN 模型 | 对图片和截图生成中文语义标签、简短摘要和隐私线索 |
| 文本向量 | bge-large-zh-MNN 等中文 embedding 模型 | 支持本地语义搜索和相似召回 |
| 快速兜底 | 启发式规则 + 文件元数据 + 文本抽取 | 模型不可用时仍能整理、搜索和展示可读摘要 |
这里的关键判断是:端侧模型应该参与“高价值资料精修”,但不应该把所有首轮整理都堵死在大模型推理上。用户点击 整理手机资料 时,第一优先级是尽快看到资产库结果;用户进入详情页后,再对某个资产触发 本机 AI 精修。
推理框架
推理侧选择 MNN,原因有三点:
- MNN 面向移动端推理场景,适合 Android 端侧部署。
- 项目可以通过 Native / JNI 调用本地模型,避免把核心识别链路交给网络服务。
- 同一套端侧思路可以承接视觉模型和 embedding 模型,后续扩展空间更清楚。
KernelVault 的应用层使用 Kotlin + Jetpack Compose,数据层使用 SQLite、FTS 和本地向量索引。后台维护由 WorkManager 执行,系统通知只承担状态说明和保活,不扩展成独立消息中心。
端侧适配思路
端侧适配的重点不是“能不能跑一次”,而是“跑失败时 App 还能不能正常用”。KernelVault 目前采用以下策略:
无网络权限:Android Manifest 不声明INTERNET,从权限层面证明不上传。先快后准:快速整理先写入本地索引,真实视觉模型放到详情页精修和后台分批补全。输入压缩:对图片生成预览图后再送入视觉模型,控制内存和耗时。独立推理进程:重型 MNN 视觉调用放在:mnn子进程,超时后可结束子进程,保护主进程 UI 和数据库。可靠降级:模型文件缺失、加载失败或推理超时时,仍保留快速整理、中文启发式标签、FTS 搜索、人工标签和导入索引结果。人工覆盖:人工标签、人工摘要、风险等级和备注优先级高于 AI 建议,避免模型反复覆盖用户判断。

产品创新点
创新点一:把“隐私资产”作为手机资料的新组织方式
传统文件管理器关心目录,云相册关心照片,KernelVault 关心的是“这份资料是否有价值、是否敏感、是否需要被找回”。这个角度更贴近日常手机资料管理。
创新点二:本机 AI 不是噱头,而是产品边界
KernelVault 不把“本地 AI”写成宣传词,而是把它落实到权限、模型路径、识别来源、状态文案和失败降级上。模型可用时,用户可以在详情页看到本机 AI 精修结果;模型不可用时,App 也不会伪装成已经深度识别。
创新点三:标签、摘要和风险分开表达
很多整理工具会把所有信息塞进标签里,结果用户只看到一排含混的词。KernelVault 固定输出 {tags, summary, privacy},让信息层次更清楚:
tags解决“如何筛选和搜索”。summary解决“这个文件大概是什么”。privacy解决“是否需要留意”。
创新点四:保险箱不是删除器
隐私管理不等于替用户做危险操作。KernelVault 首版只维护本地索引、风险标记、人工修正和审计状态,不默认删除、移动或改写原文件。这个设计牺牲了一点“强控制感”,但换来更低的误伤风险。
创新点五:演示链路和真实能力保持一致
比赛或文章展示中,KernelVault 不承诺“全库秒级视觉识别”。更可信的展示链路是:
检查识别 -> 整理手机资料 -> 资产库 -> 详情页本机 AI 精修 -> 保险箱 -> 防线
这条链路既能展示端侧 AI,也符合普通手机的性能边界。
预期效果
对用户
- 找资料更自然:不用记文件名和目录,用关键词、标签、摘要就能找。
- 隐私更可控:资料不上传,风险结果只在本机提醒。
- 结果更可解释:每个资产都有标签、摘要、风险等级和识别来源。
- 使用更安心:App 不默认删除、移动或改写原始文件。
对技术验证
- 验证 MNN 在 Android 端同时承接视觉理解和中文 embedding 的可行性。
- 验证“快速整理 + 单资产精修 + 后台分批补全”的端侧 AI 产品结构。
- 验证无网络权限下,仍能完成本地索引、搜索、风险提示和加密备份。
- 验证复杂端侧推理必须具备进程隔离、超时保护和降级路径。
对展示传播
CSDN 和掘金读者通常既关心产品想法,也关心工程落地。KernelVault 的传播重点可以放在这三句话上:
- 它解决的是手机本地敏感资料“找不到、说不清、不敢传”的问题。
- 它用 MNN 和本地模型把 AI 能力放在端侧,而不是把文件上传给云服务。
- 它用克制的产品边界证明隐私工具可以有 AI,但不能牺牲用户控制权。

结语
KernelVault 的核心创意不是“又做了一个 AI 文件管理器”,而是把手机里的敏感资料看作一批需要被本地整理、解释和审计的隐私资产。
当 AI 从云端走向端侧,它真正有价值的地方不只是省掉网络请求,而是把数据控制权还给用户。KernelVault 希望证明:一个隐私工具也可以聪明,但它首先要可信。
技术难点与解决方案
这个项目最难的地方,不是把 UI 做出来,而是把“端侧 AI 能跑、能解释、还能不拖垮手机”同时做到。
- 难点一:全库视觉识别太慢,容易拖死前台。
- 解决:改成“先快速整理进库,再对单个高价值资产做本机 AI 精修”,把大模型开销限制在局部。
- 难点二:真机端侧模型容易受内存和系统后台策略影响。
- 解决:重型 MNN 视觉推理放进独立
:mnn进程,超时可结束子进程,主进程继续保持 UI 和索引可用。 - 难点三:AI 结果如果只剩工程词,用户看不懂也不信。
- 解决:统一输出
tags / summary / privacy,并保留人工标签、人工摘要和风险等级的覆盖权。 - 难点四:隐私产品一旦默认上传或默认处置,就会失去可信度。
- 解决:不声明
INTERNET权限,不默认删除、移动或改写原文件,把保险箱定义成审计台而不是清理器。

248

被折叠的 条评论
为什么被折叠?



