如何优雅的将Prompt应用于多任务场景？

最新推荐文章于 2026-06-19 10:26:28 发布

原创

最新推荐文章于 2026-06-19 10:26:28 发布 · 3.7k 阅读

标签

#人工智能 #机器学习 #深度学习

本文探讨了如何在Transformer模型中利用Prompt-Tuning方法实现多任务学习。通过引入任务特定的prompt信息，增强模型在不同任务间的区分性和记忆能力。作者提出了Prompt-Based Task-Conditioned Transformer，结合Multi-Head Self-Attention，为每个任务学习特定参数。此外，还介绍了MTL-Prompt和HyperPrompt技术，以减少参数量并促进信息共享。尽管实验结果显示参数量减少不明显，但这种方法提供了一种新的多任务学习思路。

近些年来，关于预训练语言模型（PLM）的研究数不胜数，Prompt-Tuning就是其中之一主打小巧轻便，更加普适高效，各种花式的魔改，例如 Prefix-tuning、P-tuning、Prompt-tuning等。如果对Prompt不大了解的朋友们可以移步我的另一篇文章https://mp.weixin.qq.com/s?__biz=MzkxMjExNTgwOQ==&mid=2247484234&idx=1&sn=e44ba444c3f12438671df91dffae03c3&chksm=c1109244f6671b52b482b67b569a978d85e4d6cbb150472ec9f1b3f9df11e9e9b1d609420df9&scene=178&cur_album_id=1513596827864989698#rd

一、背景

今天想和给大家介绍的工作是如何将Prompt应用于多任务的场景，常见的Multi-task模型一般的架构是底部共享参数，然后在顶层每个场景学习自己的私有参数典型的代表模型有MMoE等，也就是说关键点在于如何让模型学习每个任务的特定参数，今天解读的论文是在Transformer 中Muti-Head Self-Attention做的文章，在计算self-attention的时候融入特定任务的信息，那么到底怎么融入呢我们接下来进一步分析。