背景
现在ASR识别用户语言内容选择的是“中文”,会出现标点符号使用不合适,识别内容不符合语境等问题。现在考虑使用LLM对ASR识别出的内容做校正,输出更适合对话的语境的内容。
目标
-
文本校正,符合上下文聊天的语境
-
符号校正,选择合适的中英文符号、合理的断句、符号符号文本表达的语气。
Bad Case
文本异常
| 原文 |
上下文 |
期望 |
| 我住在hangzhou |
[ { "role": "assistant", "content": "我叫张老师,你叫什么名字" }, { "role": "user", "content": "我叫张三" }, { "role": "assistant", "content": "你住在哪里?" } ] |
我住在杭州 |
| 我叫zhangsan |
[ { "role": "assistant", "content": "我叫张老师,住在北京,你住在什么地方?" }, { "role": "user", "content": "我住在杭州" }, { "role": "assistant", "content": "你叫什么名字?" } ] |
我叫张三 |
符号异常
-
符号



3627

被折叠的 条评论
为什么被折叠?



