背景
一位同学对中医翻译特别感兴趣,但对智能体和AI领域的知识相对欠缺。而我在这方面经验稍多,因此我们经常一起讨论AI相关的想法。最近,他萌生了用智能体翻译中医古文的想法,其中最关键的部分是对譬喻(如隐喻、明喻等)的处理。我们希望通过合作,开发一个智能体,为中医古文翻译做出贡献,同时也加深我对智能体的理解。
在项目中,他主要负责论文相关工作(撰写、翻译、提示词调试),而我则专注于智能体的搭建(主要是工作流),并在提示词调试、测试集构建以及产品定位等方面提供思路和解决方案。本文主要是总结现阶段的进展,为后续智能体开发提供参考。
整个过程让我感受到,这就像是一个从0到1的产品开发过程。若将这个智能体视为一个产品落地项目,我们经历了需求对接、功能定义、技术方案确认、细节对齐以及反复优化的过程。
框架
此前,我曾尝试过一次长文智能体的开发,并发现了一些需要改进的地方,比如术语查询、细分审校规则、文件输出等。在本次智能体开发中,这些问题基本都得到了尝试性解决,并成功搭建了一个完整的流程。以下是大致的流程图:
最终搭建的时候,分为两个工作流搭建——譬喻与术语提取和翻译与审校,虽然可以合并为一个,但是分开搭建,在功能上划分更清晰。
譬喻与术语提取
这一部分主要是对不同譬喻和术语进行识别提取以及查找参考属于,大致结构如下:
- 譬喻与术语的识别提取都是由大模型同步进行。
- 术语还涉及到在参考术语中进行查找,这一步主要是通过python格式化提取出来的术语,然后循环在数据库查找。
翻译与审校
这一部分主要是对提取的譬喻进行翻译与分析,并在参考术语的基础上对全文进行处理。
- 对上一个工作提取出的譬喻进行翻译,以及译者注撰写。
- 对翻译做整合、对翻译和译者注进行多个步骤的审校。
复盘
整个搭建过程耗时不长,但后续优化投入了大量精力,尤其是只能在晚上进行工作。为了提高效率,复盘显得尤为重要。目前记忆中的主要难题包括:
- 术语检索与提取
包括术语提取、术语检索和术语整理。
- 模型评测(指标构建)
涉及各类隐喻提取性能评测和翻译质量评测。
- 提示词调试
这是重点部分,涉及多个大模型模块的使用,如隐喻提取、翻译、术语整理和审校。为了充分发挥模型能力,提示词的设计至关重要。
未来方向
虽然目前的智能体已经能够运行,并且在中医古文翻译效率上显著优于人工,但我们的目标是开发一个能够翻译整本医学古文的产品。在这一目标下,仍有许多优化空间:
- 文本切割与处理:
在譬喻处理上,选择以句子还是段落为最小单位,各有优缺点,需要进一步权衡。
- 中医文本特征处理:
需要搭建处理其他特征的工作流,例如典故翻译、对仗翻译等,并分析具体特征。
- 翻译和审校上:
譬喻翻译上,对于多个譬喻类型句子,目前还没有好的解决方案,以及譬喻翻译后的整合,也缺乏策略,目前知识用大模型来做决策。
此外,还有一些值得探索的方向:
- 不同模型在不同任务上的性能表现:
探索模型的优越性,选择最适合的模型。
- 运行速度优化:
通过调整工作流或流程框架,提高运行效率。
- 用户友好性:
增加参数输出选项,提高智能体的可用性,例如术语导入、翻译风格设置等。
尽管还有许多待优化的地方,但基于目前的经验和探索方向,我们对后续的优化充满期待。希望最终能够开发出一个有助于中医翻译的产品,同时为其他类型翻译智能体的搭建提供参考经验。