关键词:
大语言模型
词典编纂
人工智能
自动化
外来词
摘要:
大语言模型的出现对词典自动化编纂产生了重大影响。基于词向量和权重参数优化等基本原理,广东外语外贸大学词典学研究中心研发的“百年来欧美外来词语言资源平台”系统,引入大语言模型对外来词语料库等进行训练和调优,同时建立完善的人工审核机制,历时4000余小时生成3万余条外来词自动释义、溯源和例句。通过平台自有模型和ChatGPT对外来词释义准确率的对比实验,证明该编纂方法的有效性和可行性,发现持续更新数据库、加强文献研究、丰富专用语料库、强化人工检查,将对生成高质量释义产生较大影响。大语言模型较之传统手工编纂有碾压性优势,其应用将冲击现有电子词典形态,改变未来的词典查询行为。词典编纂专家与人工智能专家需要协同合作,对模型输出的内容进行质量控制。而版权问题也将转化为数据归属权问题,需要各方专家共同制定相关规则。大语言模型在汉语词典自动化编纂方面的应用潜力不应被低估,预计它还能被扩展至其他语言和专业领域的词典编纂中,进一步促进词典学领域的新突破。