金证资产评估初步完成基于大语言模型的内部知识库部署
近年来,随着生成式预训练模型的横空出世(GPT,Generative Pre-trained Transformer),特别是以ChatGPT为首的成熟产品的应用,机器学习的发展跨越了一个新的里程碑。AI技术在自然语言处理方面已经初具生产力,能够在日常办公中完成一些相对机械和简单的工作任务。
金证资产评估对新兴技术的发展和运用始终保持高度关注,在成本效益匹配的前提下,一直以来都是行业内信息化建设的积极探索者。金证资产评估希望通过技术引领,提升专业团队紧跟时代潮流的好奇心和年轻感,提高专业化效率和客户体验,同时也能够有效促进公司的发展和传承。
由于受到当前算力昂贵和部分模型闭源的影响,利用机器学习构建企业内部知识库是一个相对现实的实践方案。
自2017年以来,金证资产评估持续完善内部管理和质量控制,形成包括法人治理体系、质量控制体系、行政人事体系等公司各类管理文件以及内控提醒、内部培训、业务模板、信息系统更新记录等在内,共超过70万字的知识库储备,均以电子文档形式向全公司开放。
由于知识库内容较多、更新频率较快,极易造成信息泛滥,使得制度建设形同虚设,给公司管理带来负面影响。同时也不利于公司专业人员及时温习和精准定位公司管理及质量控制要求,不利于新入职员工迅速掌握职业化、专业化规则。
有鉴于此,公司于近日尝试使用机器学习构建内部知识库,旨在通过语料训练,使公司专业人员能够借助自然语言的问答方式,获得关于内部管理制度及质量控制要求的相对准确的自动回答。
语料训练模型基于LLM(Large Language Model),首批语料来源于公司完整的质量控制体系,约十余万字的文本内容。
经过初步测试,训练效果大致符合预期。
当然,与目前大多数LLM一样,模型并不能总是理解长文本的语义,其输出结果也经常出现答非所问的情况,但是作为初步部署先进生产工具的尝试,不失为一种有益的探索。
下一步,金证资产评估将继续开展内部知识库的训练,并在完全自力更生的基础上积极寻求部署机器学习与资产评估执业过程的深度整合,突破简单的问答式交互,更好地发挥前沿技术对行业迭代的辅助作用。