迈向认知共情,华南理工团队全面开源心思咨询师数字孪生大模型SoulChat2.0
自2023年5月发布SoulChat以来,华南理工大学数字孪生人试验室经过对实在国际心思咨询言语风格、心思咨询技能等方面的深化探究,在心思咨询师数字孪生建模才能上取得了显着提高。
ChatGPT诞生以来,国内外已有很多的作业将大模型(LLM)使用于情感陪护、心思健康支撑对话、心思咨询对话范畴,例如SoulChat、MeChat、QiaoBan、CPsyCoun、MindChat、EmoLLM等等。可是,过往的作业聚集于凭借精心设计的提示词来构建多轮心思健康对话数据集,微调出的“心思健康大模型”很简单形成答复的同质化、模板化,使得这些LLMs难以应对复杂多变的来访者,无法很好模仿实际国际实在心思咨询师的言语表达与疗法技能运用风格。
针对上述问题,华南理工大学未来技能学院-广东省数字孪生人要点试验室在灵心大模型(SoulChat1.0)基础上,推出了心思咨询师数字孪生大模型SoulChat2.0。SoulChat2.0初次界说了特定心思咨询师的数字孪生(PsyDT, Psychological consultant Digital Twin)使命:
也便是,给定特定心思咨询师的N个咨询事例CN(如图 3所示),心思咨询技能常识库KBthe.,以及用于辅佐构建数据集的单轮对话咨询数据库Dst,使命要求树立一个能够模仿该咨询师言语风格与咨询技能的模型fLLM(*)。
一、研讨内容。
如图 1所示,心思咨询师数字孪生大模型SoulChat2.0包括2个部分:(1)心思咨询师数字孪生数据生成;(2)心思咨询师数字孪生建模。
图 1心思咨询师数字孪生数据生成结构。
(1)心思咨询师数字孪生数据生成。
要完成特定的心思咨询师的数字孪生,条件是能获取该心思咨询师的很多咨询事例,可是这关于心思咨询师个别而言,难度极大。一方面,需求考虑心思咨询的道德要求和隐私维护,另一方面,数据的收集也十分繁琐。为此,有必要树立一种仅需少数咨询事例的心思咨询师数字孪生数据生成结构。如图 3所示,心思咨询师的每个咨询事例都表现了自己的言语风格与咨询技能使用办法,这能够凭借于现有的先进的LLMs的言语总结才能去提取。如图 2所示,为GPT-4关于心思咨询师的“人际联系”论题的实在咨询事例进行言语风格特色提取的成果。另一方面,能够经过心思咨询师的多个咨询事例归纳该心思咨询师倾向的咨询疗法技能门户(本项目试验傍边的心思咨询师咨询门户倾向为“理情行为疗法”),并从心思咨询技能常识库KBthe.傍边查询该咨询技能的常识与战略(Therapeutic Strategy),以辅导数据生成,提高其间的疗法专业性。一起,为了确保生成的数据傍边来访者的多样性与实在性,需求尽可能建模用户的特性特质,咱们以常用的大五品格为参阅,对单轮对话咨询数据库中的来访者进行了大五品格剖析。终究,经过归纳实在国际咨询师的言语风格、咨询技能、来访者大五品格,结合实在国际咨询事例,关于单轮对话进行心思咨询师数字孪生数据生成。采纳咱们的结构生成的多轮对话数据,能有用表征特定心思咨询师的言语风格与咨询技能使用办法。为了归纳考虑本钱与作用,咱们设定了用于心思咨询师数字孪生数据生成的单轮对话咨询数据库的规划为5000个,特定心思咨询师的咨询事例数目设定为12个(为确保低本钱,一般不多于20个)。终究,只需求给定恣意心思咨询师的少数咨询事例,咱们的结构即可快速生成批量用于该心思咨询师数字孪生建模的咨询事例。在本项目傍边,对实在心思咨询师进行数字孪生生成的多轮对话数据的总次序为90365轮,均匀每个对话样本18轮。
图 2 GPT-4对实在咨询事例的言语风格特色归纳示例(论题:人际联系)。
图 3 特定心思咨询师的实在咨询事例片段截取(论题:人际联系)。
咱们对不同的数据构建办法生成的数据进行人工评价发现,比较于Smile和SoulChat1.0,SoulChat2.0提出的数据生成办法(PsyDT_Prompt),几乎在一切论题上都能很好地构建高质量的数字孪生数据。
图 4不同的数据生成办法构建的数据与给定咨询师事例的咨询技能一致性比较。
一起,咱们在表 1所示说话技能(发问打听、反应与总结、问题解决和辅导)、状况与情绪(开放性和价值中立、情感操控)、联系树立、疗法技能使用4个专业维度上对SMILECHAT、SoulChatCorpus、CPsyCounD以及咱们树立的PsyDTCorpus进行了对话全体等级的人工评价比较,成果见图 4。PsyDTCorpus相关于其他几个数据集,在说话技能、状况与情绪、联系树立、疗法技能这四个方面均有显着的提高,这表明使用实在国际心思咨询师的少数咨询事例来诱导构建高质量的多轮心思健康对话数据是可行的。
表 1 专业性评价方针。
图 5不同数据会集的咨询师回复的专业性剖析。
(2)心思咨询师数字孪生建模。
给定用于心思咨询师数字孪生建模的咨询事例数据,能够经过微调来完成对该咨询师的数字孪生。为了便利研讨社区进行比照和复现,咱们选用Llama3-8B-Instruct作为基座模型,在PsyDTCorpus的练习集上进行全量微调3个epoches。而且与ChatGPT、GPT-4为代表的闭源模型,Baichuan2-7B-Chat 、GLM4-9B-Chat、Meta-Llama3-8B-Instruct等7个模型为代表的开源模型,以及MeChat、PsyChat、SoulChat1.0、MindChat、EmoLLM、CPsyCounX 6个心思健康范畴的大模型在PsyDTCorpus的测验集进行自动化比照剖析。特别地,咱们对MeChat、PsyChat、SoulChat1.0、MindChat、EmoLLM、CPsyCounX以及所提出的SoulChat2.0在说话技能、状况与情绪、情感共情、认知共情、安全性五个维度进行次序的比照评价。这7个心思健康大模型在安全性维度上都获得了很高的评分,表明晰这些经过微调的范畴大模型在安全维度上现已很好地对齐人类方针。可是,在认知共情、会话技能、状况与情绪三个维度上,SoulChat2.0相关于其他模型均有较大起伏的提高。这表明晰经过心思咨询师数字孪生建模的办法,能很好地提高LLMs的实在心思咨询功能。
图 6 SoulChat2.0的使用示例。
二、总结与展望。
SoulChat2.0的推出,将为心思健康大模型范畴带来新的研讨思路:经过少数的实在咨询事例去进行心思咨询师数字孪生建模的办法,能够低本钱、快速、高效地构建具有特定心思咨询师言语风格与疗法技能的心思健康大模型,在说话技能、状况与情绪、情感共情、认知共情方面均有显着的功能提高,能很好地辅佐实在国际心思咨询师打开心思咨询作业,例如履行这些咨询师的前置说话,二十四小时的在线服务等等。
该项研讨的大模型与微调数据现已全面在Github和ModelScope开源。
试验室协作:华南理工大学 邢晓芬教师。
作者:陈艺荣。
内容来源:https://sh.tanphatexpress.com.vn/app-1/lô kep mb,http://chatbotjud-teste.saude.mg.gov.br/app-1/goblins-cave-slots
(责任编辑:女性)