全球最大心理数据集发布 助力AI心理咨询更专业、更安全

当智能终端成为人们疏解情绪的重要载体,AI心理咨询的专业性与安全性却始终面临行业拷问:它能否真正共情情绪低谷者的内心挣扎?给出的干预建议是否专业有效?11月18日,在第三届“一带一路”文化和科技融合发展大会分会场主题分享中,数字心理健康科技公司广东数业智能发布的全球规模最大心理领域专用数据集,为这两大核心难题提供了系统性解决方案,推动AI心理服务从“可用”向“可靠”跨越。

image.png

数据破局:给AI装上“心理诊疗知识库”

AI心理模型的成长逻辑,与心理治疗师的培养路径高度相似——既需扎实的理论功底,更需丰富的临床经验。然而长期以来,行业普遍面临“教材缺失”困境:公开的心理对话数据量少质杂,且缺乏专业标注;临床咨询记录因隐私保护无法大规模复用,导致AI模型如同“无米之炊”,难以实现从“听见”到“听懂”的质变。

数业智能的突破始于数据源头的创新。依托旗下产品数十万用户的授权数据,公司首先解决了真实案例的供给问题。更关键的是,通过组建由国内外顶尖心理专家、临床治疗师及AI算法工程师构成的跨学科团队,对原始对话数据进行了深度加工:剥离隐私信息后,按心理学理论框架进行结构化标注,将零散的咨询对话转化为包含情绪标签、干预策略、诊疗逻辑的标准化数据资产。

此次发布的两大核心数据集形成了测评+案例的双轮支撑。其中MMPsy多模态心理数据集堪称AI的“心理测评题库”,不仅覆盖抑郁、焦虑等常见心理问题的文本对话记录,更创新纳入语速变化、语调起伏、停顿频率等声音情绪特征——这些非语言信息往往是识别隐性心理危机的关键,能让AI有效地识别“强颜欢笑”“欲言又止”等复杂情绪。目前,该数据集已获人工智能顶会AAAI-2025收录,在学校社区筛查中实现85%的准确率,远超行业平均水平。助力香港大学、华南师范大学等高校开展青少年抑郁焦虑跟踪研究和银发人群心理孤独改善研究。

另一核心数据集CMDS认知行为疗法专用数据集,则像一部“临床案例全集”。作为全球首个聚焦CBT(认知行为疗法,国际主流心理治疗技术)的大规模数据集,它收录了数千个完整的专业咨询案例,详细标注了治疗师如何通过“识别自动思维-挑战认知偏差-重建行为模式”的逻辑链开展干预。当AI模型调用该数据集时,能模拟专业治疗师的诊疗思维,避免以往“鸡汤式回复”“模板化建议”的弊端。

image.png

标准立规:为AI设立“心理执业资格考”

如果说高质量数据集是AI心理模型的“教科书”,那么科学的评测体系就是确保其“执业合格”的“考官”。当前市场上的AI心理产品鱼龙混杂,部分产品仅凭通用对话模型微调就宣称具备“心理咨询能力”,却缺乏专业评估标准,可能因误判情绪、给出不当建议引发风险。

针对这一行业痛点,数业智能同步发布全球首个中文CBT大模型评测数据集CLTB,为AI心理模型设立了首个“行业资格考”。重点对业内关切的AI共情能力、干预准确性、伦理安全性、对话流畅度进行系统评估。对接这套评估体系,将更能确保未来服务于用户的AI心理咨询师,不仅是“能说会道”的,更是“专业可靠”的。

image.png

“我们相信,AI在心理健康领域的未来,不应建立在‘沙堆’之上。”数业智能创始人刘胜坤表示,“我们正在做的,就是为整个行业打下坚实的数据地基。我们希望这些努力,能让AI不再是冷冰冰的代码,而成为一个更值得信赖的、有温度的倾听者和支持者。”

相关文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注