麻省理工学院的抑郁症检测AI,让我们共同期待

麻省理工学院的抑郁症检测AI,人工智能的一大进步。

麻省理工学院(MIT)的研究人员最近开发了一种神经网络,以相对较高的准确度预测一个人患有认知功能障碍的可能性。如果你不介意松散地说话,你可以把它称为抑郁症检测器。

该团队由麻省理工学院的研究人员Tuka Alhanai,Mohammad Ghassemi和James Glass组成,他们本周将在印度的Interspeech 2018会议上展示他们的作品。

根据他们的论文,他们开发了一种无上下文的方法,通过该方法,机器可以分解人类的文本或音频,并指定表示该人的抑郁程度的分数。关键的是这个AI的“无上下文”方面。

治疗师通常使用经过验证的问题和直接观察相结合来诊断抑郁症等精神健康状况。根据麻省理工学院的说法团队,他们的AI可以做类似的事情而不需要条件问题或直接观察。它不需要上下文,只需要数据。

这是麻省理工学院论文新闻稿中的一段:

麻省理工学院的研究人员详细介绍了一种神经网络模型,该模型可以通过访谈对原始文本和音频数据进行释放,以发现指示抑郁症的语音模式。给定一个新主题,它可以准确地预测个体是否抑郁,而不需要任何其他有关问题和答案的信息。

它是检测还是预测?

这可能是一个小狡辩,但检测和预测是两个完全不同的事情。预测人是否被抑郁的算法仅仅是标记数据以供人进一步审查。检测抑郁症的人必须确定并确认一个人实际上是抑郁症。当然,研究人员意识到了这一点。该论文的主要作者Tuka Alhanai说:“这不是一次检测抑郁症,而是根据言语中的日常信号,如果有人有认知障碍,这是一个类似的评估概念。这是预测,绝对不会检测。而这种微小的区别就是为什么这项工作非常非常可怕。

为了测试他们的人工智能,研究人员进行了一项实验,其中142名接受抑郁症筛查的人回答了由人控虚拟代理人提出的一系列问题。AI没有事先了解问题,受访者可以自由地回答他们想要的任何方式。没有A,B,C,D可供选择,AI从语言线索中辨别抑郁症。

研究参与者的回答以文本和音频的形式记录。在文本版本中,AI能够在大约七个问答序列之后预测抑郁症。但是,有趣的是,在音频版本中,AI需要大约30个序列才能做出决定。据研究人员称,它的平均准确度是惊人的77%。没有理由相信任何直接与物理世界的医疗保健患者接触的人都会使用它。

在办公室看病人的治疗师往往认为他们已经接受过比算法更好的诊断患者的培训。这个人工智能与使用图像识别检测癌症不同。您可以在身体上找到并清除癌症(在许多情况下),但您无法使用手术刀验证AI的抑郁症诊断。

在一个游戏中,理论上,一台计算机和一个人听同一个对话并最终做出截然相反的抑郁症诊断,谁决定哪个是正确的?或者,如果您愿意,在计算机识别潜在抑郁症的情况下,人类是否也进行相同检查以确保医生不治疗患者算法错误?因为那是多余和浪费的。自动化在哪里?

更重要的是,当医疗专业人员以外的人使用按钮“抑郁症检测器”时会发生什么?本文中的某些语言似乎表明这些算法是为了在麻省理工学院实验室之外使用而开发的:

患有抑郁症的人被数周至数年的衰弱悲伤所困扰。要治疗抑郁症患者,必须首先进行诊断。为了获得诊断,抑郁的个体必须积极地接触心理健康专业人员。实际上,由于移动性,成本和动机的限制,抑郁症可能难以获得专业关注。人类交流的被动自动监测可以解决这些限制并提供更好的抑郁症筛查。

对人类通信的被动自动监控听起来像是我们梦魇的反乌托邦未来。有许多可以想象的社交和专业环境,一个人可以在不知道他们的心理健康的情况下接受问答顺序,以后可以通过机器进行评估。在神经网络的黑匣子内进行的未经同意的心理健康评估似乎是一个坏主意。

想象一下,因为一家公司使用“抑郁症检测器”AI来确定你在面试过程中心理上不够稳定,或者算法解释你对律师的问题的答案在你的孩子监护案中是可以接受的,所以会失去工作。

更糟糕的是,考虑一个警察局实施黑匣子AI以确定嫌疑人在审讯过程中的精神状态。让我们不要忘记,世界各地的警察单位浪费了纳税人的钱和浪漫的宝贵时间,如心理学,人工智能据称“检测”情绪状态似乎是一个进步。

可想而知 - 但也感觉已成定局 - 这种类型的东西会出现在审讯室,就业面试和其他不属于的地方。但我们不能让人们被人工智能所困扰:机器绝对不知道我们是不是同性恋内疚或沮丧,他们只是在猜测。我们应该非常小心地允许他们使用他们的猜测。

原文作者:TRISTAN GREENE

翻译不易,转载注名