大咖分享

大数据应用能识别抑郁风险人群?准确率这么高!
北大青鸟总部

摘要:全世界每年有约80万人自杀身亡,厌世已经成为不容忽视的公共健康问题。但是大多数人(甚至包括医生)都难以识别自杀高风险人群的特征。大数据和人工智能时代的到来,让自杀预测有了质的飞越。

你关注过吗

据统计,全世界每年有约80万人自杀身亡,厌世已经成为不容忽视的公共健康问题。但是大多数人(甚至包括医生)都难以识别自杀高风险人群的特征。大数据和人工智能时代的到来,让自杀预测有了质的飞越。

来自美国范德堡大学的数据科学家 Colin Walsh 就带领团队,开发出一种可以预测个人自杀可能性的机器学习算法。试验结果表明,其预测一个人是否会在未来两年内自杀的准确率为80-90%,而预测一个人是否会在一周内自杀的准确率为92%



该团队对当地病人的年龄、性别、用药和病历等进行大数据分析,筛选出有过自杀/自残倾向的患者数据,使用该数据训练算法,使其获得鉴别潜在自杀风险的能力。


你知道褪黑素吗

在此之前,很多导致自杀的重要因素从来无人重视, Colin Walsh团队采用大数据技术,发现对睡眠极有帮助的褪黑激素与自杀倾向有强关联性。服用褪黑素的人群,可能存在失眠的情况,他们有较强的自杀风险,因此该团队将患者服用褪黑素,用作了有自杀倾向的新依据。



具有完整的病历数据可以预测,那没有主动就医又有自杀高风险的人群,如何利用算法进行预测呢?

研究数据显示,有 60-90% 的自杀者,在自杀前一年都有就医经历,只不过由于医生/患者没有意识到,才导致了悲剧的发生。

为了让算法能够在更大范围内发挥作用,Colin Walsh团队使用这套机器学习算法,正在构建一套自杀风险评分系统,系统可以给每个人“跑分”。Colin Walsh团队使用这套机器学习算法,正在构建一套自杀风险评分系统,系统可以给每个人“跑分”,如果这套系统建立成功,无论患者因为什么原因看病,系统都能自动完成自杀风险评估,甚至可以在患者本人意识到问题之前就将风险警报发送给医生,这样就可以及时采取心理疏导等措施。



如果说具有完善就医数据的人群可以享受这一“福利”,那么没有推行电子病历、缺乏患者数据或者医疗记录不完善的地区,又如何享受科技带来的便利呢?

缺乏必要的医疗数据支撑,从原有数据入手就行不通了。技术专家们将目光投向了用户使用数据更为广泛的互联网。


技术改变生活

最近,谷歌就与自杀援助非营利组织Trevor Project开展合作,希望能使用算法第一时间识别自杀风险人群,并进行干预。当用户搜索自杀方法等相关的关键词时,谷歌会突出显示全美预防自杀生命线(National Suicide Prevention Lifeline)的电话。



但这绝不是万无一失的方法。谷歌无法编辑具体的网页,只能展示搜索结果,这意味着当有人想找自杀方法时,他可以很轻易地通过链接、论坛等方式找到,也许并不需要借助搜索引擎的检索。针对这一情况,谷歌从正在寻求帮助的人群入手,让预防自杀更有针对性。

今年5月,谷歌向非营利组织Trevor Project捐款150万美元,Trevor Project通过电话热线、短信服务和即时通讯平台向青少年提供心理咨询。该项目的领导者希望通过机器学习自动评估来信者的自杀风险,随着对大数据和人工智能的开发,能够通过分析来电者对第一个问题的回答,识别出自杀风险高的来电者,并立即把这个电话转接给人工咨询师。



加拿大和英国的公共卫生计划则通过挖掘社交媒体数据来预测自杀风险。在Facebook,一旦算法检测到视频中出现自残或暴力行为,就会迅速标记该直播视频,发送给警方。

不管是范德堡大学采用的大数据技术,还是谷歌搜索引擎关键词识别、即时咨询评估,还是政府领域的数据挖掘,自杀行为预测的核心均在于大数据和人工智能的发展和应用。而正是因为这些新技术的发展,对人类行为预测才具备了可能性。



相信随着大数据、机器学习等一系列新技术的应用,人类可以更准确、及时地干预自杀行为,让悲剧不再上演。

毕竟,美好的生命,只有一次。


相关阅读
又快又好用的数据分析工具ApacheKylin来了!
我们是如何被大数据杀熟的?
大数据时代,我们如何选OLAP数据分析引擎
​如何从0到1搭建数据仓库?轻量级数据分析必备
阿里、亚马逊、微软等云厂商纷纷在做的数据湖到底是什么?
热门推荐