eBay人工智能可识别出四成的信用卡欺诈
近日,eBay的工作人员发布文章称,eBay运用新技术可识别出四成的信用卡欺诈。 在美国,信用卡欺诈比你想象的更常见。2014年的1760万起身份盗窃案件中,86%的受害者报告了与现有信用卡或银行账户有关的欺诈行为。事实上,美国联邦贸易委员会表示,信用卡欺诈是美国最常见的身份盗用形式,每年报告的案件超过130,000起。 自动检测可疑用卡模式的方法并不是什么新鲜事,但eBay的研究人员在Arxiv.org上发表的一篇新论文(《电子商务中的信用卡欺诈检测:异常检测方法》)中描述了一种尖端技术。他们使用了一种经过训练的算法来识别与交易和支付有关的“良好行为”,并标记出异常行为。
研究人员写道:“欺诈和垃圾邮件检测等任务的挑战通常在于缺乏培养合适的监督学习模型所需的所有模式。如果这些模式还随着时间而变化,问题就会更加突出……有限的数据和不断变化的模式使得学习变得非常困难。我们假设良好行为不随时间变化,表示良好行为的数据点在不同分组下具有一致性。”
研究人员利用聚类方法——用于识别数据集中类似对象组的方法来使用不同的参数。在每次训练运行中将每个数据点分配给一个集群,并对该集群产生数学表示(矢量),以构成数据点的不同“指纹”,组合成它的唯一签名。 为了生成表示“良好行为”(即一致性)的签名,团队将每个数据点向量组合在一起,并根据相应集群的大小对其进行加权,得到0到1之间的一个分数。低一致性——得分接近0——就对应着异常行为。 与传统人工智能欺诈检测相比,这种方法有几个优点。它不需要事先了解异常值或内点;基础算法都是高度可扩展的并且是通用的;它几乎可以应用于任何聚类问题,包括医学领域的问题。
该团队使用了数据科学平台Kaggle公开的信用卡数据库来测试他们的方法,这一数据集包含了2013年9月份欧洲信用卡持有人在两天内的交易数据,总共有284,807笔交易样本,其中有492个欺诈样本。在运行了十次之后,该算法能够识别出40%的欺诈案例。结果并不完美,它误判了29笔合法交易——但是考虑到数据点的数量巨大,这是一个“巨大的收获”。
“我们的技术非常有用, 我们可以再284,807个样本中安全地排除139,220笔交易。”研究人员表示,它在电子商务平台识别欺诈交易方面非常成功,但是由于数据集的保密性,报告中无法列出这些结果。
如果这中最新算法能够完善普及,人们的信用卡交易就会变得更安全。