研究人员在Ashley Madison的源代码中发现与男用户聊天的机器人

华盟学院山东省第二期线下学习计划

研究人员在Ashley Madison的源代码中发现与男用户聊天的机器人
 

  Ashley Madison是一家专门为已婚人士提供交友和约会服务的社交网站。黑客公开的Ashley Madison数据中有该公司的服务源代码,对源代码的分析发现了该公司创建数以万计机器人账号的证据。这些机器人账号主要是设计引诱男性用户。机器人账号多假扮成女性,目标对象是男性用户,它们发送了超过2000万条信息,与用户聊天了超过1100万次。

  自从知名婚外情网站Ashley Madison被黑客攻击并导致资料外泄之后,人们对于该网站究竟有多少真实女性用户的质疑就不曾间断过。 根据初步的统计数据,该网站超9成用户均为男性。不过,看起来那么多的女性用户,又是怎么凭空变出来的呢?

  上周,我对Ashley Madison的数据库以及私人邮件进行了分析和研究,我发现,Ashley Madison网站大约有一万两千多名真实的女性活跃用户。现在,在我对该公司网站的源代码进行了研究之后,我清楚地意识到,很多人对之前的现象有一些误解。因为根据我的分析,Ashley Madison制造了超过七万的女性机器人,它们会给数百万的男性用户发送虚假信息,这就使得这些男性用户会去幻想这个网站是一个有着大量女性的乐园。

  今天,Ashley Madison发表了一份声明,该公司在声明中表示,任何人都不可能从泄漏出来的数据中查明网站的活跃女性用户到底有多少。他们说的没错,但是Ashley Madison的女性活跃用户仍然可能是非常少的。在3700万注册用户中,只有550万的个人资料标注为女性。而在这所谓的550万女性用户中,几乎没有多少账号是活跃账号。

  我对Ashley Madison网站的源代码进行了详细的研究,我发现,该网站的女性机器人其实就是一种诈骗行为,它们十分的复杂,而且可以给网站带来丰厚的“收益”。从源代码中我们可以看到,该公司想通过这些女性机器人来制造一个该网站有着大量饥渴女性的假象。无论Ashley Madison中真实的女性活跃用户到底有多少,该公司的这种设计女性机器人来与网站男性用户互动的行为都是一种不择手段提高网站收益的行为。

  网站的源代码会从550多张数据表中引用相关数据,但是其中只有4张来源于Impact Team。当我第一次看到这些数据时,我还错误地认为我已经得到了几乎所有的数据表。正如我在上周所发表的文章中写到的那样,我咨询了两名数据分析专家,然后对数据库表中的三列进行了分析,这些数据项包括“bc_email_last_time”,”bc_chat_last_time”,以及”email_reply_last_time“。经过分析和研究之后,我认为在这三列数据中,那个带有用户姓名的列是网站用来追踪用户活动的,其中还有一列存储的是时间戳,也许是网站用来记录用户最后一次查看他们Ashley Madison信息的时间,或者是发起聊天的时间。当我看到男性用户与女性用户之间时间戳的差别之后,我可以断定,该网站的男性用户基本上都在与机器人进行互动,而女性用户基本不会与任何人通过电子邮件进行交流。

  这也就意味着,在Impact Team所泄漏出来的Ashley Madison数据库数据中,并没有人类活动的相关数据。我们能看到的就是机器人在和人类聊天。换句话说,这一切都是Ashley Madison网站所制造出来的假象,因为该网站的软件开发人员能够“训练”这些女性机器人来与男性用户进行交流。

  在涉及到实际活动时,根据我们对Ashley Madison的付费站内信系统的分析,大约有2000万男性用户会检查他们的收件箱,但女性用户竟然只有1492。

研究人员在Ashley

  聊天系统的“女性”活跃度要稍高一些,但结果依然没有好到哪去。Ashley Madison的聊天系统需要30点的积分才能使用,而100次的起始打包售价为$49美元。

  数据显示,该网站有1100万男性用户使用了该聊天系统,但女性用户仍然只有2409名。

研究人员在Ashley

  有两名勇敢的研究人员告诉了我这些数据表列到底是用来干嘛的。软件开发者Jake Perkowski以及Gizmodo的评论员Mr.Falcon都仔细阅读了源代码,并且发现了这些名为“engagers”的机器人,它们可以与人类进行交谈。

  除此之外,Perkowski还向我指出,在网站数据库的表中,还有一个名为“ishost”的列。他说:“当ishost被设置为1时,就意味着这一成员就是一个机器人。在对源代码进行了一次快速检索之后,研究人员发现,在所有机器人所使用的账号中,ishost的值都是1。

研究人员在Ashley

  如果要对这上千行的源代码进行整理,那肯定不是一件容易的事情,但是我们可以通过两个办法来加速这一进程。其中一个就是使用一个简单却功能强大的搜索程序,该软件名为“grep”,它可以在任意一段代码中搜索你需要查找的关键字。另一个方法就是通过对软件工程师的个人习惯来查找相应功能的代码,因为开发人员在进行软件编码的过程中,都会对代码添加注释。在grep的帮助下,我就可以在注释或者源代码中查找任意一段关键代码了。

  在我将第一篇关于Ashley Madison泄漏数据的文章发表出来之后,我收到了大量的电子邮件,该网站的用户通过电子邮件将他们在使用该网站服务的经历告诉了我。有些人十分同意我的观点,即这个网站实际上就是一个性机器人农场。但是很多女人却表示,她们已经使用这个网站很多年了,并且也十分享受这一过程。

  很多女人会建议我去对该网站的“女人寻找女人”功能的数据库和源代码进行研究,并弄清楚这一机制是如何工作的。而且现在有很多的女性会和男性结婚,然后又去找其他的女性作为婚外恋的对象。所以我决定采纳她们的建议,因为现在已经很明显了,该网站的女性活跃用户数量越来越多了,而且数量远远地超出了我的预期。

  我发现,在该网站的数据库中,有七十七万多条与“女人寻找女人”有关的记录,其中没有任何一条记录是与机器人有关的。这占到了该网站用户寻找数量的14%,而女性同性恋的人数只占美国总人口的1.5%(双性恋的人口数量大约占美国总人口的0.9%)。也许这些账号并不是活跃账号,但是她们也肯定不是Ashley Madison的“engagers”。如果这些账号的拥有者都是真正的女人,她们肯定不会收到机器人发来的信息。因为机器人是不会与女性用户互动的。

  总而言之,Ashley Madison就是个充满了男性用户和女性机器人的地方。如果想要真的找到一个“女性”互动,而且对方还是“大活人”,那简直无异于大海捞针。

www.idc126.com

原文地址:https://news.77169.com/HTML/20150904142039.shtm

0

发表评论