24小时联系电话:185 8888 888

科技
您现在的位置: 首页 > 科技 > Facebook的DEC AI在2年内发现了数亿个伪造帐户
  • “酷”大脑研究的扭曲观念扼杀了心理治疗

    “酷”大脑研究的扭曲观念扼杀了心理治疗

    发布时间:2020/03/31

      ‘对于人类的每一个问题,总是存在着众所周知的解决方案-简洁,合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且,不乏任何试图探究其深度的简洁,合理和错误的答案。 在我职业生...

  • SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    发布时间:2020/03/31

      美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船,用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本,将作为第一批从NASA获得...

  • Spaces应用程序使人们可以参加VR中的Zoom会议

    Spaces应用程序使人们可以参加VR中的Zoom会议

    发布时间:2020/03/30

      一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。 该应用是根据最近发生的COVID-19大流行而开发的,该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...

  • 汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    发布时间:2020/03/30

      总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案,该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言,如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法),...

Facebook的DEC AI在2年内发现了数亿个伪造帐户

发布时间:2019/12/16 科技 浏览次数:724

 
Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)经常喜欢断言,人工智能已经大大减少了数百万用户的滥用行为,而且他没有错-在其最新的《社区标准执行报告》中,Facebook表示,在2001年至2009年期间,该公司删除了超过32亿个虚假帐户4月和9月,去年同期为15亿多。增长的至少一部分归因于称为深度实体分类(DEC)的机器学习框架,Facebook在10月的2019 Scale会议期间首次详细介绍了该框架。
DEC自部署以来的两年内,使平台上的滥用帐户减少了20%,具体而言,这相当于“亿万个”帐户。 Facebook软件工程师Sara Khodeir说,更简单的模型用于在注册时检测数百万个帐户,但是DEC在挑战案例中表现出色。
据Khodeir称,它旨在解决Facebook在其传统的自动伪造帐户检测方法中遇到的问题。从历史上看,团队会确定一组功能(例如帐户的年龄,朋友数量和位置),并分别将其标记为“滥用”或“良性”数据,以用于训练帐户分类器模型。由于功能是由工程师手写的,因此功能空间相对较小,从而使攻击者更容易怀疑。最终,这些攻击者开始使用游戏的特定功能-例如,等到帐户到期后再使用它们发布有害内容。
相反,DEC通过汇总社交图中其他相关帐户的行为特征属性来提取帐户的“深层特征”。它本质上是递归的,每个帐户拥有超过20,000个功能,而不是几十个或数百个。它使用多阶段,多任务学习技术,该技术使用大量的低精度自动生成的标签与少量的高精度人工提供的标签,从而减少了训练前所需的注释工作。
DEC首先考虑实体类型的帐户直接特征,例如年龄和性别(用户实体),支持者数量和类别(页面),成员数量(组),操作系统(设备)以及国家和声誉(IP地址)散布到与该帐户进行交互的其他实体,例如页面,管理员,组成员,共享设备的用户,共享到的组以及注册的帐户。提取特征后,在进行一阶和二阶扇出结果之前,将数字(例如,平均好友组数)和分类(例如,最常见类别的百分比)应用于聚合实体汇总在一起。
该方法已使用三种不同的模型以及来自Facebook的大量生产数据进行了验证-一种仅具有直接特征的行为模型,具有数万种特征的DEC模型以及具有更大语料库的更复杂的DEC。结果表明,虽然基本行为模型无法预测出准确率超过95%的伪造帐户,但两种基于DEC的模型都超过了这一点,并且发现了更多的伪造帐户。
Khodeir说:“在DEC投入生产的过去几年中,我们看到平台上[滥用]帐户的数量已逐步减少。” “即使攻击者的数量增加了,DEC的捕获量也几乎相同。”
DEC只是Facebook积极使用的一种自动技术,可用来打击其平台上的虚假帐户和滥用行为。另一个是与语言无关的AI模型,该模型在30个方言族中使用93种语言进行了训练;它与其他分类器一起使用,可以一次解决多种语言问题。在等式的视频方面,Facebook表示,其显着的采样器模型-快速浏览视频并处理上传剪辑的“重要”部分-使它能够识别6500万个视频中的10,000多种不同的动作。
Facebook正在广泛地转向一种称为自我监督学习的AI训练技术,该技术将未标记的数据与少量标记的数据结合使用,以提高学习准确性。在一个实验中,其研究人员能够训练一种语言理解模型,该模型仅需80个小时的数据即可做出更精确的预测,而人工标记的数据只有12,000个小时。
在今年早些时候的Facebook F8开发者大会上,Facebook AI总监Manohar Paluri说,像AI这样的AI模型被用来保护印度选举的完整性,在印度这个国家人们会说22种不同的语言,并用13种不同的文字书写。他说:“这种自我监督技术正在多种模式下工作,包括文本,语言,计算机视觉视频和语音。”