当期位置 :
  • 关于创蓝
  • 动态列表
  • 动态详情

一条微博1亿转发,这些刷量造假的数据是怎么来的?

发布时间 : 2019-06-17 01:52:38 来源 : 创蓝253

6月11日上午,#1亿转发量幕后推手被端#登上微博热搜榜,这缘由于“半月谈”发布的一篇文章,名为《“星援”被查!透视“一亿转发”背后的粉丝文化病》,揭示了粉丝为了榜单利用刷量app花钱给自己爱豆刷转发量的内幕。

星援app.png




据悉,“1亿转发量”的虚假数据涉案应用——“星援App”的制作人,因涉嫌破坏计算机信息系统罪,已被北京警方刑事拘留。



“刷量”App不到一年获利800万

在2018年,某明星的一条宣传新歌视频的微博,在短时间内就获得了超过一亿次的转发。以目前中国微博总用户数3.37亿人的比例来看,几乎相当于每三名微博用户当中,就有一人转发了这条内容。

这种异常的转发数据引起了网友的激烈讨论,同时有关明星账号微博数据造假的问题和其背后的黑色产业链,也引发了社会的关注。

跟据新浪微博的表示,2018年初,微博在日常监控工作中发现了大量异常违规行为,经过技术回溯和对比后,确认批量转发行为是通过星援App操作。

2018年11月,基于前期证据的搜集和整理,微博就星援App刷量一事向北京市公安局报案。2018年12月,北京市公安机关开展侦查取证工作。2019年3月初,专案抓捕组将星援App制作者抓获。

星援App是一款模拟微博客户端,通过破解微博加密算法实现批量转发微博内容的应用软件。该软件在收取用户费用之后,能够对特定用户和博文进行批量转发操作。这种转发刷量行为严重干扰了微博正常的舆论生态,也对用户账号安全产生威胁。

这也意味着,借助星援App,一条微博转发量的多少主要取决于愿意花多少钱,而这也促成了微博上出现了单条微博1亿次转发的“惊人现象”。

1亿转发.png


据《半月谈》杂志,办案民警韩翰表示,这款App在粉丝圈内使用极为广泛,用于短时间内刷高评论量、转发量、点赞量。涉案app只有四人在运营,目前不到一年的时间就非法获利近800万元。”

据相关报道资料显示,在某电商平台上,输入新浪微博的名称后,系统优先给了大量帮助用户涨粉丝或是数据增量的业务选项。10元钱的基本套餐,就能买到400个粉丝,或可以转发指定微博100次。还可根据需求,实现粉丝活跃程度和地域真实性的专门订制。卖家称有很多艺人和网红都来找他们购买过。

同样的,除了微博以外,数据造假还出现在很多行业,例如影视播放行业,曾经在某电商网站上,商家出售的单部电视剧刷1万播放量的成本低至5块钱,并且根据不同平台不同规则还设有不同的定价。

eac4b74543a98226deef699d0ad74e054a90eb3c.jpeg


此次“1亿转发量”事件中,利用“星援”App刷流量的行为在粉丝圈内被称为“轮博”。据新浪微博安全团队负责人介绍,2018年5月起,微博发现“星援APP”后开始收集证据,准备报案。为配合警方收集证据,没有对“星援”实施明显的管控措施。“微博面临的困难是实名制问题,大量虚拟运营商号段被用于非实名注册。”该负责人说。作为应对“轮博”方式,新浪微博已经将转发、评论量设置成“100万+”的显示上限。

 

“星援”背后的刷量黑链

“星援”APP事件仅为数据造假黑色产业链的冰山一角,其中很多“资深”的刷量平台甚至可以仅凭纯技术手段来实现批量复制。

从宏观角度来看,微博刷量属于数据造假的一种。刷量平台的系统能够模仿人工做出各种操作,如点赞、转发、评论、投票等行为。

明星找人刷量.jpg

数据造假公司的作业流程包含技术系统、核心资源和业务系统。其中,业务系统是对接其客户的业务需求。

所谓技术系统,其核心能力就是通过一台电脑,模拟出成千上万台看起来真实的手机,然后操作这些模拟的手机执行各种刷单刷量任务。

当你使用一台手机的时候,点击手机里的APP,很多APP会读取Android操作系统的底层数据,将手机标识数据包括IMEI号、品牌、Wi-Fi等传回App的服务器,告知有一台手机正在激活和使用App,服务器响应并回传应用数据。

APP获取的数据参数包括 IMEI、ISI、Mac地址、区域经纬度坐标、手机串号、安卓ID号、手机号码、品牌、信号、SSID、路由、Wi-Fi、IP。“刷量”技术系统可以自由控制手机唯一标识,使得每一次操作就像是来自真实的用户行为。

所以,在自动化刷量平台的“工作间”,时常会呈现出如下壮观景象:


图片1.png

实现上述设想,技术系统会将成功改造后的Android底层系统分为四大块:

执行单元——用一台手机模拟上几十万到上百万台手机。

数据库模块——通过机器生成或者通过资源获取需要模拟的手机参数,包括IMEI号、Wi-Fi、IP和手机号。

应用模块——操作脚本,指挥上百万台模拟的手机在目标应用上进行操作不同行为,包括登陆、点赞、阅读、打赏等。

调度模块——对大量手机进行批量控制,注册时间、操作时限以及刷的量等都可进行预制,以此对抗各大平台的反欺诈系统。

可见,数据造假的背后其实有着专业且又强大的技术作为支撑,对于只以手机底层数据为参考的反欺诈系统而言,很难去分辨这些数据流量是真实的还是机器模拟的。这种用强大技术模拟的造假流量,显然比“星援”APP更加高级。


对抗数据造假,需要更高级更复杂的技术

在“流量为王”还没有被终结的时代,为了流量、为了排名等进行数据造假已形成了各行业常见的现象,这也是风险控制存在的意义。对于利用数据造假、软件群控模拟正常用户来达到欺诈的行为,已经不能从简单的技术、单一的维度以及单独的企业来实现。

要在技术上实现防造假这一风控能力对于很多风控企业来说亦是一种考验,首先需要多维度的海量数据作为支撑,其次是数据算法的不断精进,从而更加精准地完成用户画像,在用户在企业平台产生注册登陆、转发评论、播放投票等行为时能够更加迅速精确的返回结果,从而阻止虚假模拟的造假用户完成这些操作,或者将这些操作忽略不展示出来。

在防数据造假的安全风控方面,创蓝万数目前已经通过本地库、运营商数据和其他第三方数据等数据源实现了对用户的多层次多维度画像及识别,这些维度数据包括手机底层数据、手机号码流量使用和通话时间数据、购物行为、支付行为等,确保能够准确的分辨出真实用户和软件模拟的虚假用户,帮助企业识别假流量假数据。同时该全景风控产品可以实现毫秒级别的即时反应,从而实现在注册登录阶段就可以完成风控的目的,将虚假用户拒之门外。

微信图片_20190613190222.jpg



警示与借鉴

对于此次刷量案件,新浪微博表示其内部已经成立了专门的安全委员会,覆盖产品、技术、运营、客服等多个部门,全方位打击违规刷量行为,微博的相关数据也改为了最多为“100+”的显示上限。


微博回应.jpeg


除此之外,在防止数据造假上,各行业平台大多都采取了相应的措施:例如爱奇艺去年宣布关闭全站前台播放量显示;虎牙斗鱼等直播平台将观看人数改为“热度”显示;还有最近的新浪微博等等

此次“星援案”上热搜,体现了目前社会公众对明星虚假流量事件的关切。同时此案将对互联网行业后续的类似案例也提供了参考,具有风向标意义,这不仅警示着从事互联网行业的企业要做好风控手段,也对从事互联网黑灰色产业的人员产生了长久的震慑力。