虚假账号不断进化,AI能做的还是有限

你的社交平台拥有多少个粉丝?

一千?一万?还是更多?你知道其中存在多少个“僵尸粉”吗?

虚假账号不断进化,AI能做的还是有限

近日,据美国权威科技媒体The Information引述研究机构Ghost Data的报告称,2015年,Instagram平台的僵尸账号占比为7.9%,到目前已经攀升至9.5%。Instagram的阅读用户已经增加到了十亿人。根据上述比例,Instagram平台上现在大约有9500万个僵尸账号。

有媒体评论指出,如此规模的“僵尸账号”,让Instagram成为下一个互联网行业打击假新闻、假信息和政客营销的重要阵地。

为什么这么说 ,恐怕得看看“网络水军”在近些年的“杰作”。 2017 年,至少有 18 个国家在选举中遭遇了线上操纵和虚假信息策略,包括德国联邦总统选举期间社交机器人活跃和垃圾新闻频出等。

显然,治理“网络水军”已成为全球难题。而由于其分散、量大兼具技术隐蔽性,对其的治理更需要讲究专业化和智能化。此时,人工智能也派上了用处。

道高一尺,魔高一丈,虚假账号与AI的斗智斗勇

从创建应用软件、官方网站或内容传播平台,到生产具有实质性内容的图像、视频或文字,通过或真或假或自动地与用户交互,虚假账号已经越来越“真实”。就在去年,有研究表明,连人工智能都可以被用来生成复杂的点评信息,而这些虚假的点评不仅机器无法检测出来,就连人类读者也分辨不出来。

虚假账号不再“虚假”,整个社交网站都面临着潜在却严重的冲击。智能相对论(aixdlun)分析师颜璇梳理了三种智能“鉴粉”方式,分别囊括了用户行为、内容和情感特征三种形式,试图解决这一问题。

首先是用户行为特征的分析。这种方式大多依托于爬虫技术,即通过主动爬取特定微博或者论坛的主体相关的注册行为、社交行为、转发与评论等行为 , 从而进行多维特征向量刻画。同时,有研究者还采用了隐马尔可夫模型来对用户行为进行建模,利用模型参数来对用户行为进识别和分类,毕竟“僵尸”掉进了“植物”里,总是有区别的。

这主要是利用账号之间的社会关系来识别那些“僵尸号”。而面对这种方式,水军们也“与时俱进”,比如一些职业差评师的账号在注册行为上就无懈可击,他们的账号一般会同时配备有身份证、用户手持证件照、实名手机号码卡、实名银行卡等,还能通过作弊软件骗过实名认证系统。即使是微博里的“僵尸粉”,也会存在一些粉丝关系。

第一种方式被“见招拆招”,AI也不得不拿出第二种方式,即对内容特征的分析。基于内容分析的识别技术主要从发帖内容本身切入 ,建立“僵尸粉”、恶意或者美化信息等本体模型, 同时建立敏感语义库,通过语言特征统计区分虚假账号。

但是,由于语义领域的不统一性,同一本体在不同领域,甚至同一领域都会存在很多象征意义的现状,比如用户在讨论某手机时,提到“这手机的上网速度真快”,“快”是一种夸赞,如果说“这手机耗电速度真快”,“快”又变成了一种批评。因此,内容特征模型在不同的情况、平台上都会有较大的变化,这也造成了AI分析内容特征进而识别“僵尸粉”的通用性较差的问题。

如此来看,基于单一特征对虚假账号进行识别还是比较困难的,因此,AI也不得不开始思考第三种方式。第三种方式源于第二种方式,即对内容中情感特征的分析。

有研究者通过分析推特内容中的情感,发现在线社交网络中的内容创建、传播与证券市场波动、期货商品价格及国家、社会重大事件之间有着紧密的联系。这也表明情感倾向是社交网站内容中的重要特征。

而水军也往往带有强烈的感情色彩(好评或差评),针对单个发帖的情感倾向性,AI可以设定一个阈值,若对某个主题发表的正面或者负面帖子比例超过设定阈值,,则认为该用户为水军。

但是,用于虚假账号监测的内容和情感特征的融合,属于比较明显的特征,而忽视了隐藏式的异常用户,比如用户上传与文字内容没有任何关系的图片, 抑或者用户评论情感与用户打分不匹配等新特征。

12下一页>

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2018-07-25
虚假账号不断进化,AI能做的还是有限
你的社交平台拥有多少个粉丝?一千?一万?还是更多?你知道其中存在多少个“僵尸粉”吗?近日,据美国权威科技媒体The Information引述研究机构Ghost Data的报告称,2015年,Inst

长按扫码 阅读全文