网络安全内容管理

今天同事分享网络安全内容,涨知识。
网站内容非法内容是不允许发布,在特定的时间内部分特殊的内容也被禁止不能发布,禁布的文字和图片如何经过审核筛选。
首先,政策角度:违反政策的内容是严禁发布。
国家法律法规共十一条,具体如下:
(a)违反宪法确定的基本原则的。案例:法轮功
(b) 危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的。案例:六四事件
(c) 煽动分裂国家、破坏国家统一的;案例: 藏独
(d) 煽动民族仇恨、民族歧视,破坏民族团结的;案例:新疆7·5事件
(e) 捏造或者歪曲事实,散布谣言,扰乱社会秩序的案例:微博造谣
(f) 宣扬封建迷信、淫秽、色情、赌博、暴力、凶杀、恐怖,教唆犯罪的;
(g) 公然侮辱他人或者捏造事实诽谤他人的; 案例:网络诽谤
(h) 损害国家机关信誉的;案例:各种文字图片诋毁国家机关
(i) 煽动非法集会、结社、游行、示威、聚众扰乱社会秩序的;
(j) 以非法民间组织名义活动的;案例:传销
(k) 含有法律、行政法规禁止的其他内容的。案例:虚假中奖消息、网赚
其次,网站角度:网站的发展定位决定了网站信息的性质,因此决定了监管难度及监管重点。
百度贴吧、豆瓣、微博、博客、天涯等互联网信息平台,都有不同的信息审核机制。审核的内容包含图片和文字。
1、图片审核机制:一张待提取特征值图片存库,列为待审核(敏感图片)—-提取敏感图片信息置入数据库中,下次审核其他图片以此为依据进行审核。
图片敏感库生成流程:
图片敏感库生成流程
敏感图片检测过程:
敏感图片检测过程
2、文字审核机制
(一)后台关键词配置
后台关键词配置设有公用敏感词的配置,对应前端每一个频道和涉及文字内容栏目的分频配置过滤字词。并且对配置进行了详细的类别区分,如大类有“维稳类信息、色情低俗类信息、违禁品发布类信息、欺诈类信息”等等,二级分类如“维稳类信息”中会分为“民运类信息、法轮功相关信息、民族分裂类信息”等等。另就配置词的功能来划分,包含禁发词、审核词(含组合词)、观察词、忽略词这几部分功能各异的配置词。
1、禁发词:禁发词都为高危有害信息字词,对这类字词是禁止发布,并在前端给予警告性质官方提示;
2、审核词:审核词分为主词和副词。
主词的功能:发布信息包含设定敏感词,信息就会进入审核后台,并且设定的敏感词在审核后台信息中是高亮显示的,这样主要是方便审核人员进行快速精准的判断和审核;
副词的功能:副词主要是为了辅助主词,这一类词大多较为常见且词义本身正常,单独设定过滤势必影响过滤有害信息的精准度,所以在同一栏中设定若干主词,若干副词,发布信息必须含有一个及一个以上主词,同时包含副词才会入审核后台;如果发布信息只含有副词则不进入审核后台;
副词的设置更多是为了组合词的有效运用,某些特定的配置小类过滤规则为发布信息同时出现两个配置词才进入审核后台,这种情况下,出现两个或两个以上副词而不包含主词的信息室不入审核后台的,同时包含一个主词和一个副词就进入审核后台;
此外副词对信息含敏感词数目的先后等级排名有影响,这样的排列规则用来更快速的处理最高危的有害信息。
3、观察词:观察词主要会有三部分词组成。
第一种是阶段性特定事件发生后,暂时未造成恶劣影响的,提取关键词进行设置观察,随着事态的发展升级为有害信息了,可将后台过滤信息转入审核列表进行信息审核;
第二种是阶段性特定事件随着时间的流逝,已不在是网络舆情的热点话题,相应的信息、评论都已几乎消失,这时候提取关键词进行后续较长一段时间的观察,确保单独事件的信息正面;
第三种是对于一些比较敏感,但是暂时无有害信息存在的敏感词,设置为固定的观察词。对信息进行观察,对网络舆情进行分析。如“国家领导人姓名、万人围堵、警察、政府”等等
4、忽略词:忽略词主要是配合审核词而存在的。
忽略词在很大程度上弥补了审核词的固式过滤信息的不足。忽略词是对本身含有敏感词,但是能够确定该信息正常的信息进行忽略。举例予以说明,譬如敏感词“性交”,该词能够过滤到相关的色情低俗内容,但是也会有很多的正常信息(异性交往)通过该词被过滤进入审核后台,这样的信息往往比较多,影响了信息过滤的精准度。所以可以把“异性交往”设为忽略词,这样当发布信息中含有“性交”一词,但是出现内容形式为“异性交往”时,就可以被忽略,不进入审核列表了。
需要说明的是如果发布信息含有另外的审核敏感词,就会因为另一审核敏感词而进入审核后台,这是不相互冲突的,也更大限度的杜绝了有害信息的遗漏。
(二)后台文字信息审核
对于设定的关键词过滤进后台的文字信息分了各个频道,频道中又分各个类别来进行人员24小时实时审核。
1、后台每一条信息的审核都可以进行“忽略”和“删除”两种操作,并且对全页面可以进行批量处理;
2、通过时间选择、用户ID、审核员账号等特定项可以在系统内搜索出想要查看的任何单条信息;
3、后台的每一条信息上面都有发布该信息的时间和用户ID,点击用户ID可以链接入全站用户查询系统页面,那里可以更加全面的审核该用户的其他全面信息,并可执行对重大违规信息发布者或恶意账号的ID封锁(分为警示性账号锁定和永久封锁)、后台备注行为记录、发送警示信息等操作。

最后,对可疑用户进行处理。
可疑用户监控系统,主要是对新注册用户和用户可疑网络行为的监控和管理,其中包含很多项疑似数据列表。
1、新注册用户的监控,主要是针对大批量连号注册和可疑注册IP(曾经该IP上有过长期的不良网络行为)上的注册行为的监控;
2、用户可疑网络行为的监控包括很多,如短时间内突发IM信息多条,且信息内容相似度极高、等级积分和人气有着巨大反差、短时间内浏览大量其他用户主页速度异常等等反常和经验判断可疑的网络行为进行监控和及时处理。

25岁生日–勿忘初心,方得始终

猛然发现自己已经25岁了,依旧一事无成。事业没有进步,生活乱糟糟,这段时间,心口特别疼,不知道是不是身体也在不情愿地踏入25。
年初的时候,有人问我,你的梦想是什么。同样的话题,四年前有人问我,一年前小琴也在问我。

我的梦想是什么?
一份执念,为内心热爱的教育一步步实践;有一个爱自己,支持自己梦想的人;充实快乐的过好每一天。来上海的每一天,提醒自己:勿忘初心,方得始终!你有自己的梦想和事业,你有自己的世界,不要迷失自己。

毕业三年,工作四年。一年的程序+一年的项目;两年的产品。每次不努力的说辞就是:自己是在积累,在学习。然后总是懒散,没有用尽百分之百的去做,所以,一直游际于边界。
喜欢幼教,所以去学吉他,学练字,学画画,学习和小朋友相处;想要专注自己的行业,所以一直在完善自己的不足,学心理,学设计,学项目管理,学产品管理。内心一直在督促自己,也一直在放纵漫散的自己。 猛然发现自己25岁,有些害怕时间了,好多事情没有一直坚持,也很盲目冲动的去做了一些事。有过欣喜,有过伤痛,仍有期待。

25岁后的每一天,做最好的自己,更爱自己多一点。

生日,依旧选择陪伴父母,每个生日都是母难日,感恩父母。