民初思韻網

加入收藏   設為首頁
選擇語言   簡體中文
你好,請 登陸 或 注冊
首頁 人文思韻 傳奇人物 歷史思潮 時代作品 話題討論 國民思韻 民初捐助 賬戶管理
  搜索  
    時代作品 >>> 美國精神自由思想—精彩影視選
字體    

揭秘:“優衣庫試衣間”是怎樣逃過視頻審核的?
揭秘:“優衣庫試衣間”是怎樣逃過視頻審核的?
雷鋒網作者:三金金金     阅读简体中文版

“優衣庫試衣間”視頻之后,北京三里屯的優衣庫儼然已經成了朋友圈朝拜的景點之一。這又印證了那個萬古不變的真理:黃賭毒的病毒傳播屬性總是驚人。

不過,不是說好網監手伸的又長又廣嗎?不是說好視頻審核很嚴格嗎?這樣的視頻是如何在一夜間不斷被刪又不斷流出?

某視頻網站的工作人員告訴雷鋒網記者,目前他們每天處理的短視頻上傳量在150萬左右,而審核人員不超過50個,視頻審核的工作一大部分由機器負責。

圖像識別和聲音識別都還好說,機器是如何審核視頻的?

入門級:MD5

先來看看國家不喜歡什么樣的視頻。

在下發的《網絡視頻審查管理規定》中,一共對十類視頻不予審查通過,大而言之是反對憲法基本原則的、危害國家統一、泄露國家秘密等。

不過某視頻網站告訴雷鋒網記者,更接地氣一些的形容是三類:色情、暴恐和極端宗教主義。除了規定所有用戶自發上傳的視頻需要進行嚴格審查之外,網監還會對互聯網上已經發布的視頻進行二次審核。“參與審核的人數多到讓你震驚”,某位業內人士這樣告訴雷鋒網記者。

在中國,每個公民都有一個唯一的身份證號(ID),通過這個ID可以全方位的定位一個人的年齡、性別、出生地等,同比MD5就是視頻的ID。網監有一個巨大的危險MD5庫,庫內藏著各種不能流于世的視頻。視頻網站都需要接入這個庫,并在實際審核中增加自己的庫存。

在早期,過濾視頻的第一步就是橫掃整個庫,把MD5吻合的視頻直接剔除,并將它提交給公安違禁庫。

不過,某短視頻網站的工作人員M告訴雷鋒網記者,匹配MD5正在逐步棄用,原因在于MD5非常容易被篡改,在視頻中加入文字或者修改任意一幀就能實現。

于是,出現了更高級別的審核辦法。

性能級:機器審核

通過MD5之后的視頻,第二步會經歷機器審核的過濾。市面上已經有成熟的第三方公司提供API接口,輔助視頻網站進行機器審核。

圖普科技的CEO李明強告訴雷鋒網,機器審核視頻是基于深度學習圖像識別云,實際也是將視頻截圖,由機器審核每一張截圖的安全性。不過具體是3秒截一張還是5秒截一張,松緊度由視頻網站自己控制。

李明強介紹,機器審核視頻原理是先建模,然后導入海量的違禁視頻,讓多個機器同時進行深度樣本學習,再標注無法通過的圖像種類,進而把這些樣本揉碎、旋轉、添加“噪音”,提高機器識別能力。這其中拼的不止是技術,還有樣本圖庫的大小。據了解,在圖普科技的樣本庫中,有超過1億的色情樣本和千萬級別的極端宗教主義樣本特征。

對于不能通過的視頻,機器審核視頻會給出兩類結果:確定不能通過的,這類的準確率幾乎能達到99.5%以上;僅作參考的,準確率在95%到97%,這可能意味著該視頻需要再次進行人工審核。

據雷鋒網了解,從整個行業來說,機器基本能篩過99%的視頻,只有1%需要再次動用人工。如果是150萬的視頻,那人工只需要審核1.5萬個。

專業級:機器+人工審核

第三方的技術可以直接拿來用嗎?M告訴雷鋒網記者,當然不行。拿來的只是底層,還要把機器再過一遍自己的樣本圖庫,提高機器的識別能力。

M介紹,目前視頻網站的審核坐席基本都是7x24小時工作,在臨近閱兵、六四等重要日子,還要加大審核人員的配置。對于機器沒有通過的視頻,審核的工作人員會把其每6秒截圖,一頁60張圖,一眼掃過去就可以判別視頻是否真的觸了紅線。

第三方公司還會提供更加人性化的服務,例如對于可能需要人工再次審核的視頻,會把機器判定是敏感圖片的截圖放在最靠前的位置,方便工作人員進行鑒別。

在機器和人工審核的雙重過濾下,目前的視頻網站基本可以實現上傳視頻一個小時內給出審核結果。

攻略若干M介紹,目前的違禁視頻以色情居多,而且已經形成了完整的經濟鏈條:販賣色情小電影、勒索和色情裸聊數不勝數。有了經濟利益的催動,審核的難度會變大很多。

當然,為了減輕審核工作,視頻網站也有很多竅門,比如新用戶和高危用戶的上傳會優先審核,他們是“重點關注對象”;明星、大V等賬號會被設置成為信任賬戶,默認他們發布的視頻不用通過審核。

漏洞也是有的。目前的視頻審核基本只審核圖像,不審核聲音。這意味著,如果一段視頻用正常的圖像配上違禁的配音,也可以逃過審查。三星研究院負責聲音識別的工作人員告訴雷鋒網記者,目前對聲音的識別技術已經非常成熟,沒有將它運用到視頻審核中,是因為僅用聲音違規的視頻是少數,還不成規模。

在國內,幾乎所有的視頻網站都是“先發后審”:視頻先發布,打上網站水印,自己或者關注自己的好友能夠看到,接著再進行審核。因此這也不奇怪,像“優衣庫”中帶著水印的視頻滿天飛了。

最后科普一下,視頻網站除了會對發布違禁視頻的用戶封號處理之外,還會把其IP匯報給網監,據說散布危害國家安全的視頻判六年。如果你有個朋友突然消失了,你們感受感受。

歷史的遙想

黨把應該用于建設貧困地區的經費,花在了控制意識形態上了。


失與夢

在臨近閱兵、六一四等重要日子,還要加大審核人員的配置


昵稱不要過長

六一四還是一個重要日子,以后是不是也要慶祝一下?


芥末醬

紀念人民解放軍的一次偉大勝利,呵呵


姐夫別這樣

M介紹,目前視頻網站的審核坐席基本都是7x24小時工作,在臨近閱兵、六四等重要日子,還要加大審核人員的配置。

→_→六一四是個啥日子


野花閑草逢春生

20幾年前是個灰暗的日子


小蟲_26

“目前對聲音的識別技術已經非常成熟,沒有將它運用到視頻審核中,是因為僅用聲音違規的視頻是少數,還不成規模。”

小編發完這篇文后,以后就成規模了


千手柱間

在臨近閱兵、六一四等重要日子。六一四是什么,怎么從來不紀念呢


隨便看看斯基

鎮壓學,運
2015-09-09 14:43

歡迎訂閱我們的微信公眾賬號!
春秋茶館訂閱號
微信號 season-tea(春秋茶館)
每天分享一篇科技/遊戲/人文類的資訊,點綴生活,啟迪思想,探討古典韻味。
  清末民初歷史人物  民初人物
新與古典文化研究大家
胡適(1891年12月17日-1962年2月24日),原名嗣穈,學名洪騂,字希疆,後改名胡適,字適之,筆名天風、藏暉等,其中,適與適之之名與字,乃取自當時盛行的達爾文學說....
民族主義思想大師
章太炎(1869年1月12日-1936年6月14日),原名學乘,字枚叔。嗣因反清意識濃厚,慕顧炎武的為人行事而改名為絳,號太炎。中國浙江餘杭人,清末民初思想家,史學家,樸....
資助民初精神網
        回頂部     寫評論

 
評論集
暫無評論!
發表評論歡迎你的評論
昵稱:     登陸  註冊
主頁:  
郵箱:  (僅管理員可見)

驗證:   验证码(不區分大小寫)  
© 2011   民初思韻網-清末民初傳奇時代的發現與復興   版權所有   加入收藏    設為首頁    聯繫我們    1616導航