┊文章閱讀:次
當下,UGC內容量的爆發超出所有人的想象。據粗略統計,每天上傳到YouTube的視頻可以連續播放98年,Facebook每天發布的照片量堆起有80個埃菲爾鐵塔那么高,有200萬篇文章在網上發布,相當于美國《時代》刊發770年的總量…… 面對如此龐大的內容量,如何篩選內容,確保內容符合法律法規,成了很多內容平臺首要解決的問題。在智能鑒黃領域,國內名氣較大的第三方平臺有阿里綠網和網易云易盾、騰訊云萬象優圖、圖譜科技等。內容平臺尤其是直播平臺在面對這些第三方服務時,往往“一頭霧水”,因為不知道這些企業提供的服務到底怎么樣?能否解決他們的需求。抱著對技術發展的好奇心,筆者從一個內容審核外包公司獲取了一些圖片,在這些平臺上做了一下測評(為了保證文章能夠順利發出,一些圖片做了打碼處理),把結果呈現給大家,供各位參考。圖片實測
圖一雖然只是一張應用內截圖照片(已打碼),色情部分的占比相對較少,但是人工審核肯定是:黃色圖片一張! 但是人工智能識別效果未必就那么出色了。那么人工智能鑒黃平臺會如何評判呢?結果請見下圖。
結果顯示從左至右分別是:阿里綠網、騰訊優圖、圖譜科技、網易云易盾。從測試結果來看,各家對于色情部分占比較小的圖的檢測結果不盡人意(根據各家檢測標準,檢測結果百分比越高代表越接近標簽標準,在該例當中意味著越接近色情內容),僅有一家作出了疑似的判斷。
圖二這張圖片雖然暴露部分不多,但是有強烈的性暗示,可以算作性感,也可以算作色情,這種人工審核一般也會選擇刪除,那么鑒黃服務平臺會是什么反應?我們一起來看看。
結果顯示從左至右分別是:阿里綠網、騰訊優圖、圖譜科技、網易云易盾。從測試結果來看,阿里綠網直接標為疑似,圖譜科技標為性感疑似,這兩家的情況相對較好。但騰訊優圖和網易云易盾直接標為正常和非色情。圖三這是一張正常的美女圖片,在智能鑒黃平臺這會是什么結果?結果顯示從左至右分別是:阿里綠網、騰訊優圖、圖譜科技、網易云易盾。這張圖片的檢測結果相對較好,只有阿里綠網給出疑似色情的結果,需要人工復核。每個父母都希望在某些平臺上曬一下自己的萌娃,作為一個正常人,我們也非常樂意看到這樣的圖片——天真無邪類型。這些圖片比上面的三張圖片相對來說可視性要高,但是有一些暴露出敏感部位的嬰兒圖片也有涉嫌“兒童色情”的風險,現在抵制兒童色情的呼聲這么強烈,也許人工審核也會選擇刪除。那么對于這類圖片,智能鑒黃平臺會如何評判?結果顯示從左至右分別是:阿里綠網、騰訊優圖、圖譜科技、網易云易盾。這張圖片原圖較小,可能導致模型不容易識別。從測試結果上來看,阿里綠網則顯示疑似,圖譜直接標為色情。但騰訊優圖和網易云易盾則直接通過,存在一定風險。總體測試結果分析:第一張圖片:內容審核員評判:色情圖片; 平臺表現:圖譜科技>阿里綠網>騰訊優圖>網易云易盾。第二張圖片:內容審核員評判:色情圖片;平臺表現:阿里綠網>圖譜科技>網易云易盾>騰訊優圖。第三張圖片:內容審核員評判:美女圖片;平臺表現:騰訊優圖>網易云易盾>圖譜科技>阿里綠網。第四張圖片:內容審核員評判:涉嫌兒童色情;平臺表現:圖譜科技>阿里綠網>騰訊優圖>網易云易盾。從上述的測試結果看,阿里綠網第一張圖片誤判,之后的圖片卻都是疑似?疑似的意義是什么呢。圖譜科技這家以鑒黃業務起家的公司,在美女圖片和兒童色情識別上是不是有點太嚴格。騰訊優圖和網易云易盾的測試結果表現一般,后續還需要加強相關數據的訓練。最后,一點心得體會供大家參考,相關的測試對比結果文章并不少,大家可能發現各自呈現出不一樣的結果,也許是測試圖庫不一樣,也許是測試方法不一樣。建議大家用自己較多的數據去親測為好,根本不用關注公司名氣的大小,意義不大,測試出真知,同時考量其服務的專業性和及時性來綜合評估。
Copyright @ 2013-2018 中國福建網 版權所有
聯系我們
免責聲明:本站為非營利性網站,部分圖片或文章來源于互聯網如果無意中對您的權益構成了侵犯,我們深表歉意,請您聯系,我們立即刪除。