現在,區分 AI 圖片,真的越來越難了。
給你幾秒時間,下面這四張圖,你看得出哪個是 AI 生成的嗎?
先做題,不準下劃偷看答案!
其實,這里只有左下角是真實照片。不知道你猜沒猜對,反正編輯部的小伙伴們都覺得挺難的。
而事實也是這樣,AI 圖片已經越來難辨真假,甚至很多 AI 檢測工具都失靈了。
這么說吧,以前生成的那些圖片,有些是漫畫風,有些長著奇怪的四肢和五官,還有不合理的背景,總之漏洞百出,有時候還挺驚悚。
但前一陣子 GPT-4o 一升級,大模型的文生圖能力直接超神了。比如,剛剛右上角的 “ 自拍照 ” 就是下面這些提示詞生成的:
大模型甚至能理解提示詞里的 “ 平庸 ”、“ 漫不經心 ”、“ 模糊 ”、“ 過曝 ” 等等抽象的要求,生成的圖片就像我們生活里的隨手一拍,一點違和感都沒有。
具體這些模型是怎么做到讓 AI 圖以假亂真的,官方還沒有開源他們的訓練架構。
不過在 OpenAI 官網上,我們找到了一些線索。
官方表示,他們在訓練模型的時候, 可以讓模型更好地理解語言和圖像之間的關聯。再加持神秘的 “ 后期訓練 ”,能讓生成的結果看起來很流暢。
所以,當我們給出一些抽象的詞匯,比如 “ 漫不經心 ”,模型就能知道圖像的角度應該有些歪、畫面有些糊、表情應該自然等等,還能完美地展示出來。
技術發展這么快,咱碳基生物是真沒辦法了。但更絕望的是,實驗結果表示,這回硅基也分不清。
我們先試了試大模型的矛能不能攻破自己的盾。不出意外,原來那種一眼假的 AI 圖片,它和我們一樣,還能輕松分辨出來。但現在,同樣一張圖,丟給豆包和 GPT,它們都認為這是一張真實的自拍照。
豆包看不出這張圖片是AI生成的
除了用大模型測試,我們還找了兩個推薦排名最靠前的免費 AI 圖片檢測器,結果它們各有各的拉垮。
我們測試了八張肉眼完全看不出破綻的 AI 人像圖片。其中有四張它們意見達成了一致,只不過,是一致認為都是真實照片。。。
還有四張,兩個檢測器的意見完全相反。剛才還以為他們互相抄作業,但這下我不懷疑了,因為這回錯的題全都不一樣。
總之就是對著干
這還只是比較簡單的人像,畫面集中在人的正臉上,背景也比較單一。
接下來一些復雜場景的測試就更慘不忍睹了,人多或者背景過于精細,甚至單純的風景圖片,都讓檢測器幾乎全軍覆沒。如果說檢測器面對 AI 自拍照還有一點懷疑,面對這些圖片的時候它是真的信了。
認不出也就罷了,有一個檢測器還出現了誤傷,把一張真正的照片判定成了 AI 圖片。
有一說一,網戀人的天塌了,以后真分不清是照片還是照騙了。P 圖可能會留下痕跡,但現在的 AI 生圖真的讓人懷疑,這不會是哪個網紅明星要和我談戀愛吧。
那為啥現在 AI 檢測工具都不靈了?
在搜索的時候,我們發現,雖然文生圖技術的發展像是坐上了火箭,但 AI 圖像檢測這么多年還在騎著卷積神經網絡的自行車。
由于大部分工具不會開放它們的源碼,我們在 github 上找到了幾個 AI 圖片檢測項目作為參考。
我們發現,這幾個 AI 檢測工具的架構都還停留在數據集 卷積特征識別 分類的階段。
熟悉計算機視覺的差友,可能了解這一套沿用了 N 年的流程:先給數據集里的每張圖片打上是或不是 AI 生成的標簽,剩下的就交給神經網絡去學習標簽相應的圖片特征,最后進行分類。
AI 生圖技術更新了一茬又一茬,這些工具做的不過就是把新 AI 圖打上標簽,加進老數據集,重新再訓練一遍。甚至其中一個工具用的 CvT-13 模型,已經是 4 年前的老東西了。
可以說是魔高一尺,道高一寸,技術本身沒更新,準確率當然上不去了。
CvT-13架構
雖然 AI 圖片識別相關的學術研究也有一些,但研究速度,數量和受到的關注度都和大模型文生圖沒法比。
不過,與其費時費力的后期區分,不如從源頭解決問題。
比如各大 AI 公司共同倡導的 C2PA 組織,鼓勵制定相關標準,來更方便地驗證信息來源,避免 AI 內容泛濫。
其中,OpenAI 表示會嘗試給生成的圖片加上水印。谷歌也提出 synthID,可以把數字水印嵌入 AI 生成的文字、圖片、視頻、音頻里。這種水印不會影響我們的觀感,但可以被軟件識別。
而且,在今年 3 月國家頒布的《 人工智能生成合成內容標識辦法 》中明確表示,從 2025 年 9 月起,所有 AI 生成的內容都必須添加顯式或隱式標識。
那我們為啥要一定區分 AI 圖呢?分不清難道不是技術力 max,這不是好事嗎?
生圖確實很厲害,不過凡事咱得看兩面。因為在 AI 生圖震驚全球的時候,利用 AI 進行詐騙犯罪的新聞還在頻繁曝出。AI 越真,我們被騙的概率就越高。
畢竟,有些人想的肯定不是怎么用 AI 生成吉卜力風格的可愛圖片,而是用最真實的圖片來攻擊大家最薄弱的點。
總的來說,現在靠我們自己已經很難分清 AI 圖像的真假了。
不管是識別的工具,還是從源頭給 AI 內容打標記,現在的技術都有些落后,但需求很緊迫。
這樣看來,區分 AI 內容會是一場持久戰。各大公司在搞生圖技術,秀肌肉的時候,也該考慮一下 AI 識別技術的升級了。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。