二区三区少妇,变态夫妇 波多野结衣,日本欧美久久久久久,久久久婷婷热,69欧美精品,色色亚洲无码色色热热,亚洲中文字幕在线刺激,久久久久久66,性感美女131视频

車訊網(wǎng) - 專業(yè)汽車新聞資訊門戶
當(dāng)前位置: 車訊網(wǎng) -> 熱點(diǎn)

三位Adobe老將出走,做出了超強(qiáng)文生圖模型

時間:2025-04-04 19:19  |  責(zé)任編輯:宋元明清  |  來源: 投資界  |  關(guān)鍵詞:  |  閱讀量:5322  |  

GPT-4o,被擊敗了?

最近大伙都被GPT-4o生成的各種“整活”圖像刷屏了吧,各種動漫油畫風(fēng)格改圖、經(jīng)典影視復(fù)現(xiàn)、漫畫設(shè)計改圖……,大有“AI一日,人間一年”之勢。

甚至OpenAI CEO Sam Altman都累了:“收手吧,我們需要休息!”

但就在GPT-4o火遍全球之際,一個來自初創(chuàng)團(tuán)隊的新模型Reve Image,卻憑借其在特定圖像生成領(lǐng)域的出色表現(xiàn),悄然贏得了用戶和專業(yè)榜單的認(rèn)可,排名連續(xù)多日超過GPT-4o,在人物、奇幻與神話、插畫等細(xì)分領(lǐng)域更是妥妥的*。

自3月發(fā)布以來,它在多個海外第三方“盲測競技榜”上表現(xiàn)搶眼,即使在GPT-4o持續(xù)刷屏的日子里,依然能在榜單上占據(jù)高位。

截圖日期:4月1日

這不禁讓人好奇,Reve這匹“黑馬”究竟有何過人之處?它如何在巨頭林立的文生圖“牌桌”上占據(jù)一席之地?我們通過一系列實測來一探究竟。

實測:從AI生圖到AI“攝影”

模型發(fā)布后,Reve官方在X平臺上將自己的核心優(yōu)勢概括為三點(diǎn):提示詞遵循、美學(xué)(Aesthetics)和排版(Typography)。

我們就從這幾個方面入手,把它與如今大熱的GPT-4o、Imagen3、Recraft直接對比,來看看Reve表現(xiàn)究竟如何。

1. 提示詞遵循:不漏掉任何一個元素,還要邏輯合理

首先,我們來測試模型處理復(fù)雜指令的能力,將幾種風(fēng)馬牛不相及的元素組合在一起,觀察模型的還原度和邏輯性。

提示詞:一只杰出的暹羅貓被描繪成一個富麗堂皇的姿勢,穿著帶有復(fù)雜金色刺繡的伊麗莎白時代天鵝絨緊身褲。這只貓的服裝包括一個大的蕾絲鑲邊的圍脖,勾勒出它的頭。一條帶有寶石吊墜的粗金鏈掛在它的脖子上。貓的藍(lán)眼睛直視著觀眾。背景是深綠色的森林,一旁是披著深紅色天鵝絨的古典大理石柱子,暗示著宏偉的莊園環(huán)境。場景以16世紀(jì)油畫的風(fēng)格呈現(xiàn),對細(xì)節(jié)和紋理一絲不茍,尤其是毛皮、織物和背景元素。

我們再來一組:

提示詞:一只戴墨鏡的企鵝,站在極地夜晚的冰川洞穴入口,左手舉著一個插著吸管的菠蘿,洞穴內(nèi)漂浮著3只發(fā)光的彩虹色獨(dú)角獸,背景有霓虹燈組成的'生日快樂'字樣,空中懸浮一條蒸汽朋克風(fēng)格的機(jī)械魚,整體畫風(fēng)為超現(xiàn)實主義,地面有融化的巧克力河流,天空出現(xiàn)梵高《星月夜》的筆觸,部分物體邊緣帶有故障藝術(shù)的數(shù)碼裂紋效果。

這組對比除了能直觀地檢查各模型是否遵循提示詞以外,還可以很直觀地看到它們的風(fēng)格偏好。雖然這是一個虛構(gòu)場景,但Reve和GPT-4o生成的圖像中,企鵝和巧克力河流的元素仍呈現(xiàn)出偏寫實的風(fēng)格。相比之下,Recraft生成的圖像風(fēng)格雖然更討喜,但卻忽略了很多細(xì)節(jié)。

2. 美學(xué)表現(xiàn)與風(fēng)格塑造:氛圍感與人文氣息是亮點(diǎn)

在很多評測中,美學(xué)風(fēng)格符合大眾偏好是大模型在盲測中脫穎而出的關(guān)鍵。我們換一組較為正常和細(xì)致的提示詞,其中包含了大量主觀描述,看看這些模型會怎么處理。

自然風(fēng)光與氛圍

提示詞:白雪皚皚的山峰聳立在寒冷的黎明天空中,充滿了淡藍(lán)色和紫色的色調(diào)。飄渺的云層飄過高處的山坡,被清晨的陽光照亮。這座山鋸齒狀的巖壁顯示出清晰的細(xì)節(jié)和紋理,而雪塊則突出了山脊和裂縫。前景以植被稀疏的巖石地形為特色,一直延伸到主峰的底部。廣角風(fēng)景攝影,自然采光充足,在冷色調(diào)的天空下清晰聚焦山區(qū)細(xì)節(jié)。

人物肖像與故事感

提示詞:一位年輕的白人男性士兵身著二戰(zhàn)時期的戰(zhàn)斗裝備,站在嚴(yán)酷的冬季條件下,周圍下著雪。士兵戴著一頂橄欖綠色的軍用頭盔,頭盔的邊緣有積雪,肩膀上穿著風(fēng)化的棕褐色冬季戰(zhàn)斗外套,肩膀上有明顯的濕氣。他的表情緊張而擔(dān)憂,嘴唇微微張開,仿佛在說話或呼吸沉重,而他的目光則略微向下和向側(cè)面。背景顯示了他身后的其他戴頭盔的士兵,在戰(zhàn)場場景中創(chuàng)造了深度。在陰沉的天空下,遠(yuǎn)處光禿禿的冬樹清晰可見。該圖像具有自然的正面照明和淺景深,可保持主體清晰對焦,同時略微模糊背景元素。調(diào)色用柔和的綠色、灰色和棕色來降低飽和度,強(qiáng)調(diào)冬季戰(zhàn)爭的嚴(yán)峻現(xiàn)實。特寫人像攝影,具有淺景深和自然的正面照明,色彩飽和度低。

動態(tài)場景與情緒

提示詞:一個剪影音樂家得意洋洋地拿著他們的吉他彈唱,在一片人群組成的海洋沖浪,海洋中雙手向上伸展。他們沐浴在暖光的舞臺燈光,背景有標(biāo)志性的太空針?biāo)檀┮箍?。這模糊、充滿活力的人群消失在黑暗中場地,他們的興奮是顯而易見的。反射著舞臺燈光的泡沫在空氣中飄蕩,增添了慶祝的氣氛。低光照片烘托出現(xiàn)場表演的原始能量。

藝術(shù)風(fēng)格與虛構(gòu)場景

提示詞:希臘哲學(xué)家們聚集在狂暴的天空下,一道閃電劃破畫布,呈對角線照亮了他們。他們的表情交織著敬畏與恐懼,揮手指向天空,身上的長袍隨風(fēng)旋轉(zhuǎn),與烏云遙相呼應(yīng)。在他們腳下,一塊風(fēng)化的石碑上隱約刻著“fate”二字,被飄動的衣袍部分遮住。這是一幅充滿戲劇性的明暗對比油畫,具有強(qiáng)烈的對角線構(gòu)圖和富有氛圍感的光影效果。

意境理解和視覺化

我們再上些難度,把經(jīng)典名著中的景物描寫交給模型,這些描述相對模糊,看看它們會給出怎樣的答卷。

提示詞:穿過縣境上長長的隧道,便是雪國。夜空下,大地一片白茫茫。火車在信號所前停了下來。

在以上幾組對比中,各模型生成的圖像在核心元素還原上似乎并未拉開決定性差距,但仔細(xì)對比后不難發(fā)現(xiàn),Reve在處理細(xì)節(jié)上與其他模型存在一些不同之處。

例如最后一個案例中,將川端康成《雪國》開篇文字視覺化,是對模型捕捉意境及理解能力的考驗。所有模型都生成了火車、雪景、夜晚這些關(guān)鍵元素,但只有Reve在這一測試中采用了框式構(gòu)圖,拍攝角度和質(zhì)感都更接近人類攝影師拍攝的照片。

而這種對攝影構(gòu)圖和真實感的偏好,并非個例。

Reve在這一案例中生成的照片大量出現(xiàn)遠(yuǎn)景,利用天空、雪地、火車在畫面比例上的對比,表現(xiàn)“大地一片白茫?!?/p>

AI新榜觀察到,當(dāng)許多文生圖模型傾向于生成視角相對“標(biāo)準(zhǔn)”、構(gòu)圖“板正”的圖像時,Reve常常會采用一些在AI生成領(lǐng)域不那么常見、但在人類攝影作品中卻很經(jīng)典的構(gòu)圖方式。例如更具縱深感的角度、利用前景遮擋、模擬特定鏡頭焦段的效果等。

再加上Reve本身在光影效果、內(nèi)容質(zhì)感方面的不錯表現(xiàn),使其生成的圖像甚至難辨真假。

這種對構(gòu)圖、光影和質(zhì)感的細(xì)膩把握,使得Reve在生成具有人文氣息、故事感和電影質(zhì)感的寫實風(fēng)格圖像方面尤為出色,這或許就是它能夠在考察大眾審美偏好的盲測中取得好成績的秘密。

3. 文字排版能力:圖文融合有亮點(diǎn),但語種支持待提升

提示詞:一張專業(yè)的野生動物攝影作品,畫面中一只棕熊站立在高草叢中,背景是深色的森林。畫面中融入了粗體黃色復(fù)古風(fēng)格的襯線字體,拼寫出“bear”一詞,文字部分被巧妙地遮擋在熊的頭部之后。熊的頭部從字母“e”中探出,形成了文字與主體之間的巧妙視覺互動。照片采用自然光線拍攝,采用中景構(gòu)圖和略低的角度,營造出一種強(qiáng)大而平衡的畫面效果。棕熊濃密的棕色毛發(fā)與深沉的暗綠色森林背景形成了美麗的對比。

不過遺憾的是,目前,Reve在處理除英文以外的其他語言時仍然存在一些問題。比如,當(dāng)我們把提示詞從“熊”換成“虎”,并要求模型生成中文時,雖然圖像從文字中間穿過的效果仍然可以實現(xiàn),但漢字卻無法正常生成。

綜合來看,Reve是一個長處和短處都非常明顯的產(chǎn)品。

長處:

*的美學(xué)表現(xiàn): 尤其擅長營造人文氣息、故事感、電影感的寫實風(fēng)格,符合大眾審美。

良好的提示詞遵循能力: 對細(xì)節(jié)元素的還原度較高。

創(chuàng)新的圖文排版: 在英文語境下能實現(xiàn)較好的圖文融合設(shè)計。

用戶友好: 目前網(wǎng)頁版無水印、無需注冊、支持中文界面、生成速度快。

短板:

非英文文字處理能力弱: 基本無法準(zhǔn)確生成除英文外的文字。

復(fù)雜指令下的邏輯性: 處理一些復(fù)雜或需要深度邏輯推理的提示詞時仍會出錯。

多輪生成與一致性: 相較于一些能多次修改的模型,在保持角色、風(fēng)格一致性方面稍弱。

通用性與多模態(tài): 功能相對單一,不像GPT-4o等具備更強(qiáng)的多模態(tài)交互能力。

復(fù)雜元素過多時Reve表現(xiàn)不如GPT-4o,左Reve右GPT-4o

不知道是不是為了防止因訪問量太多而崩潰,Reve AI并非完全免費(fèi),但每天登錄會贈送20次試用,新賬號贈送100積分,也可以購買積分,價格是5美元500積分。

02Reve登頂背后,是三位Adobe老將的“夢想”

我們是一個小團(tuán)隊:充滿激情的研究人員、建造者、設(shè)計師和具有偉大創(chuàng)意的故事講述者。

但這個“小”團(tuán)隊背后,是三位圖形處理界的“大佬”:

Christian Cantrell:前Stability AI產(chǎn)品副總裁,Stable Diffusion Photoshop插件的創(chuàng)建者。

Taesung Park:前Adobe研究科學(xué)家,是GauGAN的共同作者之一。

Micha?l Gharbi:前Adobe研究科學(xué)家,研究方向包括計算攝影、圖像/視頻處理和機(jī)器學(xué)習(xí)。

有網(wǎng)友推測,三人離開公司重組Reve團(tuán)隊,可能是為了完成一些在原公司推行受阻的項目。

Reve面世后,創(chuàng)始人們在社交平臺上的發(fā)言似乎印證了這一點(diǎn),還為我們揭示了Reve AI更深層的目標(biāo)。創(chuàng)始人Taesung Park在X平臺發(fā)文表示:

與LLMs相比,今天的文生圖像/視頻模型常常缺乏邏輯。我們在Reve的使命是用邏輯增強(qiáng)視覺生成模型,專注于通過高級語言功能理解用戶意圖,從而實現(xiàn)更好的復(fù)雜提示理解能力。

Micha?l Gharbi也發(fā)表了類似的觀點(diǎn),并將現(xiàn)有模型比作只會模仿的“隨機(jī)鸚鵡”:

基于創(chuàng)始人在計算攝影、GauGAN等方面的過往成就,我們謹(jǐn)慎推測:Reve在技術(shù)路徑上可能借鑒了計算攝影,模型注重學(xué)習(xí)場景的3D布局、對象間的空間關(guān)系以及光照與材質(zhì)的物理交互。

從這個角度而言,或許Reve和這個“小團(tuán)隊”的故事,或許才剛剛翻開序章,我們可以期待它在邏輯性、可控性和多語言支持等方面持續(xù)進(jìn)化。

說起來,Reve這次確實有點(diǎn)“生不逢時”。

團(tuán)隊埋頭苦干一年,好不容易把*代模型Reve Image發(fā)出來,它也爭氣地沖上了盲測榜首,甚至一度被興奮的用戶捧為“世界*圖像模型”。

僅僅過了一天之后,功能更全面、聲勢更浩大的GPT-4o便橫空出世,把熱度完全搶走,這讓剛剛嶄露頭角的Reve Image瞬間顯得黯淡無光。

這也讓我們回到了最初的問題:在GPT-4o這樣強(qiáng)大且全面的多模態(tài)模型陰影下,其他文生圖模型是否還有機(jī)會?

而Reve或許已經(jīng)用它帶有明顯傾向性的生圖策略,給了我們答案。

當(dāng)下的AI模型在“生成萬物”上已取得長足進(jìn)步,“整活”玩法層出不窮,但往往缺乏獨(dú)特的“視覺品味”或難以穩(wěn)定輸出特定的高級美學(xué)風(fēng)格。

Reve則敏銳地切入了“人文寫實”及“電影氛圍感”這一細(xì)分審美領(lǐng)域,通過深度優(yōu)化,提供了超越許多通用模型的效果,同時保持了極低的門檻,將“審美”本身作為核心競爭力。

這種“審美力”并非空中樓閣,而是具有實實在在的商業(yè)價值。

這種由Reve獨(dú)特審美驅(qū)動、與其他AI工具聯(lián)動組合的玩法,也是其“專精”價值得以延伸和放大的體現(xiàn)。

顯然,如果你追求的不是天馬行空的奇幻效果,而是希望獲得更貼近真實世界、蘊(yùn)含情緒和敘事性的現(xiàn)實風(fēng)格圖像,那么Reve會是個不錯的選擇。

雖然GPT-4o的光芒已經(jīng)足夠耀眼,但一個健康繁榮的AI生態(tài),既需要GPT-4o這樣的強(qiáng)大“平臺”和“通才”,也離不開像Reve這樣在垂直領(lǐng)域深耕細(xì)作、獨(dú)具特色的“專才”。

資料:

免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),與本網(wǎng)無關(guān)。僅供讀者參考,并請自行核實相關(guān)內(nèi)容。

隆林| 会东县| 吐鲁番市| 志丹县| 高雄县| 镇平县| 晋宁县| 镇巴县| 从江县| 北安市| 邮箱| 临安市| 宣化县| 蓝山县| 多伦县| 资中县| 柘城县| 元阳县| 榆树市| 郓城县| 石狮市| 湘西| 门头沟区| 河间市| 江西省| 德清县| 浦东新区| 拜城县| 辉南县| 安阳县| 左权县| 宁远县| 炎陵县| 泸西县| 衡南县| 本溪市| 潍坊市| 定远县| 方城县| 安仁县| 灵山县|