財(cái)中社9月2日電 東方證券發(fā)表研究報(bào)告稱:谷歌圖像生成模型一致性強(qiáng),推動(dòng)電商廣告AI應(yīng)用提速。
谷歌最新gemini-2.5-flash-image-preview(nano-banana)模型,具有SOTA的圖像理解和編輯能力。研報(bào)認(rèn)為相較此前競(jìng)品,nano-banana模型在人物和產(chǎn)品的一致性上有極高水準(zhǔn),生產(chǎn)效率提升或帶來電商、廣告素材AI滲透提速,釋放更多營(yíng)銷預(yù)算;并且圖像生成和編輯作為AI視頻創(chuàng)作工作流的前置步驟,以高一致性的出圖結(jié)果作為關(guān)鍵幀,對(duì)解決AI視頻的一致性痛點(diǎn)亦有助益,建議關(guān)注多模態(tài)行業(yè)下游場(chǎng)景AI應(yīng)用深化帶來的投資機(jī)會(huì)。
谷歌最新圖像模型強(qiáng)勢(shì)出圈,超高一致性下素材制作提效、釋放更多營(yíng)銷預(yù)算。日前谷歌發(fā)布的圖像模型nano-banana,目前位居LMArena的文生圖和圖像編輯雙榜單首位。根據(jù)測(cè)評(píng)情況看,nano-banana模型具有SOTA的圖像理解和編輯能力,具體體現(xiàn)在:1)人物和產(chǎn)品一致性極高,例如在對(duì)人像進(jìn)行表情微調(diào)、或從不同角度展示產(chǎn)品時(shí),可以接近100%地做到一致性。2)具有超強(qiáng)的理解能力,例如在元素替代中,新的圖像可以很好還原光影、透視等真實(shí)物理規(guī)律。3)多圖融合,可以將數(shù)十張圖片元素合成一張圖,并且畫面協(xié)調(diào)自然。研報(bào)認(rèn)為,nano-banana模型尤其適合電商、廣告素材制作,例如電商多圖融合、元素替換的需求場(chǎng)景里,nano-banana可以在高一致性下實(shí)現(xiàn)主圖A/B test的批量化生產(chǎn),節(jié)省商家前期測(cè)試圖片轉(zhuǎn)化率的時(shí)間和資金成本,從而釋放更多預(yù)算給到素材投放。
圖像一致性對(duì)后端視頻一致性保持有益,AI視頻場(chǎng)景有望加速滲透。目前AI視頻的創(chuàng)作工作流,包括前期腳本寫作和分鏡設(shè)計(jì)、腳本文生圖產(chǎn)出關(guān)鍵幀畫面、圖生視頻、后期剪輯等步驟。因此在文生圖階段,批量化高一致性圖片及連續(xù)性圖片的產(chǎn)出,對(duì)后端視頻生成有正向作用,或?qū)?dòng)視頻流整體發(fā)展速度斜率向上。指標(biāo)上看,降低圖片成產(chǎn)難度會(huì)使得更多泛用戶使用,帶動(dòng)視頻生成行業(yè)使用人數(shù)及相關(guān)指標(biāo)的提升,AI視頻滲透有望加速。
來源:財(cái)中社
來源:財(cái)中社
相關(guān)標(biāo)簽:
Ai滾動(dòng)快訊重要提示: 以上內(nèi)容由AI根據(jù)公開數(shù)據(jù)自動(dòng)生成,僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。如不希望您的內(nèi)容在本站出現(xiàn),可發(fā)郵件至ljcj@leju.com或點(diǎn)擊【聯(lián)系客服】要求撤下。未經(jīng)允許,任何單位或個(gè)人不得在任何平臺(tái)公開傳播使用本文內(nèi)容。
樂居財(cái)經(jīng)APP
?2017-2025 北京怡生樂居財(cái)經(jīng)文化傳媒有限公司 北京市朝陽(yáng)區(qū)西大望路甲22號(hào)院1號(hào)樓1層101內(nèi)3層S3-01房間756號(hào) 100016
京ICP備2021030296號(hào)-2京公網(wǎng)安備 11010502047973號(hào)