商湯科技執(zhí)行商務(wù)總監(jiān)李星冶。
紅網(wǎng)時刻新聞記者 吳公然 攝影 張必聞 長沙報道
(相關(guān)資料圖)
還記得童話里那支“畫什么,什么就活過來”的神筆嗎?如今,人工智能(AI)正將這份奇妙的創(chuàng)造力賦予每一個普通人。
在11月12日舉行的2025中國新媒體大會上,商湯科技執(zhí)行商務(wù)總監(jiān)李星冶向記者描繪了這樣一幅圖景:無需專業(yè)的攝像機、復(fù)雜的剪輯軟件和深厚的拍攝功底,你只需對著電腦說幾句話,一個情節(jié)完整、鏡頭流暢、角色生動的短視頻就能一鍵生成。
這并非遙不可及的科幻場景,而是商湯科技在此次大會上帶來的現(xiàn)實解決方案。
從“高門檻”到“一句話的事”
繼去年首次亮相并展示AI大模型的巨大潛力后,今年商湯科技再度受邀,不僅參與論壇分享行業(yè)洞察,更首次攜其重磅產(chǎn)品登陸新媒體技術(shù)展臺。
商湯科技用兩款“硬核”應(yīng)用——AI視頻創(chuàng)作Agent平臺“Seko”和“如影”數(shù)字人視頻生成平臺的圖片數(shù)字人功能,向業(yè)界宣告:生成式AI已從炫技的“概念期”,全面邁入與場景深度結(jié)合的“實用期”。
“過去,制作一個專業(yè)的短視頻,需要編劇、導(dǎo)演、拍攝、剪輯、后期等多個環(huán)節(jié),門檻高、周期長、成本不菲。而現(xiàn)在,AI可以一個人承擔起整個團隊的工作?!崩钚且痹诮榻B其核心產(chǎn)品Seko時,作了一個生動的比喻。
根據(jù)李星冶描繪,Seko就像一個高度智能的“導(dǎo)演團隊”,你只需要用最自然的語言告訴它你的創(chuàng)意,比如“我想做一個關(guān)于太空咖啡館的1分鐘科幻短劇”,它就能自動將這個指令拆解成寫劇本、設(shè)計分鏡、確保角色形象一致、配音配樂等子任務(wù),然后調(diào)動專業(yè)的AI模型分頭執(zhí)行,最終直接給你一個成片。
這種被稱為“創(chuàng)編一體”的模式,徹底打破了傳統(tǒng)視頻制作中需要在不同軟件間反復(fù)切換、調(diào)整復(fù)雜參數(shù)的束縛。
李星冶強調(diào),這不僅是效率的飛躍,更是創(chuàng)作民主化的體現(xiàn)?!拔覀冋吹健畡?chuàng)編一體’的成片智能體成為行業(yè)趨勢?!?/p>
“它一方面滿足了影視、廣告等專業(yè)領(lǐng)域?qū)π屎唾|(zhì)量的兼顧需求;另一方面,也極大地降低了門檻,讓非專業(yè)用戶也能輕松實現(xiàn)創(chuàng)作夢想,不再被復(fù)雜的技術(shù)技能所限制?!崩钚且边M一步解釋道。
目前,Seko已經(jīng)與多家專業(yè)短劇、漫劇制作團隊、自媒體和專業(yè)工作室達成合作,正在將這種全新的工作流變?yōu)樾袠I(yè)常態(tài)。
一張照片即可生成擬真視頻
依托商湯日日新大模型的多模態(tài)能力,只需上傳一張人物照片,輸入文字腳本或音頻文件,AI就能自動生成人物動態(tài)視頻,并支持多種語言,實現(xiàn)了與真人幾乎無差別的口型匹配、動作呼應(yīng)和情緒表達。
與市面上多數(shù)停留在5-10秒短片段的圖生視頻工具不同,如影圖片數(shù)字人能夠穩(wěn)定生成長達3分鐘以上的動態(tài)視頻,全程保持人物ID、背景風格的高度一致性。
如影圖片數(shù)字人還能通過提示詞,如“揮手”,精準驅(qū)動人物肢體動作,甚至支持快速大幅度手部動作,解決“動作僵硬、與內(nèi)容脫節(jié)”問題。
在媒體傳播中,自媒體創(chuàng)作者可以用自己的照片生成口播短視頻,新聞機構(gòu)也能借助3D人物圖實現(xiàn)多語種播報。就像這次2025中國新媒體技術(shù)展的數(shù)字形象代言人“妹陀”,就是使用了如影圖片數(shù)字人技術(shù)生成。
“看起來是一個3D建模加渲染出來的數(shù)字人,但實際上只用了一張AI圖片和一段提示詞,可以說降低了傳統(tǒng)數(shù)字人技術(shù)將近90%的時間和成本”,李星冶介紹道。
除此之外,“如影”數(shù)字人平臺的核心能力也正為企業(yè)營銷和直播帶貨帶來革命性變化。
“想象一下,一個成熟的真人直播間,想要復(fù)制到不同平臺或?qū)崿F(xiàn)24小時不間斷直播,通常需要投入大量的人力、設(shè)備和場地成本。”
李星冶分享了一個令人震撼的案例,“但通過‘如影’數(shù)字人平臺,我們可以無需視頻采集,直接復(fù)刻一個現(xiàn)有的直播間,實現(xiàn)‘當日復(fù)刻,當日開播’。這讓數(shù)字人直播間的運營效率相比傳統(tǒng)模式提升了整整10倍。”
“如影”的背后,是商湯自研的“日日新SenseNova”大模型體系在提供強大支持。
它整合了文本生成、語音合成、動作生成等多種AI能力,讓用戶可以像“拼樂高”一樣,快速創(chuàng)建一個高度擬人、音畫同步的個性化數(shù)字人,用于生成高質(zhì)量的短視頻、進行直播帶貨等。
值得一提的是,該平臺已通過中國信通院的“可信虛擬人生成內(nèi)容管理系統(tǒng)”測評,確保了生成內(nèi)容的安全與可信。
目前,“如影”已廣泛應(yīng)用于教育、金融、營銷等多個領(lǐng)域,成為企業(yè)降本增效的利器。
AI技術(shù)推動新媒體行業(yè)邁向高質(zhì)量發(fā)展
基于過去一年的行業(yè)實踐,李星冶也分享了商湯科技對于AI大模型與新媒體融合的思考。
價值核心從“可生成”轉(zhuǎn)向“生成可控”。“早期的AI生成工具,大家驚嘆于它能‘畫出來’‘做出來’。但現(xiàn)在,行業(yè)更關(guān)心的是能否精準地控制生成結(jié)果,以體現(xiàn)創(chuàng)作者的獨特意圖和滿足商業(yè)化需求?!崩钚且敝赋?,尤其是在短劇、廣告片等專業(yè)領(lǐng)域,豐富的可編輯性至關(guān)重要,這直接關(guān)系到內(nèi)容能否真正落地,并確保其合規(guī)與安全。
未來發(fā)展不能靠“單打獨斗”,必須“共建生態(tài)”?!癆I大模型技術(shù)在新媒體領(lǐng)域的落地,絕非一家公司推出一款產(chǎn)品就能成功的?!崩钚且睆娬{(diào),“它需要與廣大的內(nèi)容創(chuàng)作者、平臺方、行業(yè)伙伴攜手,共同構(gòu)建一個繁榮的生態(tài),才能滿足千變?nèi)f化的場景需求,讓AI真正融入產(chǎn)業(yè)血脈,發(fā)揮其最大價值。”
中國新媒體大會作為行業(yè)發(fā)展的“風向標”,始終敏銳捕捉并推動著技術(shù)變革在媒體領(lǐng)域的深度融合。
李星冶認為,AI企業(yè)積極參與大會,不僅展示前沿技術(shù),更通過實際的產(chǎn)品與解決方案,為整個新媒體生態(tài)持續(xù)注入三重關(guān)鍵動能:
一是重塑內(nèi)容生產(chǎn)流程,實現(xiàn)“降本增效”。AI技術(shù)正推動內(nèi)容創(chuàng)作從高成本、長周期的傳統(tǒng)模式,轉(zhuǎn)向低成本、快迭代的智能化生產(chǎn),大幅降低專業(yè)創(chuàng)作門檻。
二是提升商業(yè)轉(zhuǎn)化效率,拓展營銷邊界。以數(shù)字人直播間為代表的AI工具,以更高性價比和靈活部署能力,為直播電商、品牌營銷等領(lǐng)域提供了更高效的轉(zhuǎn)化路徑。
三是推動傳統(tǒng)文化破圈,激活文化IP價值。通過技術(shù)手段賦能文博資源,AI能夠助力傳統(tǒng)文化以更生動、更貼近年輕語境的形態(tài)實現(xiàn)當代傳播,完成從文化資源到文化資產(chǎn)的轉(zhuǎn)化。
可以預(yù)見,隨著AI深度融入內(nèi)容創(chuàng)作全鏈路,一個更具創(chuàng)造力、運營更高效、生態(tài)更多元的新媒體時代正加速到來。
本文為湖南頻道原創(chuàng)文章,轉(zhuǎn)載請附上原文出處鏈接和本聲明。
本文鏈接:https://hn.rednet.cn/content/646955/56/15425751.html
熱門
聯(lián)系我們:435 226 40 @qq.com
版權(quán)所有 重播新聞網(wǎng) www.zzx33.com 京ICP備2022022245號-17