網站地圖 - 關於我們
您的當前位置: 首頁 > 業界 > 頭條 正文

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門

作者:用戶投稿 時間:2023-04-01 14:28
導讀:AIGC 正從效率、質量、創意、多樣性各方麵革新內容生產流程,伴隨 firely、midjourney 等現象級的產品出現,AIGC 將逐步廣泛服務於內容生產的各類場景與內容生產者,隨著 AIGC 在內容生產的需求場景不斷增加,騰訊多媒體實驗室也在 AIGC 領域持續發力,並通過數據萬象將能力成功應用到傳媒、社交、文娛等多個行業,逐步夯實全場景內容生產力。足球精彩集錦數據萬象泛互與傳媒客戶擁有不小

AIGC 正從效率、質量、創意、多樣性各方麵革新內容生產流程,伴隨 firely、midjourney 等現象級的產品出現,AIGC 將逐步廣泛服務於內容生產的各類場景與內容生產者,隨著 AIGC 在內容生產的需求場景不斷增加,騰訊多媒體實驗室也在 AIGC 領域持續發力,並通過數據萬象將能力成功應用到傳媒、社交、文娛等多個行業,逐步夯實全場景內容生產力。

足球精彩集錦

數據萬象泛互與傳媒客戶擁有不小體量的體育視頻數據處理需求,尤其是賽事期間,足球賽事作為最受歡迎的體育賽事內容消費量一直居高不下,球迷對其內容的可觀賞性要求也頗高,由於時長問題,未經剪輯的足球比賽不能直接投放到體育新聞、短視頻等場景用於賽事宣傳。為此,騰訊多媒體實驗室基於自研的 AIGC 係列技術,通過騰訊雲數據萬象產品為廣大客戶帶來足球比賽的智能剪輯能力,在沒有人工剪輯參與的情況下自動生成賽事高光內容。

技術介紹

數據方麵,騰訊多媒體實驗室采集了 1200 多場具有代表性的足球賽事並標注了高精度的數據集。數據集覆蓋各類著名聯賽和杯賽,累計 600 多個小時。同時,騰訊多媒體實驗室設置了 19 個關鍵事類別,針對每一段視頻準確標注出全部關鍵事件的起始點、結束點和對應類別。關鍵事件分布如下圖,基本可以反映真實比賽的數據分布。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖1)

【數據集關鍵事件分布】

算法方麵,騰訊多媒體實驗室設計了一個基於智能拆條和進球檢測的多模態方案來完成智能剪輯。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖2)

【多模態智能剪輯方案】

智能拆條模塊基於視頻的圖像序列和音頻信息,通過子任務抽取多模態特征,再由事件檢測模型定位各類關鍵事件。針對單幀圖像、音頻信息、圖像序列,騰訊多媒體實驗室基於事件標簽有監督地訓練了三個特征提取器,用於提取圖片、聲音、動作等多模態特征。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖3)

事件檢測模型接受由時序卷積編碼再拚接的多模態融合特征作為輸入,評估各個時刻屬於事件開始、結束、過程的概率,並由此構建候選區間和對應的時序特征。候選區間評估階段利用時序特征評估對應區間與真實事件區間的交並比,進而實現事件定位。最後結合子任務階段獲取的事件標簽以及後處理算法就可以得到準確的事件拆條結果。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖4)

【事件檢測模型】

智能拆條的效果指標 mAP 達到了 82%,其中定位球和回放等事件的對應指標更是達到 90% 以上。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖5)

【運動戰精彩集錦示例】

進球檢測模塊通過判斷比分變化情況來對進球事件作補充。在上述方案中,進球事件的召回率並不高,原因是騰訊多媒體實驗室並沒有充分利用視頻裏的比分信息,最直觀的解決辦法是利用比分信息幫助判斷當前的進球情況。在實際應用中,進球檢測模塊針對視頻幀序列檢測出比分牌位置,然後適當擴大邊緣後再做文字檢測獲取當前幀比分數位置,通過多幀聚類得到當前比賽的比分數位置,最後利用文字識別技術獲得比分序列,根據比分單邊遞增規則確認進球時刻。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖6)

【進球檢測模塊】

進球檢測模塊將進球事件的召回率提高到 96%,提高了集錦的完整性和精彩程度。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖7)

【進球精彩集錦示例】

在足球場景的智能剪輯方案中,騰訊多媒體實驗室還新增了球星識別模塊,用於剪輯特定球星片段。該模塊通過使用人臉檢測算法定位視頻中的所有人臉,然後使用人臉識別模型編碼人臉特征,通過聚類算法得到相似人臉序列,最後在球星人臉數據庫中查找與之匹配的球星。目前騰訊多媒體實驗室的方案可識別 500 多位人氣球星。

現該功能已在數據萬象多個體育客戶案例中落地,日均處理量持續攀升,大幅提升數據萬象客戶賽事周邊後期生產速率。

影視精彩集錦

除了體育,自研的智能剪輯還支持電視劇、動漫等影視場景,可以根據用戶指定的人物、動作、情感、關鍵詞等信息自動生成所需集錦視頻。

以人物向為例,用戶隻需要提供 2~3 張某個人物的照片,係統便可注冊對應人物,剪輯時指定需要剪輯的角色(或列表)即可生成人物集錦。再搭配音樂卡點,上熱門妥妥的!

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖8)

【人物向集錦】

線索集錦方麵,用戶可以根據劇情內容指定某個關鍵詞作為線索,係統將自動檢索劇集中與此相關的內容,並生成關鍵詞集錦,打造全網最清晰的故事線。

騰訊多媒體實驗室 AIGC 能力助力數據萬象開啟智能剪輯大門(圖9)

【線索詞集錦】

現該功能已獲得數據萬象體驗館、智能工具箱、控製台中超高點擊率,吸引眾多用戶關注使用,此場景能夠根據用戶需求靈活調整集錦所需關鍵動作、人物等,歡迎各位用戶前往測試。

未來,騰訊多媒體實驗室將持續投入包括智能剪輯在內的 AIGC 核心能力建設,數據萬象負責人葉嘉梁表示道數據萬象將借助多媒體實驗室在底層 AI 算法多年的積累和建設,結合自身對行業和業務的理解,快速上線了能夠幫助客戶業務實現智能內容生產的能力,豐富的算法也讓業務具備更好的多樣性和靈活性。您可以前往數據萬象進行相關能力體驗,對存儲在對象存儲 COS 上的數據進行創作。數據萬象將持續攜手多媒體實驗室為廣大客戶提供視頻自動剪輯、智能作曲、音樂評分等更多智能化服務,提升內容生產和創作效率。

更多演示內容,可參見公眾號“騰訊多媒體實驗室”。

打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案後使用)等社會化評論插件

欄目分類
最新文章
熱門文章
Copyright © 2021 早報網 版權所有


本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯係客服 710564642@juzkou.com 對其相關內容進行刪除。
早報網登載文章隻用於傳遞更多信息之目的,並不意味著讚同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.juzkou.com互聯網違法和不良信息舉報中心
Top Top