KKBOX專攻影音串流KKStream及全方位技術KKLab 用AI音樂創作系統打頭陣

【記者 喬安舞 / 報導】布局 B2B 人工智慧(AI)應用市場及研發,亞洲媒體科技集團─KKBOX Group由旗下專攻OTT影音串流事業體KKStream及全方位技術服務的KKLab打頭陣,將多年累積的產業知識與實務經驗,向外輸出給市場,幫助企業優化系統服務,加速數位轉型。為因應集團化拓展的步伐,KKBOX Group持續增進人才培育以強化研發能量,並且在部分科技人才缺口上,透過經濟部加工出口區管理處協助支援,擴大產學合作的深度與廣度。

用科技解決問題 人才培育結合產學交流

KKBOX憑藉著「用科技技術來解決產業問題」的精神,今年正式邁入第16個年頭。KKBOX服務推出之初便是為了解決盜版猖獗及改變聆聽音樂方式,爾後隨著科技趨勢、應用發展及實務經驗的累積,開始進行多角化的嘗試,從原本的B2C領域延伸至B2B企業服務範疇。現階段KKBOX集團從原本小規模團隊成長至現在超過600人的企業,營運據點包括台北、高雄、日本、新加坡、香港及馬來西亞等亞洲地區,其中職員逾半是工程師。這些人才,也將持續成為KKBOX集團擴大發展的利器。

在公司任職15年,現為KKBOX集團技術與架構總監及KKLab AVP的陳宏益表示,自己可以持續投注於工作的關鍵在於內部的「新創氛圍」,總是不斷嘗試不同領域與優化現有技術。其次,則是KKBOX產品線的延伸,讓工作的挑戰及新鮮度也提高。因此,在網羅技術人才方面,KKBOX集團除了程式語言的能力鑑別外,更看重有獨立思考能力及熱愛挑戰的特質,針對年輕學子,也安排完整的職涯發展規劃。

KKBOX集團對於優秀人才的重視不限地域性,早在2009年便在加工處的協助下進駐高雄軟體園區,設立南部研發中心,並且深耕中南部產學人才介接與培育。加工處指出,針對KKBOX集團的人才需求,至今引薦逾百位人,並實際促成產學合作案例。加工處黃文谷處長更進一步表示,高軟園區實習媒合經過多年耕耘已建立一套完整的模式,能夠在每次的需求產生時快速且有效的應對。陳宏益總監也補充,另一種產學合作方式則是採取實驗室合作,對象是富有研究能量的中央研究院或大學教授,如中山大學、台灣大學、政治大學…等,透過產學合作深耕技術,並加速理論實用化,進而促進產學無縫接軌。

AI聲勢看漲 雙刀利器卡位打頭陣

AI被視為影響未來十年的重大科技趨勢,新政府團隊也甫於520正式對外宣告將全力促進物聯網和人工智慧發展,無疑是對產業注入一股強心針。陳宏益認為AI是一種工具,用來降低人為判斷的錯誤與風險。對KKBOX集團而言,目前最主要的核心價值是能運用AI技術推測使用者的習慣,透過數據分析,預測未來需求、優化用戶體驗。以KKTV研發成果為例,將AI技術拿來做字幕校正,包含錯字、別字,甚至是時間軸誤差;更進一步,可把聲音輸出轉換為影片字幕;或是將長篇影片丟到AI引擎,自動剪輯精華短片;也能挑選擷取吸睛劇照。

陳宏益表示,集團未來B2B的發展比重將會越來越高,第一塊是KKStream,第二塊是KKLab,可說是現階段的雙刀利器:KKStream專注在B2B的影音串流技術服務,結合AI、大數據分析與雲端運算技術提供解決方案。藉由獨家研發的「按主題編碼技術(Per-Title Encoding, PTE)」可減少60%傳輸頻寬、節省40%儲存空間,助OTT平台業者降低營運成本,更能提升用戶觀覽的品質。KKLab則是定位為B2B 科技服務,服務包含人工智慧與機器學習、雲端開發與營運、網站可靠性工程(SRE),範圍橫跨眾多產業如:媒體、娛樂、電信、醫療、塑化等。同時,擁有創新服務/IP育成加速團隊,得以輔佐新事業機會的養成。

獨道AI演算技術成果 跨領域多元應用可期

投入AI技術應用服務以來,KKBOX已有多項顯著成果,舉例來說:
1. BlendVision

KKStream今年推出的最新產品「BlendVision」,是一套種提供給串流平台業者的應用工具組合,源自於KKStream將過去影音串流的技術經驗集大成,萃取成SaaS(Software as a Service)服務。目前已上架至微軟的Azure Marketplace,透過雙方合作可以銷售到全球的市場。

首先推出的應用是BlendVision™ VOD Streaming,有別於一般的轉檔工具,第一階段是導入PTE (Per-Title Encoding,按主題編碼技術),利用AI辨別不同位元速率(Bitrate)進行影片壓縮轉檔,大幅減少傳輸頻寬、節省儲存空間,以降低OTT平台業者的營運成本。接下來第二階段,將進一步導入影像增強技術PSE(Perceptual Streaming Engine,感知串流引擎),強化原始影片的視覺表現,將低解析影片提升一倍畫質,可有效節省頻寬、加快影片啟動時間,提供給觀眾更流暢的高品質串流影像。

2.AI音樂創作系統

這個架構下有三大類,分別是作詞、作曲與編曲。音樂作曲家將一段創作旋律交給AI,系統便能自主編曲,隨後再由作曲家進一步調教,共同協作完成樂曲創作。此外目前會跟知名作詞家合作,透過過去作品集來訓練AI,讓AI學習用字和筆觸,進而創作寫詞。

3.「Stiller」智慧劇照挑選系統

KKStream與台大產學合作,共同開發智慧劇照挑選系統「Stiller」,運用AI人工智慧技術判斷主角、自動挑選與擷取劇照,此技術結合關鍵影格擷取(Key-Frame Extraction)與影像美感評估(Image Aesthetic Assessment)兩大技術來進行視訊理解。其過程是從臉部表情到動作場景,透過不同的面向來強化AI對視訊理解的能力。現階段能夠判讀出重要影片情境並進行劇照挑選,平均每集影片只需60秒就能完成劇照擷取,大幅縮減原本由美術人員逐格截圖的作業時間,並藉由劇照達成吸睛效果,提升影迷點擊播放的意願。

最後,陳宏益也特別提到,AI的應用相當廣泛,他認為KKLab的技術在醫療與金融領域也能有很好的發揮。因此,B2B合作推廣不會僅侷限在既有的影音娛樂產業,期望能透過KKLab最新的技術幫助跨產業的夥伴。以醫療來說,可透過AI技術先從過往的文字、圖像、影片等病歷資料完成病理基本分析,最後作為醫師深度判斷的重要輔助資訊;金融科技部分,近年來數位化也轉趨積極,但與其他國家相比還是略慢。他思考,譬如人工審核貸款的作業過程可以透過AI做第一或第二層的過篩,再將需人為介入判斷的案例轉介;或者透過AI預警判斷接下來哪些對象會遇到還款問題、呆帳的情形。這些都在團隊的研發選項中,而陳宏益也笑稱「我們要再加緊腳步,全世界正面對疫情衝擊,有更多的人、更多的企業需要幫助,如果再快一點,KKBOX集團就可能成為科技國家隊的一員!」。