2019中國互聯網大會于7月9日-11日在北京國家會議中心舉行。本次大會以“創新求變再出發”為主題,開設物聯網、人工智能等系列分支論壇,匯聚國內重點科研機構及眾多知名互聯網及人工智能企業。
作為國內領先的人工智能語音合成及數據服務提供商,標貝科技應邀亮相大會,攜語音合成解決方案、聲音超市、語音合成語音評測系統、語音數據等系列產品服務,向現場觀眾展現語音合成效果及多場景方案解決,加速推進智能語音合成在商業場景落地。
標貝科技專注數據處理與語音合成業務,聚焦智能客服、智能音箱、機器人、閱讀等核心語音應用市場,為圖像算法及語音合成技術等類別客戶,提供專業數據及語音相關服務。本次參會,標貝科技的語音合成技術及整體解決方案能力得到了集中呈現,獲得了行業上游廠商、現場觀眾及媒體的關注和認可。
聲音超市+語音合成方案解決即時及定制語音合成需求痛點
活動現場,標貝科技通過“你說我學”及“聲音超市”這兩個語音應用產品,展現高質量語音合成效果及合成方案能力。
隨著AI語音技術的逐漸成熟,語音交互將成為重要的人機交互方式。而語音合成則是實現語音交互的重要一環,具有有廣闊的應用場景。業內人士認為,即時性及個性化的語音定制,將是語音合成應用的未來走向。
與傳統流程化定制語音形式不同的是,標貝科技擁有行業領先的端到端語音合成技術,利用自有的海量文本數據和音頻數據,以及深度學習技術、高精度數據自動預處理技術,推出了“聲音超市”市這一整套解決方案。
客戶從“聲音超市”中選擇聲音,無須再經歷定制的流程,便可擁有一套專業的語音合成解決方案。該產品匯集百余種音色,涵蓋多種風格、特色和場景,通過所聽即所得的方式,滿足企業即時應用高質量合成語音的需求。目前應用市場覆蓋智能客服、有聲讀物、虛擬形象等領域,有效降低了客戶的聲音使用成本,提升了效率,改善了用戶體驗。
在定制化合成方面,標貝自主創新打造高質量語音合成方案,基于自有的海量文本數據和音頻數據,及深度學習技術、高精度數據自動預處理技術,利用儲備優質發音人資源進行專業語音合成音庫制作,適用于多行業、多領域、多場景,滿足企業高質量聲音的定制需求。
據官方介紹,標貝自有的合成系統包括多種語音合成、在線語音合成、離線語音合成、多音色合成、個性化語音定制、本地化部署等。而合作服務對象包括百度、阿里巴巴、騰訊、滴滴、京東、字節跳動、搜狗、喜馬拉雅FM等眾多企業。
數據服務技術 助力商業場景落地
在活動上,標貝通過專業問答、案例等形式,展現自身在語音定制、合成方案解決商應有的專業度。而這背后體現的是則是標貝科技擁有扎實且深厚的數據資源基礎和應用能力。
據標貝相關負責人介紹,標貝科技從三個方面,建立自己的競爭壁壘,提升競爭力:數據壁壘、廣泛布局聲音類型IP、技術上尋求新突破。在數據生產方面,標貝擁有完整的語料設計、采集、標注、轉寫、加工處理、優化的能力,實現快速產出高質量的人工智能數據。顯然,數據不僅是標貝產品架構重要的底層基礎,還是參與市場競爭的有力武器。
事實上,語音合成技術需要大量語音數據做支撐,而標貝核心的優勢則是語音數據。這來自于標貝科技早期專注為語音合成類廠商提供數據服務的經驗,讓客戶專心于合成技術的研發,快速實現高質量的合成系統。
以上負責人指出,無論是語音合成方案、聲音超市還是語音合成評測系統方面,數據處理已深入貫穿在每一個環節當中。只有當數據基礎足夠扎實才能跟技術充分融合,才會呈現給用戶悅耳動聽的聲音。
以合成方案為例,在大量語音數據為基礎上,通過高精度自動預處理技術對數據進行處理和建模,再配以Attention機制為基礎的高質量語音合成系統,才會打造出聲音流暢度和自然度上均為理想的語音合成解決方案。
在語音合成評測系統上。數據同樣扮演者著重要角色。憑借在數據處理能力的深厚基礎,標貝科技通過算法+專業的人工數據處理方式,使得其語音合成聲音貼近人聲,加上自主研發了一整套的語音合成測評系統,幫助客戶在短時間內找出問題、原因和解決方法。
盡管語音合成技術水平尚在發展之中,但語音合成技術與智慧生活的結合是不可否認的趨勢。數據服務技術,技術服務生活,二者充分融合,才會加快語音合成商業場景的真正落地。