在全球疫情爆發、經濟下行壓力加大雙重影響下,國內外資本、人才、貿易、產業鏈均受到不同程度影響,消費者需求和企業運營模式加速向線上傾斜,智能化場景愈加多元和深入,人工智能尤其是智能語音行業市場逆勢上揚,整體利好。
新發展格局下,產業數字化驅動人工智能向多元化、融合化發展,技術輸出‘厚度’增加,‘邊界’擴大,智慧城市加速構建,‘泛在智能’初見雛形。捷通華聲董事長武衛東在接受億歐智庫獨家專訪中,對人工智能產業發展給出了這樣的判斷。同時,結合自身20余年的發展歷程,與億歐智庫針對智能語音市場現狀與發展趨勢進行了深度探討。
捷通華聲董事長武衛東在2020中國人工智能年會上演講
中國人工智能產業發展的縮影
第三次人工智能發展浪潮來臨前夕。
2000年,幾位清華學子懷著讓機器‘能說會聽,能寫會看,能辨音會認人,能思考會判斷’,為人們的生活帶來輕松與便捷的美好愿望,成立捷通華聲,是國內最早投入人工智能領域的創業團隊之一。
深度學習開啟人工智能新一輪繁榮。
2011年,基于深度神經網絡的聲學模型在大詞匯量連續語音識別任務上獲得了顯著的性能提升,智能語音領域研究開始轉向深度學習。這一年,捷通華聲對外發布靈云平臺,將語音識別、語音合成、語義理解、機器翻譯等智能語音、智能語義技術面向產業全面開放。
2016年,語音識別準確率第一次達到人類水平,進入快速落地期。智能語音成為金融、能源、電信、互聯網等行業產業提升發展戰略的關鍵詞。人工智能發展進入新階段,成為新一輪產業變革的核心驅動力。
深耕AI二十載,匠心鑄就領先。本著對核心技術孜孜不倦的探索精神和務實推進的原則,捷通華聲在不斷摸索中走出了自己的道路,即以自主研發的人工智能算法為核心,以市場應用為導向,推進智能語音、智能語義等技術研發持續創新與融合,形成由技術到平臺、由產品到解決方案全覆蓋的產業生態,全面融入經濟社會發展。
智能語音:人機交互的綜合體現
語音是人類最直接、最簡潔的交流方式。同樣,以實現人和機器像人與人一樣無障礙交流為使命的智能語音技術,被認為是數智化時代萬物智聯最方便的入口。相對整個人工智能產業,智能語音產業化程度更高,是所占份額比例較大的細分領域,正以其廣闊的產業化應用席卷人們日常生活和工作的方方面面。
提到智能語音,公眾最直觀的感受可能是語音識別,但實際上智能語音所包含的內容遠比我們想象的復雜。武衛東介紹到。
完整的智能語音包括聲音信號的前端處理、將聲音轉為文字供機器處理、在機器生成語言之后,用語音合成技術將文本語言轉化為聲波,從而形成完整的人機語音交互鏈條。背后涉及聲學研究、語言學研究、數字信號處理、自然語音處理研究及垂直場景的深度語義理解,如果要感知聲音的起止、講話人身份和語種等特征,還需另外進行語音喚醒、聲紋識別和語種分類等任務。就像一個拼接的木桶,每一個環節出現短板,都將直接影響最終交互結果。
捷通華聲與清華大學合作,成立靈云人工智能研究中心、清華海峽院人工智能研究中心,不斷加強對核心技術的研發投入,強化每一個板塊,實現語音識別、語音合成、語義理解、機器翻譯等多項技術保持行業領先,同時推動各項技術交叉融合,為人工智能持續發展積蓄力量。
正是對核心技術不斷創新和融合發展的堅持,捷通華聲在推進各行業智能化發展的過程中形成了自身獨特的優勢,成長為中國人工智能技術實力的引領者和產業化應用的探索者。
資本是推手,技術是核心,產業需求才是根本
政策與市場雙重驅動下,人工智能行業迎來了發展的黃金時代。作為萬物智聯的入口,語音賽道更是有參與者不斷入局。但需要注意的是,這些企業雖然估值很高,盈利能力卻很有限,甚至可能還在虧本。
人工智能產業發展過程中,資本是推手,技術是核心,產業需求才是根本。武衛東這樣向記者釋疑。
高新技術是高投入、高回報、高風險的領域,人工智能是引領未來的戰略性技術,很受資本青睞。但是,僅依賴資本驅動,容易出現在投入、建設階段大干快上,卻在應用環節掉鏈子的行為。
在人工智能領域,技術積累是一個漫長的過程,短期內人工智能服務商難以將技術直接轉化收入,缺乏造血機能,也就無法提升實體產業效率和效益。
風口期快速積累資本,海量宣傳擴大企業知名度,再次吸引資本用于擴充疆土,規劃盈利目標進行上市,這種模式很難形成核心競爭力,自然缺乏造血機能。
人工智能作為新一輪產業變革的核心驅動力,其本質是科技進步對所有產業的提升。只有當人工智能實現與各傳統產業融合應用,才能創造經濟和社會價值。場景決定應用、應用決定市場、市場決定企業發展前景,武衛東說到。
產業數字化發展初期,通用型方案無法滿足定制化需求,每個行業都有自己的問題要解決,有應用場景要突破,需要技術跟場景的深度融合,單一的AI能力已經無法滿足。技術和產業不匹配,是現階段很多AI企業面臨的困境。而且產業落地是有時間周期的,需要人工智能服務商具備一定的行業沉淀以及行業理解,進行能力融合、應用融合和場景融合。只有提升行業的垂直縱深,技術才能擁有更大的落地價值。
明者因時而變,知者隨事而制。經過多年的實戰積累,捷通華聲對于人工智能的場景化應用經驗頗豐,通過AI能力中臺和AI數據中臺雙驅動,廣泛賦能智慧城市、數字金融、智慧社區、智慧醫療、數字政府、智能交通等數字化應用場景。
堅持以核心技術突破為根本,以場景深度融合應用為目標,不斷將市場趨勢和用戶需求落地為方案和產品,是捷通華聲創造良好造血機能,成為行業內少有的盈利企業,并持續保持領先的秘訣所在。
做有價值的人工智能
在談及捷通華聲未來發展規劃時,武衛東表示,捷通華聲的初心一直沒有變,讓每一家企業都能擁有人工智能,讓每一個人都能享受人工智能帶來的輕松與便捷。
在人工智能領域,我們和世界發達國家仍存在一定的技術差距。堅持自主研發,全面增強原始創新能力,在新一輪國際科技競爭中掌握主導權,是中國所有科技作者,包括捷通華聲的價值追求。也是責任,我們將繼續探尋人工智能發展趨勢,堅持對核心技術的研發投入,力爭在行業持續領先。武衛東表示。
人工智能深度融合實體經濟是當前我國重要的經濟戰略。捷通華聲作為智能語音龍頭企業,責無旁貸。武衛東認為,重點在于人工智能應用于傳統行業和服務業,提升實體經濟智能化水平。捷通華聲在服務客戶過程中,積累了豐富的智能化升級經驗,我們將向全產業推廣。
捷通華聲也在積極探索人工智能技術在社區養老等民生場景下的適用性。目前,已形成以靈云社區AI運營大腦為核心,以設備數據信息橋、政府居民連心橋、社區生活便民橋為橋梁,通過靈云鄰通溝通、社區安防治理、社區咨詢服務、智慧生活服務、社區黨建文化、健康養老服務六大場景賦能智慧社區養老建設,打造老年人能用、會用、敢用、想用的智能化產品和服務應用。
武衛東說,我有兩個愿望,一個是看到我們國家科技進步,更加強大。另一個就是盡捷通華聲最大的能力,推動中國人工智能產業發展,為經濟社會發展貢獻一份力量。