編輯點評:
阿里云智能語音交互無限試用軟件是一款非常好用的文字轉(zhuǎn)語音工具,它是由論壇網(wǎng)友制作分的,能夠基于阿里云智能語音交互功能幫助用戶無限使用文字轉(zhuǎn)語音,軟件已經(jīng)破解,不限制無限使用
使用說明
1、運行程序,輸入內(nèi)容那個
2、進行相關(guān)設(shè)置和選擇,輸入標(biāo)題,進行合成即可
3、場景和播音員可以在申請接口的時候自行選擇,我自己的接口只選擇一個模式,你們默認(rèn)就好 所以不用選,
語速范圍是-500~500,(太快了自己調(diào)節(jié)到-500就特別慢了,如果點調(diào)節(jié)器太慢就自己寫上去)
語調(diào)范圍是-500~500,
音量,范圍是0~100,
阿里云智能語音交互有什么功能
多種語音場景切換
支持中文轉(zhuǎn)英文翻譯播放
每種場景支持多個播音員播報
支持導(dǎo)出多個格式
支持多種采樣
語速語調(diào)隨意調(diào)整
阿里云:2020最具產(chǎn)業(yè)價值的7個AI領(lǐng)域
阿里云研究中心聯(lián)合埃森哲發(fā)布了《人工智能紅利滲透與爆發(fā)》,中國企業(yè)2020系列報告第二季。報告指出,人工智能產(chǎn)業(yè)已進入全球價值鏈高端,新一代人工智能在智能制造、智能醫(yī)療、智慧城市、智能農(nóng)業(yè)、國防建設(shè)等領(lǐng)域得到廣泛應(yīng)用,我國人工智能核心產(chǎn)業(yè)規(guī)模將超過4000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元。
同時,報告重點講述2020最具產(chǎn)業(yè)價值的7個AI領(lǐng)域:智能語音交互、自然語言處理、機器視覺、知識圖譜、機器學(xué)習(xí)云平臺、工業(yè)大腦、自動駕駛。
1
智能語音交互:重構(gòu)溝通之橋
智能語音交互,是基于語音識別、語音合成、自然語言理解等技術(shù),為企業(yè)在多種實際應(yīng)用場景下,賦予產(chǎn)品“能聽、會說、懂你”式的智能人機交互體驗。
2014年,蘋果公司在iPhone4S中首次植入個人智能助手Siri,智能語音交互搭建起了人與設(shè)備、人與需求、人與數(shù)據(jù)服務(wù)之間的溝通橋梁。智能語音交互的核心技術(shù):語音前端處理-語音識別(自然語言識別)-對話系統(tǒng)(交互技術(shù))-語音合成。
2
自然語言處理:讓機器“理解”人
自然語言處理(NLP)是人工智能的一個重要領(lǐng)域,NLP是機器以書面或口頭的方式理解和解釋人類語言的能力。NLP的目標(biāo)是使計算機和機器在理解語言時與人類一樣智能。盡管目前還無法識別一些語調(diào)語義的細(xì)微差別,但機器已經(jīng)能夠掌握一門語言來并翻譯文本和總結(jié)內(nèi)容。它適用于書面文字,也可用于理解和回應(yīng)口頭請求。
自然語言處理的核心技術(shù):確定內(nèi)容-遣詞定調(diào)-成句達義。
3
機器視覺:像人類一樣“看清”圖像
機器視覺就是使機器能夠像人類一樣看清圖像,處理和識別靜止物體甚至是視頻中連續(xù)動作。理想情況下,由AI引擎的計算機將理解它所看到的內(nèi)容,評估事件并識別值得關(guān)注之處,然后告知用戶所需的應(yīng)對舉措。
機器視覺的核心技術(shù):動態(tài)分析-識別-圖像分群-對象跟蹤-場景重建。
4
知識圖譜:數(shù)據(jù)與智能建立的知識星球
知識圖譜是一門融合了認(rèn)知計算、知識表征與推理、信息檢索與抽取、自然語言處理、語義web、數(shù)據(jù)挖掘和機器學(xué)習(xí)等技術(shù)領(lǐng)域的交叉研究科目。知識圖譜通過知識建模、知識表示、實體識別與鏈接、關(guān)系識別、知識推理等相關(guān)技術(shù)的應(yīng)用從離散的信息海洋里建立以知識為中心的內(nèi)容體系。
5
機器學(xué)習(xí)云平臺:把機器學(xué)習(xí)變成“烹飪”
機器學(xué)習(xí)平臺,打通了數(shù)據(jù)預(yù)處理、特征工程、模型訓(xùn)練、模型評估、模型應(yīng)用的全流程,它就像一個烹飪工具,企業(yè)只需要將數(shù)據(jù)引入,依照PAI上的“菜譜(成熟算法)”,結(jié)合PAI所提供的強大的計算框架,在用戶的操作下就能夠完成一道名為“機器學(xué)習(xí)模型”的菜,通過云來學(xué)習(xí)調(diào)用基礎(chǔ)設(shè)施。
6
工業(yè)大腦:數(shù)據(jù)化與智能化的新思維方式
工業(yè)大腦通過對人傳授的知識進行轉(zhuǎn)化,讓機器變得更聰明。不是簡單地模仿人腦,而是以自己獨特的數(shù)據(jù)化思維方式解決人類解決不了的問題。工業(yè)大腦的思考過程是從數(shù)字到知識再回歸到數(shù)字的過程。一個完整的工業(yè)大腦由四塊關(guān)鍵拼圖組成,分別是云計算、大數(shù)據(jù)、機器智能(算法、模型)與專家經(jīng)驗。
工業(yè)大腦實施路徑:單點智能-智能擴展-全局智能-智能平臺。
7
自動駕駛:智能化出行時代的序幕
自動駕駛,在受控范圍內(nèi)、運營路線固定的情況下,通過多臺智能互聯(lián)自動駕駛電力能源車輛、控制塔統(tǒng)一監(jiān)控的互聯(lián)系統(tǒng)解決方案,實現(xiàn)最優(yōu)運輸規(guī)劃,給物流業(yè)帶來更高的效率、靈活性與可持續(xù)性,有效規(guī)避碰撞。
一文讀懂阿里云通信的產(chǎn)品體系、技術(shù)架構(gòu)與智能化應(yīng)用場景實踐
云通信作為通信基礎(chǔ)設(shè)施,具有很強的行業(yè)普適性和剛需性,其業(yè)務(wù)場景涵蓋了用戶整個生命周期。然而,在企業(yè)使用云通信的過程中,依舊會面臨到技術(shù)門檻高、系統(tǒng)維護治理難、業(yè)務(wù)場景適配挑戰(zhàn)大等問題,阿里云通信是如何圍繞用戶需求,打造場景化產(chǎn)品服務(wù)體系,面向用戶構(gòu)建安全、易用、穩(wěn)定、智能的技術(shù)系統(tǒng),用AI能力賦能企業(yè)降本提效?在5月13日的阿里云通信“加油行動”在線沙龍中,阿里云通信資深運營專家孔繁盛、高級產(chǎn)品經(jīng)理李海波和高級技術(shù)專家劉強奇為我們帶來了答案。
阿里云通信產(chǎn)品體系
阿里云通信起步于2017年,在2018年推出短信、小號、語音等基礎(chǔ)產(chǎn)品,并且推出了國際短信、號碼認(rèn)證、網(wǎng)絡(luò)加速服務(wù)等創(chuàng)新產(chǎn)品,完善了產(chǎn)品矩陣。在2019迎來規(guī);l(fā)展,這一年中服務(wù)了60多萬家中小客戶,完美支撐了阿里經(jīng)濟體天貓雙11活動,在當(dāng)天實現(xiàn)了20億條短信到達,5000萬次呼叫,5500萬次號碼隱私服務(wù),國際短信覆蓋了200多個國家。
阿里云通信高級產(chǎn)品專家李海波表示:“我們認(rèn)為整個云通信的趨勢,第一是通信技術(shù)與互聯(lián)網(wǎng)技術(shù)融合,方便業(yè)務(wù)靈活快速調(diào)用。第二是通信行業(yè)典型應(yīng)用,從內(nèi)容生產(chǎn)、內(nèi)容管理、內(nèi)容個人性化分發(fā)等方便,都會向智能化的方向去演進!
云通信實際上是運營商通信能力的云化,下面的云通信產(chǎn)品大圖中,綠色部分是云通信基礎(chǔ)能力,包含了短信和語音服務(wù),細(xì)分子產(chǎn)品涵蓋國內(nèi)短信、國際短信、閃信、數(shù)字短信、卡片短信等,語音服務(wù)結(jié)合AI、自然語言處理能力實現(xiàn)了語音通知、語音雙呼、智能線路等子產(chǎn)品。中間的黃色部分,其實是互聯(lián)網(wǎng)域IT能力和CT領(lǐng)域的融合產(chǎn)品,這里面包含了號碼隱私保護、融合通信、云視頻會議,號碼隱私保護是阿里云通信與運營商聯(lián)合創(chuàng)新推出的一個產(chǎn)品,已經(jīng)在網(wǎng)約車出行、外賣等行業(yè)形成標(biāo)桿落地。最上一層是借助數(shù)據(jù)化、智能化的服務(wù)能力深入企業(yè)業(yè)務(wù)場景,通過智能聯(lián)絡(luò)中心和號碼服務(wù)等產(chǎn)品,幫助企業(yè)快速提升生產(chǎn)效率。
云通信平臺技術(shù)架構(gòu)
云通信的整體平臺架構(gòu)構(gòu)建在阿里云的基礎(chǔ)設(shè)施之上,技術(shù)架構(gòu)分層上從底向上分別出口網(wǎng)關(guān)、業(yè)務(wù)能力、接入網(wǎng)關(guān)三層,如下圖所示。
其中出口網(wǎng)關(guān)層,主要是面向供應(yīng)鏈體系,通過多協(xié)議適配、多接入方式、多region部署解決供應(yīng)鏈資源快速的接入和使用,同時在高可用性上通過物理、邏輯多維度的隔離的隔離措施以及全覆蓋的心跳管理體系,解決供應(yīng)鏈通道出現(xiàn)故障時的快速隔離和恢復(fù)。
在出口網(wǎng)關(guān)層之上,就是針對通信業(yè)務(wù)比較核心的基礎(chǔ)能力平臺,技術(shù)上主要通過多隊列、削峰填谷、業(yè)務(wù)客戶等維度資源隔離、延遲、限流、降級容災(zāi)等一系列的手段保障平臺穩(wěn)定運行。通過這些年的積累,形成了通信業(yè)務(wù)的安全、調(diào)度平臺,結(jié)合ASR、TTS、NLP等AI技術(shù),解決業(yè)務(wù)的安全、多模型的調(diào)度策略,讓通信業(yè)務(wù)更健康、更高效的觸達消費者。
在統(tǒng)一接入層,主要聚焦在多語言、多協(xié)議以及統(tǒng)一的接入標(biāo)準(zhǔn)的制定上,初心一直堅持圍繞企業(yè)客戶以及開發(fā)這能更便捷、快速的接入和使用。我們基于阿里云的標(biāo)準(zhǔn)接入流程提供了https的接入方式,基于云通信的特性也封裝適配了cmpp、smpp、 sip等相關(guān)協(xié)議,在統(tǒng)一接入層主要實現(xiàn)統(tǒng)一的權(quán)限管理、流量控制、狀態(tài)碼和回執(zhí)消息的推送。
為了能讓客戶更方便的管理和使用云通信的服務(wù),除了提供官網(wǎng)控制臺的基礎(chǔ)開通、查詢等功能,我也提供了面向開發(fā)者的多語言的OpenAPI SDK以及移動、PC端側(cè)SDK,覆蓋各種業(yè)務(wù)場景,通過技術(shù)手段幫助客戶快速、便捷地集成使用云通信的能力。
云通信平臺演進關(guān)鍵技術(shù)
阿里云通信高級技術(shù)專家劉強奇認(rèn)為:阿里云通信平臺技術(shù)演進至今,始終圍繞著“安全、易用、穩(wěn)定、智能”四個核心技術(shù)方向在發(fā)力。
一、安全
面向海量的開發(fā)者和企業(yè)客戶,最核心的是要保障數(shù)據(jù)在傳輸鏈路、存儲過程中,以及語音通話內(nèi)容和賬號等各層面的安全性。阿里云通信在底層傳輸上是基于阿里云整體的安全體系的,十分重視數(shù)據(jù)傳輸?shù)募用芤约罢麄合規(guī)流程和資質(zhì)審查,在客戶賬號體系,也通過RAM訪問控制來確保賬號安全。同時,在也在產(chǎn)品服務(wù)層面落地安全,包括號碼隱私保護,通過中間號來解決平臺上號碼隱私泄露問題;號碼認(rèn)證服務(wù)通過機卡機卡一體校驗,解決短信嗅探、卡池遠(yuǎn)程提供驗證碼等電信詐騙問題;在短信驗證碼的交互的過程中引入風(fēng)控技術(shù)和和引擎,結(jié)合AI能力,解決短信驗證碼防刷的問題。
二、易用
劉強奇表示:“云通信平臺本身定位是一個PaaS平臺,面向客戶SaaS化的產(chǎn)品會有大量的集成需求,所以我們會更關(guān)注在端SDK以及API使用上的易用度,開發(fā)者能不能更快速的去接入,接入體驗和使用過程是不是更好,能不能適配多一些多語言,這是我們重點解決和關(guān)注的問題。”
在易用性層面,云通信在接入SDK層面,目前涵蓋7種流行語言的SDK和DEMO,參照Demo開發(fā)者可以通過十行以內(nèi)代碼輕松實現(xiàn)搞定企業(yè)的通信需求,在移動和PC同時也提供了Android、iOS、H5的端側(cè)SDK。在實操上,云通信也提供了非常多的執(zhí)行文檔操作指引,以及控制臺上的自助服務(wù),以及批量的一些SaaS化的工具和DEMO,幫助開發(fā)者更靈活、便捷地集成服務(wù)。
三、穩(wěn)定
在企業(yè)生產(chǎn)過程中,平臺運行的穩(wěn)定性是重中之重!霸诜(wěn)定性上, “1、5、10”是我們始終追求的目標(biāo),1分鐘發(fā)現(xiàn),5分鐘定位,10分鐘恢復(fù)!痹谙到y(tǒng)的穩(wěn)定性和高可靠上主要是圍繞4個方向展開。
第一是在全鏈路的容災(zāi)體系建設(shè),當(dāng)前整體鏈路包括對于第三方的依賴完整支持了雙機房、雙活高可用體系的建設(shè)。在整個鏈路上通過心跳等實時探測機制,在應(yīng)用、機器、機房維度出現(xiàn)故障是具備分鐘級別隔離的能力;诎⒗锉旧沓恋淼墓收涎菥殭C制,會通過定期、突襲的演練方式,發(fā)現(xiàn)問題逐步迭代完善、演進平臺的技術(shù)架構(gòu)。
第二是在統(tǒng)一的接入和網(wǎng)關(guān)的接入層面,采用了多region的策略,就近邊緣部署,降低接入成本,降低數(shù)據(jù)在物理網(wǎng)絡(luò)鏈路傳輸過程中的時延,保障通話質(zhì)量。同時,跨region的容災(zāi)體系可以在當(dāng)某個region出故障的時候,能夠切換到另外一個region進行服務(wù),進一步提升服務(wù)的穩(wěn)定性。
第三是主要在網(wǎng)關(guān)層面,通過不同的接入方式,以及多維度降級、逃生的容災(zāi)策略,基于客戶特性、產(chǎn)品特性和資源特性做了不同維度的降級和切換策略來保障極端情況下的業(yè)務(wù)持續(xù)可用。
第四是在整個鏈路層面進行監(jiān)測以及分級告警,針對核心業(yè)務(wù)和核心鏈路提供7x24小時運維保障,針對系統(tǒng)運行過程中出現(xiàn)的告警定義了p1-p4的分級,對不同級別的告警我們采用了多種的觸達方式,如釘釘消息、短信、電話形式進行不同配置的觸達,通過告警的升級和觸達方式的升級盡可能保證在最短的時間內(nèi)發(fā)現(xiàn)問題、處理問題,恢復(fù)線上的生產(chǎn)。
第四,智能
如何引入AI技術(shù)讓通信能力更加智能,圍繞客戶成本和效率解決實際業(yè)務(wù)問題,是近幾年云通信領(lǐng)域的熱點。首先重點介紹ASR技術(shù)在通信平臺中的應(yīng)用:在傳統(tǒng)的點對點語音通話交流過程中,通過實時ASR技術(shù)將通話過程中的語音媒體轉(zhuǎn)成文本,通信平臺通過http、https的標(biāo)準(zhǔn)協(xié)議將通過文本內(nèi)容推送到企業(yè)應(yīng)用上,企業(yè)側(cè)拿到這個文本可以做一些疊加的能力,如意圖識別、質(zhì)檢或可視化工具等能力。
在這個基礎(chǔ)能力之上,逐步演變成了智能外呼的產(chǎn)品,在疫情期間的智能防疫機器人,去進行人員的回訪,通過機器人外呼代替人工,降低了疾控中心工作人員的時間成本。在這個業(yè)務(wù)場景架構(gòu)中,云通信提供的兩層能力,第一層能力是我們在控制臺上提供了一套標(biāo)準(zhǔn)化的SaaS工具,提供了機器人的定義、流程編排、語音文件以及意圖、知識庫的管理能力。為了持續(xù)提升機器人交流過程中的準(zhǔn)確度,提供了一個基于行業(yè)的通用模型和專有模型,通過語料訓(xùn)練持續(xù)的去提升機器人的聰明度。同時,也將這塊能力進行了對外開放,通信平臺將過程中識別出來文本、意圖內(nèi)容通過API的方式開放出去,企業(yè)客戶可以基于自身的業(yè)務(wù)場景和需求進行定制化的開發(fā),在通話過程中通過云通信平臺定義的標(biāo)準(zhǔn),實時交互、響應(yīng)對通話過程進行管理和控制。
劉強奇:“未來,云通信會繼續(xù)發(fā)力全球節(jié)點的覆蓋,同時構(gòu)建基于全球化的多數(shù)據(jù)中心,保證業(yè)務(wù)的高可用性和高可靠。我們也會嘗試異地多活的場景,把高可用提升到更高的層次!
云通信+AI的應(yīng)用場景
一、數(shù)字短信助手:用AI提升內(nèi)容制作效率
數(shù)字短信實際上屬于富媒體短信,需要快速制作符合數(shù)字短信對于內(nèi)容大小、圖片分辨率、視頻編解碼格式等規(guī)格的要求。整個制作流程包括:海量素材的篩選、素材拼接編輯、數(shù)字短信生成以及內(nèi)容的審核,這對內(nèi)容制作者的要求比較高。
阿里云與生態(tài)合作伙伴新華智云和ISV合作伙伴夏貓聯(lián)合,推出數(shù)字短信助手,幫助商家解決內(nèi)容制作成本過高的問題,利用AI的能力實現(xiàn)智能生產(chǎn),包括一鍵轉(zhuǎn)視頻、智能壓縮、智能剪輯等功能,把用戶的素材轉(zhuǎn)變成符合數(shù)字短信規(guī)則的內(nèi)容,同時在生產(chǎn)端快速審核,從而高效觸達用戶,提升營銷轉(zhuǎn)化率。
二、內(nèi)容審核:用AI提升內(nèi)容審核效率
在內(nèi)容審核場景中,阿里云通信基于阿里巴巴集團、達摩院在NLP、ASR、TTS方面的積累,與自身對短信的身份、行為和內(nèi)容的理解的基礎(chǔ)上,可以迅速對業(yè)務(wù)和行為進行識別,包括對行業(yè)屬性、意圖、關(guān)鍵詞、圖片等內(nèi)容的過濾,發(fā)現(xiàn)和攔截違規(guī)內(nèi)容,非常有利于企業(yè)對通信內(nèi)容的合規(guī)性審核效率提升。
三、智能聯(lián)絡(luò)中心:用AI讓語音觸達更高效
智能聯(lián)絡(luò)中心是阿里云整合達摩院先進人工智能技術(shù)和云通信能力構(gòu)建的一套智能聯(lián)絡(luò)平臺,提供豐富的PaaS層接口,包含了云通信組件、智能語音交互PaaS組件以及軟電話的坐席組件,可以幫助企業(yè)或生態(tài)伙伴快速搭建一套聯(lián)絡(luò)中心系統(tǒng)。它的應(yīng)用場景包括:售前熱線、客戶關(guān)懷與回調(diào)、會員營銷等等,可以實現(xiàn)對傳統(tǒng)單向語音通知的交互式升級。在過程中,企業(yè)不需要重復(fù)造輪子,只需要關(guān)注自己企業(yè)特定的知識庫和特定用戶群體的特征就可以了,將背后的業(yè)務(wù)邏輯和技術(shù)交給阿里云通信。
智能聯(lián)絡(luò)中心典型應(yīng)用場景就是與菜鳥合作的物流產(chǎn)品的送前電聯(lián),菜鳥機器人把文本的對話邏輯通過在線的方式或者熱線的方式快速地將快遞派件信息推送給用戶。與快遞公司的包裹的信息、快遞員信息做了一些打通,菜鳥機器人就可以快速的調(diào)用快遞公司的行業(yè)知識庫以及消費者畫像,快速的觸達到用戶,這還適用于自助下單郵寄的場景。
四、云視頻會議:AI讓會議更智能
除了以上AI+云通信的應(yīng)用之外,云視頻會議也成為當(dāng)下炙手可熱的互聯(lián)網(wǎng)核心能力,也是云通信應(yīng)用的一個典型場景。
阿里云的云視頻會議能夠為客戶提供開放、可靠、智能的會議PaaS服務(wù),基于阿里集團數(shù)年視頻會議技術(shù)及應(yīng)用積累、全球部署的網(wǎng)絡(luò)節(jié)點覆蓋,客戶可快速構(gòu)建多端互通與簡單易用的會議協(xié)作應(yīng)用,通過云+端的能力組合,讓整個會議更加高效便利。
這其中也會包含一些AI的應(yīng)用,比如,與達摩院合作實現(xiàn)智能化的會議紀(jì)要,通過語音識別、內(nèi)容理解、NLP、行業(yè)知識庫等實現(xiàn)會議摘要內(nèi)容;蛘撸ㄟ^AI虛擬背景,實現(xiàn)與當(dāng)時會場氛圍或者是聊天氛圍更加契合的背景設(shè)置。
云通信三個“新”助力企業(yè)與用戶數(shù)字化連接
阿里云通信資深產(chǎn)品運營專家孔繁盛表示:“在2020年,阿里云通信會圍繞三個“新”全面深化通信布局,第一是更多新產(chǎn)品,包括企業(yè)公眾號、5G消息;第二是新技術(shù),“AI+”和“分析+”使能用戶;第三是新場景,無論是傳統(tǒng)物流、電商、新零售,還是在數(shù)字教育、數(shù)字金融、出行等領(lǐng)域,更好地和場景結(jié)合。用具備安全、便捷、增值特點的云通信,幫助企業(yè)信息能夠更快、更廣、更有效益地觸達用戶,進而順利地完成與用戶的數(shù)字化連接!
熱門評論
最新評論