MRCP協(xié)議-提供語音識(shí)別(ASR)與語音合成服務(wù)(TTS)
發(fā)布時(shí)間:2021-02-16作者:小編閱讀:0
MRCP協(xié)議(媒體資源控制協(xié)議)
媒體資源控制協(xié)議(Media Resource Control Protocol,MRCP)是一種通訊協(xié)議,用以語音服務(wù)器向客戶端提供各種語音服務(wù)(如語音識(shí)別和語音合成)。
MRCP并不定義會(huì)話連接,不關(guān)心服務(wù)器與客戶端是如何連接的,MRCP的消息通常是承載于其它協(xié)議之上,如RTSP,SIP等。
MRCP消息使用類似HTTP等很多Internet協(xié)議一樣的文本格式,每一個(gè)消息包括三一部分:首行,消息頭,消息體。首行說明消息種類及返回碼等信息。消息頭包括了多個(gè)行內(nèi)容,每一行都形如"字段:數(shù)值"。消息體包括了消息的詳細(xì)內(nèi)容,長(zhǎng)度在消息頭中指定。
類似HTTP,MRCP使用請(qǐng)求(通常由客戶端進(jìn)行)、響應(yīng)模式。響應(yīng)能夠簡(jiǎn)單的確定請(qǐng)求,或是得出關(guān)于處理的其它信息。比如,MRCP客戶端向服務(wù)端請(qǐng)求想要推送一些音頻數(shù)據(jù)以進(jìn)行處理(例如語音識(shí)別),因此,服務(wù)端能夠推送一個(gè)包括端口號(hào)的響應(yīng),由于MRCP仍未定義音頻數(shù)據(jù)的傳輸,因此 ,必須借助其它的協(xié)議,例如RTP來進(jìn)行。
有兩個(gè)版本的MRCP協(xié)議,版本2使用SIP作為控制協(xié)議,版本1使用RTSP。
[1]RFC4463:AMedia Resource Control Protocol(MRCP)
MRCP協(xié)議簡(jiǎn)述
媒體資源控制協(xié)議(Media Resource Control Protocol,MRCP)是由Cisco、Nuance等公司聯(lián)合開發(fā)的網(wǎng)絡(luò)協(xié)議,該協(xié)議由IETF作為Internet草案公布(draft-shanmugham-mrcp-07)。該協(xié)議為這些必須進(jìn)行語音處理的客戶端提供了一種通過網(wǎng)絡(luò)來控制媒體處理資源(如ASR、TTS模塊等)的體制。該協(xié)議在設(shè)計(jì)之初就考慮到了能夠在將來得到擴(kuò)展以支持聲紋鑒別和身份識(shí)別(SpeakerIdentification/SpeakerVerification)等作用。
MRCP協(xié)議定義了控制媒體處理資源所必不可少的請(qǐng)求(Request)、回復(fù)(Response)和事件(Event)等消息。MRCP協(xié)議也為每一種資源定義了狀態(tài)機(jī),為每一個(gè)請(qǐng)求和服務(wù)器事件定義了需要的狀態(tài)轉(zhuǎn)換。MRCP關(guān)心的焦點(diǎn)在于控制這些進(jìn)行媒體流處理的資源(如ASR、TTS),以及怎樣與這些資源之間進(jìn)行通信。
MRCP協(xié)議不能獨(dú)立工作,它依賴于RTSP(RealTimeStreamingProtocol)作為載體在客戶端與服務(wù)器端之間建立會(huì)話連接。而語音媒體數(shù)據(jù)則通過RTP(RealTimeTransportProtocol)協(xié)議連接傳輸給語音應(yīng)用服務(wù)器。
典型的根據(jù)MRCP的分布式語音應(yīng)用系統(tǒng)選用C/S架構(gòu),由客戶端傳出媒體流處理請(qǐng)求,服務(wù)器端則運(yùn)用媒體處理資源(ASR/TTS)來處理或生成媒體流,并將相對(duì)的處理結(jié)果返回給客戶端。那樣客戶端就可以通過MRCP協(xié)議來通過網(wǎng)絡(luò)分布式地控制服務(wù)器端的媒體處理資源。
隨著MRCP協(xié)議的持續(xù)推廣與應(yīng)用,各語音技術(shù)廠商在實(shí)踐與布署過程中碰到了各種各樣的問題。因此,IESG(TheInternetEngineeringSteeringGroup)于2002年特許成立了Speechsc工作組,專門負(fù)責(zé)擬定更加完善高效的支持分布式語音資源處理的開放協(xié)議。在Speechsc工作組的努力下,改進(jìn)后的MRCPv2(draft-ietf-speechsc-mrcpv2-09)很快應(yīng)運(yùn)而生了。MRCPv2的消息格式和資源狀態(tài)機(jī)等都建立在MRCP協(xié)議版本1的基本之上,它完全兼容W3C的SSML、SRGS、NLSML規(guī)范。與MRCPv1不一樣的是MRCPv2消息不再依賴RTSP作為載體,只是作為獨(dú)立的消息進(jìn)行傳輸,可是它仍依賴于會(huì)話管理協(xié)議,如SIP(SessionInitiationProtocol)協(xié)議,來在客戶端與服務(wù)器端之間建立控制會(huì)話。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),請(qǐng)聯(lián)系站長(zhǎng)郵箱:shawn.lee@eliancloud.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。
標(biāo)題:MRCP協(xié)議-提供語音識(shí)別(ASR)與語音合成服務(wù)(TTS)
TAG標(biāo)簽:網(wǎng)絡(luò)傳輸
地址:http://www.dangdangload.com/article/20210209164747.html