語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：39729104發(fā)布日期：2024-10-22 13:33閱讀：10來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程

本技術(shù)涉及通信，尤其涉及一種語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、通常情況下，運(yùn)營(yíng)商通過(guò)評(píng)估語(yǔ)音質(zhì)量進(jìn)行網(wǎng)絡(luò)問(wèn)題定位和優(yōu)化語(yǔ)音質(zhì)量。在語(yǔ)音質(zhì)量評(píng)估中，發(fā)生用戶接不通和掉話的現(xiàn)象很少，但是通話中發(fā)生單通或斷續(xù)的現(xiàn)象非常多。語(yǔ)音的單通或斷續(xù)是以用戶面數(shù)據(jù)來(lái)評(píng)估語(yǔ)音質(zhì)量，可以直接反映出用戶的實(shí)際通話感知，是運(yùn)營(yíng)商進(jìn)行網(wǎng)絡(luò)問(wèn)題定位和優(yōu)化語(yǔ)音質(zhì)量的關(guān)鍵指標(biāo)。

2、目前，主要通過(guò)機(jī)器學(xué)習(xí)算法擬合或者人為規(guī)定分析通話的語(yǔ)音包的丟包情況，進(jìn)而評(píng)估通話中是否發(fā)生單通或斷續(xù)，以實(shí)現(xiàn)對(duì)語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估。但是，上述方法是采用固定的門(mén)限值來(lái)評(píng)估是否出現(xiàn)單通或斷續(xù)，進(jìn)而導(dǎo)致語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性較低。

技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)，能夠提高語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。

2、為達(dá)到上述目的，本技術(shù)采用如下技術(shù)方案：

3、第一方面，本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估方法，該方法包括：獲取第一語(yǔ)音包，第一語(yǔ)音包為待評(píng)估語(yǔ)音質(zhì)量的語(yǔ)音包；對(duì)第一語(yǔ)音包進(jìn)行處理，確定第一語(yǔ)音包的特征，第一語(yǔ)音包的特征用于指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征；將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中，確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，語(yǔ)音質(zhì)量評(píng)估結(jié)果用于指示第一語(yǔ)音包對(duì)應(yīng)的音頻流中是否存在單通和/或斷續(xù)。

4、在一種可能的實(shí)現(xiàn)方式中，對(duì)第一語(yǔ)音包進(jìn)行處理，確定第一語(yǔ)音包的特征，包括：對(duì)第一語(yǔ)音包進(jìn)行劃分，得到至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包；對(duì)至少一個(gè)時(shí)間段中每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包進(jìn)行解碼，得到每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流；基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流，確定第一語(yǔ)音包的特征。

5、在一種可能的實(shí)現(xiàn)方式中，第一語(yǔ)音包的特征包括每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征，基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流，確定第一語(yǔ)音包的特征，包括：將每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流輸入到特征識(shí)別模型中，確定每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征。

6、在一種可能的實(shí)現(xiàn)方式中，第二語(yǔ)音包的特征包括以下至少一項(xiàng)：用戶的性別、用戶的方言、用戶的語(yǔ)速、或者語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值，語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值為第二語(yǔ)音包對(duì)應(yīng)的音頻流的中斷時(shí)長(zhǎng)位于至少一個(gè)時(shí)長(zhǎng)區(qū)間中每個(gè)時(shí)長(zhǎng)區(qū)間的次數(shù)。

7、在一種可能的實(shí)現(xiàn)方式中，方法還包括：獲取多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，第三語(yǔ)音包為已評(píng)估過(guò)語(yǔ)音質(zhì)量的語(yǔ)音包；基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，對(duì)初始模型進(jìn)行訓(xùn)練，確定語(yǔ)音質(zhì)量評(píng)估模型。

8、在一種可能的實(shí)現(xiàn)方式中，基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，對(duì)初始模型進(jìn)行訓(xùn)練，確定語(yǔ)音質(zhì)量評(píng)估模型，包括：對(duì)多個(gè)第三語(yǔ)音包進(jìn)行處理，確定多個(gè)第三語(yǔ)音包的特征；基于多個(gè)第三語(yǔ)音包的特征和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，對(duì)初始模型進(jìn)行訓(xùn)練，確定語(yǔ)音質(zhì)量評(píng)估模型。

9、在一種可能的實(shí)現(xiàn)方式中，語(yǔ)音質(zhì)量評(píng)估結(jié)果包括以下至少一項(xiàng)：是否出現(xiàn)單通、是否出現(xiàn)斷續(xù)、單通的占比、或者斷續(xù)的占比；其中，單通的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中，出現(xiàn)單通的第二語(yǔ)音包的占比，斷續(xù)的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中，出現(xiàn)斷續(xù)的第二語(yǔ)音包的占比。

10、第二方面，本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估裝置，該裝置包括：通信單元和處理單元；通信單元，用于獲取第一語(yǔ)音包，第一語(yǔ)音包為待評(píng)估語(yǔ)音質(zhì)量的語(yǔ)音包；處理單元，用于對(duì)第一語(yǔ)音包進(jìn)行處理，確定第一語(yǔ)音包的特征，第一語(yǔ)音包的特征用于指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征；處理單元，還用于將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中，確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，語(yǔ)音質(zhì)量評(píng)估結(jié)果用于指示第一語(yǔ)音包對(duì)應(yīng)的音頻流中是否存在單通和/或斷續(xù)。

11、在一種可能的實(shí)現(xiàn)方式中，處理單元，還用于對(duì)第一語(yǔ)音包進(jìn)行劃分，得到至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包；處理單元，還用于對(duì)至少一個(gè)時(shí)間段中每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包進(jìn)行解碼，得到每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流；處理單元，還用于基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流，確定第一語(yǔ)音包的特征。

12、在一種可能的實(shí)現(xiàn)方式中，第一語(yǔ)音包的特征包括每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征，處理單元，還用于將每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流輸入到特征識(shí)別模型中，確定每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征。

13、在一種可能的實(shí)現(xiàn)方式中，第二語(yǔ)音包的特征包括以下至少一項(xiàng)：用戶的性別、用戶的方言、用戶的語(yǔ)速、或者語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值，語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值為第二語(yǔ)音包對(duì)應(yīng)的音頻流的中斷時(shí)長(zhǎng)位于至少一個(gè)時(shí)長(zhǎng)區(qū)間中每個(gè)時(shí)長(zhǎng)區(qū)間的次數(shù)。

14、在一種可能的實(shí)現(xiàn)方式中，通信單元，還用于獲取多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，第三語(yǔ)音包為已評(píng)估過(guò)語(yǔ)音質(zhì)量的語(yǔ)音包；處理單元，還用于基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，對(duì)初始模型進(jìn)行訓(xùn)練，確定語(yǔ)音質(zhì)量評(píng)估模型。

15、在一種可能的實(shí)現(xiàn)方式中，處理單元，還用于對(duì)多個(gè)第三語(yǔ)音包進(jìn)行處理，確定多個(gè)第三語(yǔ)音包的特征；處理單元，還用于基于多個(gè)第三語(yǔ)音包的特征和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，對(duì)初始模型進(jìn)行訓(xùn)練，確定語(yǔ)音質(zhì)量評(píng)估模型。

16、在一種可能的實(shí)現(xiàn)方式中，語(yǔ)音質(zhì)量評(píng)估結(jié)果包括以下至少一項(xiàng)：是否出現(xiàn)單通、是否出現(xiàn)斷續(xù)、單通的占比、或者斷續(xù)的占比；其中，單通的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中，出現(xiàn)單通的第二語(yǔ)音包的占比，斷續(xù)的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中，出現(xiàn)斷續(xù)的第二語(yǔ)音包的占比。

17、第三方面，本技術(shù)提供了一種語(yǔ)音質(zhì)量評(píng)估裝置，該裝置包括：處理器和通信接口；通信接口和處理器耦合，處理器用于運(yùn)行計(jì)算機(jī)程序或指令，以實(shí)現(xiàn)如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

18、第四方面，本技術(shù)提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令，當(dāng)指令在終端上運(yùn)行時(shí)，使得終端執(zhí)行如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

19、第五方面，本技術(shù)提供一種包含指令的計(jì)算機(jī)程序產(chǎn)品，當(dāng)計(jì)算機(jī)程序產(chǎn)品在語(yǔ)音質(zhì)量評(píng)估裝置上運(yùn)行時(shí)，使得語(yǔ)音質(zhì)量評(píng)估裝置執(zhí)行如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

20、第六方面，本技術(shù)提供一種芯片，芯片包括處理器和通信接口，通信接口和處理器耦合，處理器用于運(yùn)行計(jì)算機(jī)程序或指令，以實(shí)現(xiàn)如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

21、具體的，本技術(shù)中提供的芯片還包括存儲(chǔ)器，用于存儲(chǔ)計(jì)算機(jī)程序或指令。

22、上述技術(shù)方案至少帶來(lái)以下有益效果：獲取第一語(yǔ)音包，對(duì)第一語(yǔ)音包進(jìn)行處理，確定第一語(yǔ)音包的特征，并將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中，確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果。本技術(shù)實(shí)施例所記載的語(yǔ)音質(zhì)量評(píng)估方法是基于語(yǔ)音質(zhì)量評(píng)估模型確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，相較于通用技術(shù)中采用固定的門(mén)限值來(lái)評(píng)估語(yǔ)音包的語(yǔ)音質(zhì)量，提高了語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。并且，由于輸入到語(yǔ)音質(zhì)量評(píng)估模型中的第一語(yǔ)音包的特征可以指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征，因此基于第一語(yǔ)音包的特征確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果，不僅考慮了語(yǔ)音本身的特征，還考慮了對(duì)應(yīng)的用戶的特征，進(jìn)一步提高了語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：狄子翔,李貝,呂非彼,只璐,謝志普,劉喜卿,王云云,張琰,張瑋,王培,朱佳佳,程新洲
技術(shù)所有人：中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音質(zhì)檢系統(tǒng)相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程

語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程