亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):39729104發(fā)布日期:2024-10-22 13:33閱讀:10來(lái)源:國(guó)知局
語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)與流程

本技術(shù)涉及通信,尤其涉及一種語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì)。


背景技術(shù):

1、通常情況下,運(yùn)營(yíng)商通過(guò)評(píng)估語(yǔ)音質(zhì)量進(jìn)行網(wǎng)絡(luò)問(wèn)題定位和優(yōu)化語(yǔ)音質(zhì)量。在語(yǔ)音質(zhì)量評(píng)估中,發(fā)生用戶接不通和掉話的現(xiàn)象很少,但是通話中發(fā)生單通或斷續(xù)的現(xiàn)象非常多。語(yǔ)音的單通或斷續(xù)是以用戶面數(shù)據(jù)來(lái)評(píng)估語(yǔ)音質(zhì)量,可以直接反映出用戶的實(shí)際通話感知,是運(yùn)營(yíng)商進(jìn)行網(wǎng)絡(luò)問(wèn)題定位和優(yōu)化語(yǔ)音質(zhì)量的關(guān)鍵指標(biāo)。

2、目前,主要通過(guò)機(jī)器學(xué)習(xí)算法擬合或者人為規(guī)定分析通話的語(yǔ)音包的丟包情況,進(jìn)而評(píng)估通話中是否發(fā)生單通或斷續(xù),以實(shí)現(xiàn)對(duì)語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估。但是,上述方法是采用固定的門(mén)限值來(lái)評(píng)估是否出現(xiàn)單通或斷續(xù),進(jìn)而導(dǎo)致語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性較低。


技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估方法、裝置及存儲(chǔ)介質(zhì),能夠提高語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。

2、為達(dá)到上述目的,本技術(shù)采用如下技術(shù)方案:

3、第一方面,本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估方法,該方法包括:獲取第一語(yǔ)音包,第一語(yǔ)音包為待評(píng)估語(yǔ)音質(zhì)量的語(yǔ)音包;對(duì)第一語(yǔ)音包進(jìn)行處理,確定第一語(yǔ)音包的特征,第一語(yǔ)音包的特征用于指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征;將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中,確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,語(yǔ)音質(zhì)量評(píng)估結(jié)果用于指示第一語(yǔ)音包對(duì)應(yīng)的音頻流中是否存在單通和/或斷續(xù)。

4、在一種可能的實(shí)現(xiàn)方式中,對(duì)第一語(yǔ)音包進(jìn)行處理,確定第一語(yǔ)音包的特征,包括:對(duì)第一語(yǔ)音包進(jìn)行劃分,得到至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包;對(duì)至少一個(gè)時(shí)間段中每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包進(jìn)行解碼,得到每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流;基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流,確定第一語(yǔ)音包的特征。

5、在一種可能的實(shí)現(xiàn)方式中,第一語(yǔ)音包的特征包括每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征,基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流,確定第一語(yǔ)音包的特征,包括:將每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流輸入到特征識(shí)別模型中,確定每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征。

6、在一種可能的實(shí)現(xiàn)方式中,第二語(yǔ)音包的特征包括以下至少一項(xiàng):用戶的性別、用戶的方言、用戶的語(yǔ)速、或者語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值,語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值為第二語(yǔ)音包對(duì)應(yīng)的音頻流的中斷時(shí)長(zhǎng)位于至少一個(gè)時(shí)長(zhǎng)區(qū)間中每個(gè)時(shí)長(zhǎng)區(qū)間的次數(shù)。

7、在一種可能的實(shí)現(xiàn)方式中,方法還包括:獲取多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,第三語(yǔ)音包為已評(píng)估過(guò)語(yǔ)音質(zhì)量的語(yǔ)音包;基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,對(duì)初始模型進(jìn)行訓(xùn)練,確定語(yǔ)音質(zhì)量評(píng)估模型。

8、在一種可能的實(shí)現(xiàn)方式中,基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,對(duì)初始模型進(jìn)行訓(xùn)練,確定語(yǔ)音質(zhì)量評(píng)估模型,包括:對(duì)多個(gè)第三語(yǔ)音包進(jìn)行處理,確定多個(gè)第三語(yǔ)音包的特征;基于多個(gè)第三語(yǔ)音包的特征和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,對(duì)初始模型進(jìn)行訓(xùn)練,確定語(yǔ)音質(zhì)量評(píng)估模型。

9、在一種可能的實(shí)現(xiàn)方式中,語(yǔ)音質(zhì)量評(píng)估結(jié)果包括以下至少一項(xiàng):是否出現(xiàn)單通、是否出現(xiàn)斷續(xù)、單通的占比、或者斷續(xù)的占比;其中,單通的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中,出現(xiàn)單通的第二語(yǔ)音包的占比,斷續(xù)的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中,出現(xiàn)斷續(xù)的第二語(yǔ)音包的占比。

10、第二方面,本技術(shù)提供一種語(yǔ)音質(zhì)量評(píng)估裝置,該裝置包括:通信單元和處理單元;通信單元,用于獲取第一語(yǔ)音包,第一語(yǔ)音包為待評(píng)估語(yǔ)音質(zhì)量的語(yǔ)音包;處理單元,用于對(duì)第一語(yǔ)音包進(jìn)行處理,確定第一語(yǔ)音包的特征,第一語(yǔ)音包的特征用于指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征;處理單元,還用于將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中,確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,語(yǔ)音質(zhì)量評(píng)估結(jié)果用于指示第一語(yǔ)音包對(duì)應(yīng)的音頻流中是否存在單通和/或斷續(xù)。

11、在一種可能的實(shí)現(xiàn)方式中,處理單元,還用于對(duì)第一語(yǔ)音包進(jìn)行劃分,得到至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包;處理單元,還用于對(duì)至少一個(gè)時(shí)間段中每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包進(jìn)行解碼,得到每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流;處理單元,還用于基于每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流,確定第一語(yǔ)音包的特征。

12、在一種可能的實(shí)現(xiàn)方式中,第一語(yǔ)音包的特征包括每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征,處理單元,還用于將每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包對(duì)應(yīng)的音頻流輸入到特征識(shí)別模型中,確定每個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包的特征。

13、在一種可能的實(shí)現(xiàn)方式中,第二語(yǔ)音包的特征包括以下至少一項(xiàng):用戶的性別、用戶的方言、用戶的語(yǔ)速、或者語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值,語(yǔ)音中斷時(shí)長(zhǎng)區(qū)間值為第二語(yǔ)音包對(duì)應(yīng)的音頻流的中斷時(shí)長(zhǎng)位于至少一個(gè)時(shí)長(zhǎng)區(qū)間中每個(gè)時(shí)長(zhǎng)區(qū)間的次數(shù)。

14、在一種可能的實(shí)現(xiàn)方式中,通信單元,還用于獲取多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,第三語(yǔ)音包為已評(píng)估過(guò)語(yǔ)音質(zhì)量的語(yǔ)音包;處理單元,還用于基于多個(gè)第三語(yǔ)音包和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,對(duì)初始模型進(jìn)行訓(xùn)練,確定語(yǔ)音質(zhì)量評(píng)估模型。

15、在一種可能的實(shí)現(xiàn)方式中,處理單元,還用于對(duì)多個(gè)第三語(yǔ)音包進(jìn)行處理,確定多個(gè)第三語(yǔ)音包的特征;處理單元,還用于基于多個(gè)第三語(yǔ)音包的特征和多個(gè)第三語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,對(duì)初始模型進(jìn)行訓(xùn)練,確定語(yǔ)音質(zhì)量評(píng)估模型。

16、在一種可能的實(shí)現(xiàn)方式中,語(yǔ)音質(zhì)量評(píng)估結(jié)果包括以下至少一項(xiàng):是否出現(xiàn)單通、是否出現(xiàn)斷續(xù)、單通的占比、或者斷續(xù)的占比;其中,單通的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中,出現(xiàn)單通的第二語(yǔ)音包的占比,斷續(xù)的占比用于指示至少一個(gè)時(shí)間段內(nèi)的第二語(yǔ)音包中,出現(xiàn)斷續(xù)的第二語(yǔ)音包的占比。

17、第三方面,本技術(shù)提供了一種語(yǔ)音質(zhì)量評(píng)估裝置,該裝置包括:處理器和通信接口;通信接口和處理器耦合,處理器用于運(yùn)行計(jì)算機(jī)程序或指令,以實(shí)現(xiàn)如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

18、第四方面,本技術(shù)提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)指令在終端上運(yùn)行時(shí),使得終端執(zhí)行如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

19、第五方面,本技術(shù)提供一種包含指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品在語(yǔ)音質(zhì)量評(píng)估裝置上運(yùn)行時(shí),使得語(yǔ)音質(zhì)量評(píng)估裝置執(zhí)行如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

20、第六方面,本技術(shù)提供一種芯片,芯片包括處理器和通信接口,通信接口和處理器耦合,處理器用于運(yùn)行計(jì)算機(jī)程序或指令,以實(shí)現(xiàn)如第一方面和第一方面的任一種可能的實(shí)現(xiàn)方式中所描述的語(yǔ)音質(zhì)量評(píng)估方法。

21、具體的,本技術(shù)中提供的芯片還包括存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序或指令。

22、上述技術(shù)方案至少帶來(lái)以下有益效果:獲取第一語(yǔ)音包,對(duì)第一語(yǔ)音包進(jìn)行處理,確定第一語(yǔ)音包的特征,并將第一語(yǔ)音包的特征輸入到語(yǔ)音質(zhì)量評(píng)估模型中,確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果。本技術(shù)實(shí)施例所記載的語(yǔ)音質(zhì)量評(píng)估方法是基于語(yǔ)音質(zhì)量評(píng)估模型確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,相較于通用技術(shù)中采用固定的門(mén)限值來(lái)評(píng)估語(yǔ)音包的語(yǔ)音質(zhì)量,提高了語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。并且,由于輸入到語(yǔ)音質(zhì)量評(píng)估模型中的第一語(yǔ)音包的特征可以指示第一語(yǔ)音包對(duì)應(yīng)的用戶的特征和/或第一語(yǔ)音包對(duì)應(yīng)的音頻流的語(yǔ)音特征,因此基于第一語(yǔ)音包的特征確定第一語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估結(jié)果,不僅考慮了語(yǔ)音本身的特征,還考慮了對(duì)應(yīng)的用戶的特征,進(jìn)一步提高了語(yǔ)音包的語(yǔ)音質(zhì)量評(píng)估的精確性。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1