: sound quality


概要

編集

3[1]













SN



AACMP3SN[2]

主観評価と客観評価

編集



subjective assessment [3] [4][3] 5mean opinion scoreMOS使

使

[5]

使[4] 使使[6]



24[4]

()

使

使



objective assessment[4]



使




主観評価 客観評価
総合性・汎用性 ×
コスト ×
再現性 ×
自動化 ×

品質評価法

編集

ITU使
主観品質評価法(音声)
規格番号 名称
ITU-T P.800 Methods for subjective determination of transmission quality
ITU-T P.830 Subjective performance assessment of telephone-band and wideband digital codecs
主観品質評価法(オーディオ)
規格番号 名称
ITU-R BS.1284 General methods for the subjective assessment of sound quality
ITU-R BS.1116-1 Methods for the subjective assessment of small impairments in audio system including multichannel sound systems
ITU-R BS.1534
(MUSHRA)
Method for the subjective assessment of intermediate quality levels of coding systems (MUSHRA)
客観品質評価法(音声)
規格番号 名称
ITU-T P.563 Single-ended method for objective speech quality assessment in narrow-band telephony applications (no-reference algorithm)
ITU-T P.861
(PSQM)
Objective quality measurement of telephone-band (300-3400 Hz) speech codecs
ITU-T P.862
(PESQ)
Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs
客観品質評価法(オーディオ)
規格番号 名称
ITU-R BS.1387-1
(PEAQ)
Method for objective measurements of perceived audio quality

主観品質評価法(音声)

編集

MOS ITU-T P.800 ExcellentBad5MOSITU-T P.800  MOS  DMOSCMOS  [7]
  • MOS (Mean Opinion Score):絶対範疇尺度法(Absolute Category Rating、ACR)を使用
評価対象音声を聴いて5段階の絶対評価を行う。
MOS の評価カテゴリ
カテゴリ 評点
非常に良い(Excellent) 5
良い(Good) 4
普通(Fair) 3
悪い(Poor) 2
非常に悪い(Bad) 1
  • DMOS(Degradation Mean Opinion Score):妨害範疇尺度法(Degradation Category Rating、DCR)を使用
リファレンス音声(原音)と評価対象音声とを聴き比べて5段階の相対評価を行う。リファレンス音声の0.5~1秒後に評価対象音声が聴こえる。
DMOS の評価カテゴリ
カテゴリ 評点
劣化が全く認められない(Degradation is inaudible) 5
劣化が認められるが気にならない(Degradation is audible but not annoying) 4
劣化がわずかに気になる(Degradation is slightly annoying) 3
劣化が気になる(Degradation is annoying) 2
劣化が非常に気になる(Degradation is very annoying) 1
  • CMOS(Comparison Mean Opinion Score):比較範疇尺度法(Comparison Category Rating、CCR)を使用
リファレンス音声と評価対象音声とを聴き比べて7段階の相対評価を行う。リファレンス音声と評価対象音声の順番はランダムに変化する。
CMOS の評価カテゴリ
カテゴリ 評点
非常に良い(Much Better) 3
良い(Better) 2
やや良い(Slightly Better) 1
ほぼ同じ(About the Same) 0
やや悪い(Slightly Worse) -1
悪い(Worse) -2
非常に悪い(Much Worse) -3

listening-opinion testconversation-opinion test

 ITU-T P.830 

主観品質評価法(オーディオ)

編集

ITU-R BS.1284

編集

使 ITU-R BS.1284  ITU-R BS.562-3  MOSDMOSCMOS 

[8]

Spatial impression

///

Stereo impression

//

Transparency

/

Sound balance

//

Timbre

///

Freedom from noise and distortions

/

Main impression


ITU-R BS.1116

編集

劣化が少ない高品質のオーディオシステムや多チャンネルシステム向けの主観評価法として ITU-R BS.1116-1 が定義されている。BS.1116-1 は DMOS と同様の5段階の評価カテゴリを用いて小数点以下1桁までの評点を決める。

BS.1116-1 の評価カテゴリ
カテゴリ 評点
わからない(Inaudible) 5.0
わかるが気にならない(Audible but not annoying) 4.0
やや気になる(Slightly annoying) 3.0
気になる(Annoying) 2.0
非常に気になる(Very annoying) 1.0

試験は隠れ基準付き3刺激二重盲検法double-blind triple-stimulus with hidden reference)で評価を行う。この方法は、リファレンス音(原音)と2つの評価対象音の合計3つの音を聴き比べ、2つの評価対象音の相対評価を行う。2つの評価対象音のどちらかにはランダムにリファレンス音(隠れ基準、hidden reference)が含まれ、必ず一方に 5.0 の評点を付ける。この方法は毎回3つの音を比較するため時間がかかるが、僅かな劣化でも検出できるため劣化が少ないシステムの評価に向いている[9]

MUSHRA

編集

 ITU-R BS.1534 BS.1534  MUSHRAMUltiple Stimuli with Hidden Reference and AnchorAACHE-AAC 使

MUSHRA/5ExcellentBad 100  0 

BS.1116 MUSHRA[10][10]1 100 

 3.5kHz 7kHz 使

客観品質評価法(音声)

編集

signal-to-noise ratioSNRSNRSSNR使使

-Itakura-Saito distanceLPClinear predictive coding cepstral distance

ITU-T P.861PSQMperceptual speech quality measureITU-T P.862PESQperceptual evaluation of speech quality

ITU-T P.862  PESQ  PSQM  PESQ 2

(一) /

(二)  MOS 

ITU-T P.862  300-3400Hz  7kHz ITU-T P.862.2 

客観品質評価法(オーディオ)

編集

オーディオの客観品質評価法として古くから使われてきたのは信号対雑音比歪率だが、現代のデジタル信号処理を使った様々なオーディオ圧縮コーデックでは有効な評価方法ではない[11]。そのため、音声の客観品質評価法と同様、オーディオでの新しい客観品質評価法が研究されている。ITU-R BS.1387-1 で定義されている PEAQperceived evaluation of audio quality)はその代表的なものである。


ITU-R BS.1387-1  PEAQ 使1[11][11]

PEAQ 2

(一) /

(二) 

FFT2FFTFFT使

16 Objective Difference GradeODG ODG BS.1116-1  5.0  1.0  Subjective Difference GradeSDGSDG 

 

SDG  0  -4 0 -4 

脚注

編集
  1. ^ N. Rémy. Sound quality : a definition for a sonic architecture. Proc. 12th International Congress on Sound and Vibration, Lisbon. July 2005.
  2. ^ Ted Painter, Andreas Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, pp.451-513. 2000.
  3. ^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
  4. ^ a b c d 主観評価と客観評価”. 2010年6月15日閲覧。
  5. ^ Glen Ballou (ed). Handbook for Sound Engineers, Second Edition: The New Audio Cyclopedia. Focal Press, 1991. ISBN 978-0240803319.
  6. ^ 石川 俊行, 降旗 建治, 柳沢 武三郎. 音楽再生時における物理的歪と音色の好みの関係. Technical report of IEICE. EA 102(398), pp.57-62, 2002. など参照のこと。
  7. ^ ITU-T 勧告 P.800: Methods for subjective determination of transmission quality
  8. ^ ITU-R 勧告 BS.1284: General methods for the subjective assessment of sound quality
  9. ^ ITU-R 勧告 BS.1116: Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems
  10. ^ a b G. Stoll, F. Kozamernik. EBU listening tests on Internet audio codecs. EBU TECHNICAL REVIEW. June, 2000.
  11. ^ a b c ITU-R 勧告 BS.1387: Method for objective measurements of perceived audio quality (PEAQ)

参考文献

編集
  • Glen Ballou (ed). Handbook for Sound Engineers, Second Edition: The New Audio Cyclopedia. Focal Press, 1991. ISBN 978-0240803319.
  • Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
  • Ted Painter, Andreas Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, pp.451-513. 2000.
  • N. Rémy. Sound quality : a definition for a sonic architecture. Proc. 12th International Congress on Sound and Vibration, Lisbon. July 2005.
  • G. Stoll, F. Kozamernik. EBU listening tests on Internet audio codecs. EBU TECHNICAL REVIEW. June, 2000.
  • 音声品質評価法(NTT技術解説)”. 2010年6月15日閲覧。
  • ITU-T 勧告 P.563: Single-ended method for objective speech quality assessment in narrow-band telephony applications (no-reference algorithm)
  • ITU-T 勧告 P.800: Methods for subjective determination of transmission quality
  • ITU-T 勧告 P.830: Subjective performance assessment of telephone-band and wideband digital codecs
  • ITU-T 勧告 P.861: Objective quality measurement of telephone-band (300-3400 Hz) speech codecs
  • ITU-T 勧告 P.862: Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs
  • ITU-T 勧告 P.862.2: Wideband extension to Recommendation P.862 for the assessment of wideband telephone networks and speech codecs
  • ITU-T 勧告 P.862.3: Application guide for objective quality measurement based on Recommendations P.862, P.862.1 and P.862.2
  • ITU-R 勧告 BS.1116: Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems
  • ITU-R 勧告 BS.1284: General methods for the subjective assessment of sound quality
  • ITU-R 勧告 BS.1387: Method for objective measurements of perceived audio quality (PEAQ)
  • ITU-R 勧告 BS.1534: Method for the subjective assessment of intermediate quality levels of coding systems (MUSHRA)

関連項目

編集

外部リンク

編集