コンテンツにスキップ

Open JTalk

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Open JTalk
開発元 名古屋工業大学
最新版

オンライン版:1.06, SourceForge版:1.11 / 2012年12月25日 (11年前) (2012-12-25), SourceForge版: 2018年12月25日 (5年前) (2018-12-25)

リポジトリ sourceforge.net/projects/open-jtalk/
プログラミング
言語
C++
使用エンジン HTS
対応OS Linux、他
対応言語 日本語
サポート状況 開発中
種別 音声合成, Text-To-Speech
ライセンス 修正BSDライセンス
公式サイト open-jtalk.sp.nitech.ac.jp
テンプレートを表示

Open JTalkおーぷんじぇいとーく)は、名古屋工業大学で開発された音声合成技術および同技術を応用した、日本語向けのテキストトゥスピーチ(文章読み上げ)ソフト。日本語の文章を入力することで音声を合成し、読み上げることができる。

概要

[編集]
OpenJTalkの音声合成基礎技術は名古屋工業大学での研究が基になっており、開発と運営が続けられている。

名古屋工業大学にて開発・メンテナンスが続けられている日本語音声合成ソフトウェア。オープンソースで公開されているスタンドアロン版と、Webサイトで公開されているオンライン版の2種類がある。

合成技術にHMM(Hidden Markov Model、隠れマルコフモデル)を採用しており、少ないメモリでも動作するのが特徴[1]。その特徴からRaspberry Pi上での音声合成ライブラリとしての利用例も多い。

パラメータとしては「声質」(フォルマントシフト)、「ピッチシフト」(声の高さ)、「話速」に対応し、ボイスを切り替えることで感情表現にも対応する。

オンライン版

[編集]

公式サイト[2] 上でシステムを公開しており、誰でも無料で利用可能。

指定可能なボイス(音響モデル)は2種類(男性1種類、女性4感情4種類)。

オープンソース版

[編集]

SourceForgeOSBSD htsvoice[1]

導入

[編集]

複数のOSに対応しているものの、OSS版はソースコードとしての公開のため導入にはビルドが必要となる。有志によって簡単に使えるように、さまざまな導入方法が用意されている。

アプリとしての導入方法

[編集]

一部を除き、原則コマンドラインアプリとしての入手になる。

SHABERU
Windows向けのGUIのあるフリーソフト。追加音響モデルにも対応する。[3]

パッケージマネージャを利用した導入方法

[編集]

辞書データや音響モデルの追加導入が必要な場合がある(APT等)。また、導入後ビルドが必要な場合もある(pyopenjtalk等)。

Docker
docker pull u6kapps/open_jtalk [4]
Homebrew
brew install open-jtalk [5]
APT
apt install open-jtalk [6]
apt install open-jtalk-mecab-naist-jdic ※辞書データ
apt install hts-voice-nitech-jp-atr503-m001 ※音響モデル
Python
pip install pyopenjtalk [7]
.NET(NuGet)
Install-Package SharpOpenJTalk [8]
Node.js (npm)
npm install openjtalk [9]


音響モデル

[編集]

Open JTalkで利用可能な音響モデル(ボイスライブラリ、htsvoice形式)の例。音響モデルは自作することも可能であり、SHABERU等むけにユーザーが制作した音響モデルが配布されている(規約で許可されていればOpen JTalkで利用可能)[10]

NIT ATR503 M001

[編集]

Open JTalk[11] 3.0

メイ

[編集]

HTS Voice "Mei"MMD Agent[12]MMD Agent[13]

Open JTalk5normal, happy, angry, sad, bashful

タクミ

[編集]

HTS Voice "Takumi"MMD Agent[12]MMD Agent[13]

Open JTalk4normal, happy, angry, sad

tohoku-f01

[編集]

 [14] Open JTalk(4.0)[15]

4angry, happy, neutral, sad

ライブラリ・フレームワークとしての利用

[編集]

OpenJTalk

DeNA[16]

VOICEVOX - ITA[17] OSSDNN[18]

 - DNN[19]

関連項目

[編集]


Sinsy - Open JTalk

MMD Agent - Open JTalkMMDOpenJTalk使[1]





CeVIO Creative Studio - Open JTalk[20] [21]

MeCab - MeCabNAIST Japanese Dictionary[1][22]

NonVisual Desktop Access (NVDA) - Open JTalkOSS

脚注

[編集]


(一)^ abcd, , , 622201857-62doi:10.11509/isciesci.62.2_57 

(二)^ Open JTalk - HMM-based Text-to-Speech System- 

(三)^  . 2021923

(四)^ u6kapps/open_jtalk - Docker Image. 2021923

(五)^ open-jtalk  Homebrew Formulae. 2021923

(六)^ open-jtalk - Debian Package Tracker. 2021923

(七)^ pyopenjtalk  pyopenjtalk 0.1.6+7ad3adc documentation. 2021923

(八)^ NuGet Gallery. 2021923

(九)^ openjtalk - npm. 2021923

(十)^  . 2021923

(11)^  - Open JTalk - OSDN. 2021923

(12)^ ab&. 2021923

(13)^ abmmdagent.jp.  . 2021923

(14)^  . 2021923

(15)^ icn-lab/htsvoice-tohoku-f01: Japanese female HTS voice with four emotions {angry, happy, neutral, sad}. 2021923

(16)^ AIPart1 · DeNA Engineers' Blog.  DeNA (202034). 2021919

(17)^ 使 - ITmedia NEWS (2021618). 2021919

(18)^ AIVOICEVOX - PC Watch. 2021919

(19)^  - . 2021919

(20)^  - 

(21)^ Techno-Speech, Inc. / 

(22)^ OpenJTalk . 2021919

外部リンク

[編集]