Open JTalk
開発元 | 名古屋工業大学 |
---|---|
最新版 |
オンライン版:1.06, SourceForge版:1.11 / 2012年12月25日 , SourceForge版: 2018年12月25日 |
リポジトリ |
sourceforge |
プログラミング 言語 | C++ |
使用エンジン | HTS |
対応OS | Linux、他 |
対応言語 | 日本語 |
サポート状況 | 開発中 |
種別 | 音声合成, Text-To-Speech |
ライセンス | 修正BSDライセンス |
公式サイト |
open-jtalk |
Open JTalk(おーぷんじぇいとーく)は、名古屋工業大学で開発された音声合成技術および同技術を応用した、日本語向けのテキストトゥスピーチ(文章読み上げ)ソフト。日本語の文章を入力することで音声を合成し、読み上げることができる。
概要
[編集]![](http://upload.wikimedia.org/wikipedia/commons/thumb/f/fc/%E5%90%8D%E5%8F%A4%E5%B1%8B%E5%B7%A5%E6%A5%AD%E5%A4%A7%E5%AD%A6_-_panoramio_%2811%29.jpg/220px-%E5%90%8D%E5%8F%A4%E5%B1%8B%E5%B7%A5%E6%A5%AD%E5%A4%A7%E5%AD%A6_-_panoramio_%2811%29.jpg)
名古屋工業大学にて開発・メンテナンスが続けられている日本語音声合成ソフトウェア。オープンソースで公開されているスタンドアロン版と、Webサイトで公開されているオンライン版の2種類がある。
合成技術にHMM(Hidden Markov Model、隠れマルコフモデル)を採用しており、少ないメモリでも動作するのが特徴[1]。その特徴からRaspberry Pi上での音声合成ライブラリとしての利用例も多い。
パラメータとしては「声質」(フォルマントシフト)、「ピッチシフト」(声の高さ)、「話速」に対応し、ボイスを切り替えることで感情表現にも対応する。
オンライン版
[編集]公式サイト[2] 上でシステムを公開しており、誰でも無料で利用可能。
指定可能なボイス(音響モデル)は2種類(男性1種類、女性4感情4種類)。
オープンソース版
[編集]導入
[編集]複数のOSに対応しているものの、OSS版はソースコードとしての公開のため導入にはビルドが必要となる。有志によって簡単に使えるように、さまざまな導入方法が用意されている。
アプリとしての導入方法
[編集]一部を除き、原則コマンドラインアプリとしての入手になる。
- SHABERU
- Windows向けのGUIのあるフリーソフト。追加音響モデルにも対応する。[3]
パッケージマネージャを利用した導入方法
[編集]辞書データや音響モデルの追加導入が必要な場合がある(APT等)。また、導入後ビルドが必要な場合もある(pyopenjtalk等)。
- Docker
docker pull u6kapps/open_jtalk
[4]- Homebrew
brew install open-jtalk
[5]- APT
apt install open-jtalk
[6]apt install open-jtalk-mecab-naist-jdic
※辞書データapt install hts-voice-nitech-jp-atr503-m001
※音響モデル- Python
pip install pyopenjtalk
[7]- .NET(NuGet)
Install-Package SharpOpenJTalk
[8]- Node.js (npm)
npm install openjtalk
[9]
音響モデル
[編集]Open JTalkで利用可能な音響モデル(ボイスライブラリ、htsvoice形式)の例。音響モデルは自作することも可能であり、SHABERU等むけにユーザーが制作した音響モデルが配布されている(規約で許可されていればOpen JTalkで利用可能)[10]。
NIT ATR503 M001
[編集]メイ
[編集]タクミ
[編集]tohoku-f01
[編集]ライブラリ・フレームワークとしての利用
[編集]関連項目
[編集]脚注
[編集]外部リンク
[編集]- Open JTalk - HMM-based Text-to-Speech System - 公式サイト(オンライン版)
- Open JTalk - SourceForge版公式サイト
- SHABERU - フリーの音声合成ソフト。Windows向けのOpen JTalkのスタンドアロンソフト。有志による追加ボイス(音響モデル、htsvoice形式)が充実している
- pyopenjtalk - Python向けのラッパーライブラリ
- SharpOpenJTalk - C#向けのラッパーライブラリ
- node-openjtalk - Node.js向けのラッパーライブラリ
- Gyutan - Java移植版
- jtalkDLL - 各プログラミング言語から利用するための共有ライブラリ版
- OpenJTalk For Unity - Unity(ゲームエンジン)むけプラグイン
- tdmelodic_openjtalk - NEologdを基にした日本語アクセント辞書tdmelodicをOpen JTalkから利用できるようにした辞書データ。商用利用不可