オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク年間ランキング」の2021年版を発表します。上位トップ100の記事をピックアップしました(集計期間:2020年12月11日~2021年12月10日)。 2021年 はてなブックマーク年間ランキング(2020年12月11日~2021年12月10日) 順位 タイトル 1位 ルックバック - 藤本タツキ | 少年ジャンプ+ 2位 浄土真宗の僧侶です。初めて書き込みます。 不慣れなため、先ほど書いた.. 3位 京都大学、Pythonの基本を解説した無料の教科書「素晴らしすぎる」「非常にわかりやすくて良い」 | Ledge.ai 4位 闇市化するAmazon「裏コマンド検索」で絞り込む 5位 財テク (住宅購入編) - shunirr 6位 台本11冊を入手 五輪開会式“崩壊” 全内幕 計1199ページにすべての変遷
本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由
これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ
これは何? NGK2024Sの発表資料です。 自己紹介 名前: 中西克典 X(Twitter): @n_kats_ 機械学習名古屋研究会主催 NGK発表は2回目 機械学習名古屋研究会 論文読み会 毎月第3木曜(19:00~)オンラインで 次回(2月15日第71回)・・・https://machine-learning.connpass.com/event/308186/ 本編 イントロ(研究会の表の目的) 論文を読む習慣付け 知識のアップデート 発展的・実践的な知見の獲得 イントロ(研究会の裏の目的) この世の真理と呼べるものを全て知りたい。 という話を2年前のNGKでした。 おさらい(2年前の話) 読み上げソフトを使うと機械学習の論文が30分で再生できる。 ある分野の概要を把握する目安の論文50本には約3日あればよい。 2年前の課題 読み上げられてる文章を目で追いかけないといけない。つら
音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす
シロワニさん氏が趣味で開発したというWindows向けのAIトークソフト「COEIROINK(コエイロインク)」が無料で公開されています。COEIROINKは連絡不要で商用利用もOKなフリー素材キャラクター・つくよみちゃんに好きなテキストを誰でも簡単に読み上げてもらうことが可能なので、自作アニメやボイスドラマのキャラクターボイス、実況動画や解説動画のナレーションなどの作成にお役立ちです。 COEIROINK https://coeiroink.com/ ✨COEIROINKリリース✨ 無料の音声合成エンジン「#COEIROINK」が登場! 文章を読み上げます! ■公式サイト⇒https://t.co/66YStrCYu0 ■COEIROINK開発:シロワニさん様 @shirowanisan ■VOICEVOX開発:ヒホ様 @hiho_karuta 第1弾は「#つくよみちゃん」! 商用利用O
今回はいつもと少し方向性を変えて、Amazonの売れ筋ランキングで常に上位にいるAnkerの格安モバイルバッテリー「PowerCore 10000」について解説していきます。〇ご質問やリクエストなどはこちらへ:https://peing.net/ja/saityo_zunda〇音声読み上げ:VOICEVOX https://voicevox.hiroshiba.jp/〇登場キャラクター・VOICEVOX:ずんだもん・VOICEVOX:四国めたん〇動画内で使用させていただいているBGM・fun fun Ukelele:shimtone 様 https://dova-s.jp/bgm/play16650.html・Metal Jingle:shimtone 様 https://dova-s.jp/bgm/play16229.html〇その他素材・pixabay さま https://pixab
『VOICEVOX』に音声ライブラリとして収録されている「ずんだもん」「九州そら」「四国めたん」(いずれも「東北ずん子プロジェクト」のキャラクター) (画像は東北ずん子プロジェクト公式サイトより) また「東北ずん子ガイドライン準拠」を示す(ず・ω・きょ)の記載があるユーザー作成の素材についても、公式のガイドラインに基づいて非商用の範囲であれば立ち絵などが利用可能となる。 たとえば、ユーザー制作のずんだもんの立ち絵のなかでも見かけることの多い、坂本アヒル氏制作の「ずんだもん立ち絵素材」や「四国めたん立ち絵素材」は(ず・ω・きょ)の記載がされているため、配信等で自由に使うことが可能だ。 坂本アヒル氏製作の「ずんだもん立ち絵素材」 (画像はニコニコ静画「ずんだもん立ち絵素材」より)(画像は東北ずん子プロジェクト公式サイトより) なお『VOICEVOX』には「東北ずん子プロジェクト」以外のキャラも
先日、pixivさんがChatVRMという3Dキャラクターと会話できるオープンソースを公開していたので早速一番星はてので試してみた。 下のサイトは一番星はてのの3Dモデル、人格設定、声設定がデフォルトになっているだけのChatVRMのデモページと同等である。 https://chat-vrm-hateno.vercel.app/ おしゃべりするにはOpenAIのAPIキーが必要なので、持っていない方はOpenAIのサイトで取得してほしい。 設定などについて 3DモデルはVRoidHubで公開もしていて、再配布もOKにしているのでもしも別の衣装とか着せたかったらこれを元に作ってもらえるとうれしい。 hub.vroid.com 3Dモデルを作るのは初めての経験だったが、思った以上に簡単にカスタマイズでき、パラメータや頭の横のリボンなどこだわって作れて面白かった。 YouTubeは絶対Live2
YouTubeでASMR動画を投稿するとアカウントが停止される――そんなうわさがTwitterで広がっている。6月5日ごろから、YouTubeが未成年が出演するASMR動画を明確に投稿禁止していると注意喚起するツイートが複数投稿されたことが発端とみられる。 【訂正履歴:2022年6月13日午後1時 初出時、「子供の安全に関するポリシー」が改訂されたことが発端とみられるとしていましたが、ポリシーの改定は2020年のことでした。お詫びして訂正いたします。】 YouTubeは「子供の安全に関するポリシー」で2020年から、未成年が出演する動画について、個人宅の寝室や浴室などで撮影したもの、知らない人と会う企画、成人向けの話題を論じるもの、ASMR動画、個人情報を公開するもの――などを明確に禁止している。 ASMR動画とは、環境音や声などで心地良さやぞわぞわ感を誘発する動画のこと。Twitterで
まだテスト投稿ですが、とりあえず動画にできるぐらいにはなったのでYouTubeデビューしました。やり方はわかってきたのでGWくらいには配信してみたい。 www.youtube.com 構成 アバター:Live2D(StableDiffusion用にいいマシンも買ったのでAITuberらしいデザインで作り直してもっとLive2Dで髪とかも動かしたい) 会話:gpt-3.5-turbo(設定はブックマーカー用と同期している) 音声:VOICEVOX(四国めたん)(後ではての用のオリジナル音声にするつもりですが時間がなかったので後回し) チャットUI:ひとまずHTML, CSS, JSあたりで適当に VtubeStudioやOBSも使ってますが、Live2Dなども含めてこの辺を触るのが初めてすぎて時間がかかってしまった。特にリップシンクの設定に手間取った。この辺はどこかで別途開発者向けに記事にし
こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です。 今日はAIの進歩にともなうヒトの役割にかんするポエムを書いていきます! なにについて書いてある文章か AI※の進歩ってすごいよね AIがなんでもできるようになったら、ヒトは何を思うか ※AIって気軽に使う世界になったのもすごい. なお、MicrosoftはすでにAGI as a serviceについて考えている: https://thegenerality.com/agi/ さいきん思うこと 言語モデルや生成モデルの進歩は凄まじくて、どんどん知的な活動がAIに置き換えられて行きそうな空気を感じます。じっさい、イラストを描くことやプログラミングを実装することなどは、かなりできるようになってきています。 今回は、こうした人間しか出来ないと思われていたことが、どんどんAIができてくることによって、何が起き
ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS=Text to Speech(音声読み上げソフト)の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。 さらにStoryblocksという音素
今回は「マジで欲しくて買ったもの回」として、激安の「PDトリガー」を検証していきます。〇音声読み上げ:VOICEVOX https://voicevox.hiroshiba.jp/〇登場キャラクター・VOICEVOX:ずんだもん・VOICEVOX:四国めたん〇動画内で使用させていただいているBGM・fun fun Ukelele:shimtone 様 https://dova-s.jp/bgm/play16650.html・Metal Jingle:shimtone 様 https://dova-s.jp/bgm/play16229.html〇その他素材・pixabay さま https://pixabay.com/ja/ ・効果音ラボ さま https://soundeffect-lab.info/〇投稿者のTwitter https://twitter.com/Saityo_Zunda
はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の
私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。 また、so-vits-svcやRVCは論文ベースでの技術発表が無いため、以下はコードや周辺情報からの想像を含みます。 修正履歴 2023/04/15 RVCの動作について誤りがあったので修正しました。nadare🌱さんご指摘ありがとうございます。 AIボイスチェンジャーとは ある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれている印象です。 以前から、深層学習を用いたリアルタイムボイスチェンジャーはMMVCなどが存在していました。 最近(2022年11月頃から2023年4月頃)では、Retrieval-based-Voice-Conversion 通称RVC や、Soft
今回はコスパ狙い回ということでXiaomiの激安スマートバンド「Mi Smart Band 5」をご紹介。次々と後継機種が出る中でさらに激安となったこのスマートバンドの実力は…?〇ご質問やリクエストなどはこちらへ:https://peing.net/ja/saityo_zunda〇音声読み上げ:VOICEVOX https://voicevox.hiroshiba.jp/〇登場キャラクター・VOICEVOX:ずんだもん・VOICEVOX:四国めたん〇動画内で使用させていただいているBGM・fun fun Ukelele:shimtone 様 https://dova-s.jp/bgm/play16650.html・Metal Jingle:shimtone 様 https://dova-s.jp/bgm/play16229.html〇その他素材・いらすとや さま https://www.i
今回は以前から大量のリクエストをいただいていた激安通販「Temu」の実態を徹底解説。 さらに実際に買い物もしていって、その実態を明らかにしていきます。 〇チャプター 00:00 概要 01:37 第1部:Temuとは?なぜ注目されてるの? 04:47 第2部:どんなものが売られてるの? 07:43 第3部:使う上での注意点 16:22 第4部:実際の様子と使い方 19:17 第5部:買ったものはちゃんと届くのか? 22:19 まとめ 〇投稿者のTwitter https://twitter.com/Saityo_Zunda 〇音声読み上げ ・VOICEVOX https://voicevox.hiroshiba.jp/ 〇登場キャラクター ・VOICEVOX:ずんだもん ・VOICEVOX:四国めたん 〇動画内で使用させていただいている立ち絵 ・ずんだもん:坂本アヒル
剣崎雌雄🗡新曲『Mesperado』 @kartar308 同性間での巨大感情に情緒を破壊されるタイプのオタク/バーチャルTSメスお兄さん系YouTuber おふくろ殿(@MeijiShiron) VOICEVOX剣崎雌雄もよろしくね FA: #絵スお兄さん 配信: #メストリーム マシュマロ marshmallow-qa.com/kartar308?utm_… youtube.com/channel/UCT_VL… 剣崎雌雄🗡新曲『Mesperado』 @kartar308 昨日エヴァをTVアニメ本放送から追ってた古豪のオタクの人達とエヴァについてニコ生で語る会をしてたんだけど、平成生まれのオタクからしたら未知のワードがマシンガンみたいに飛び出てきて大盛り上がりしてて悔しかったのでまとめました(意味は分かりませんでした) ※本編内容には言及してません pic.twitter.com/
AI技術の進化によって、絵や文章だけではなく音声変換もAIでリアルタイムに行うことが可能になりました。ボイスチェンジャーAIにはRVC(Retrieval-based Voice Changer)やMMVCなどさまざまな種類が存在しますが、「VC Client」は複数ボイスチェンジャーAI向けモデルに対応しており、簡単にリアルタイム音声変換ができるとのことなので実際に試してみました。 GitHub - w-okada/voice-changer https://github.com/w-okada/voice-changer GitHubのレポジトリにアクセスします。 「事前ビルド済みのBinaryでの利用」の欄にあるテーブルで、「win」にある「通常」をクリック。 ダウンロードリンクが表示されるので、「このままダウンロード」をクリックします。なお、VC ClientはZIP形式で配布され
リンク Wikipedia ギコ猫 ギコ猫(ぎこねこ)は、匿名掲示板2ちゃんねるなどの電子掲示板で用いられるアスキーアート (AA) によるキャラクターの一種である。正式名称は「ギコ・ハニャーン」。通称ギコ。 1999年(平成11年)頃から使われ始めたAAによるキャラクター。掲示板上の文脈や表現したい内容に応じ、様々な表情・ポーズ・セリフが与えられる。好きな芸能人は木村拓哉である。 あやしいわーるど等UG掲示板の常連であるコブラが利用していた「ギコハハハ」という笑い声が語源(さらに辿ればもとはコブラの友人が使っていたもので、1994年(平成 12 users 1 リンク Wikipedia やる夫 やる夫(やるお)は2ちゃんねるやインターネット上に広まった、アスキーアートのキャラクター。 この項目ではやる夫を始めとするアスキーアートを用い、インターネット掲示板上でストーリー仕立ての作品を展
今回は以前からずっと気になっていた「夢グループのタブレットPC」の実態を解き明かしていきます。〇ご質問やリクエストなどはこちらへ:https://peing.net/ja/saityo_zunda〇音声読み上げ:VOICEVOX https://voicevox.hiroshiba.jp/〇登場キャラクター・VOICEVOX:ずんだもん・VOICEVOX:四国めたん〇動画内で使用させていただいているBGM・fun fun Ukelele:shimtone 様 https://dova-s.jp/bgm/play16650.html・Metal Jingle:shimtone 様 https://dova-s.jp/bgm/play16229.html〇その他素材・いらすとや さま https://www.irasutoya.com/・pixabay さま https://pixabay.c
5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ
ずんだもん立ち絵素材(坂本アヒル)単語 ズンダモンタチエソザイサカモトアヒル 3.1千文字の記事 18 0pt ほめる 掲示板へ 記事編集 概要VOICEVOXとの関係関連動画関連静画関連リンク関連項目脚注掲示板「ずんだもん立ち絵素材」とは、坂本アヒル氏によって描かれ提供されている、「ずんだもん」の非公式立ち絵素材である。 概要 東北地方応援企画「東北ずん子プロジェクト」のキャラクターの一人である「ずんだもん」の立ち絵イラスト素材。 元々「ずんだもん」は、魔法少女のマスコットキャラクターのような、小動物的な見た目のキャラクターであった。だが、2021年6月に東北ずん子プロジェクト公式から人間形態の画像が公開された。このとき、この人間形態ずんだもんは腰に手を当てて不敵な笑顔で胸を張っていた。 ツイートを読み込み中です https://twitter.com/t_zunko/status/14
オープンソース・ソフトウェアとして公開されているAI音声合成ソフトであるVOICEVOXに、9月30日、また新たなキャラクタが誕生します。今回、3つのキャラクが同時に誕生するのですが、その一つが声優の小岩井ことり(@koiwai_kotori)さんCVによるNo.7です。昨年、AI歌声合成ソフトとしてフリーウェアのNEUTRINO用にNo.7がリリースされていましたが、今度はしゃべるソフトとしての誕生となります。普通のしゃべり声である「ノーマル」と、アナウンサーが読み上げるようにしゃべる「アナウンス」、そして絵本を読み聞かせるように読む「読み聞かせ」の3種類となっています。 このNo.7のプロジェクトは明治大学の専任准教授、森勢将雅(@m_morise)先生を中心に研究・開発されているもので、小岩井ことりさんもここに積極的に参加しつつ、私・藤本健も関わる形で進めてきました。ここで作られたデ
AI技術の進化で、ここ1、2年で急激な性能向上を実現している音声合成の世界。まさに機械が読んでいるのか、人間が読んでいるのか区別がつかないレベルになってきているわけですが、ここにきて、また面白い活用例が登場してきました。いわゆる「ゆっくり実況動画」を作成するフリーウェア「ゆっくりMovieMaker4」で、AI音声合成で人気のCoeFontが利用できるようになり、ゆっくりMovieMakerの利用範囲が一気に広がる形になったのです。 CoeFontは声をフォントのように利用できるようにしたサービスで、誰でも自分の声をCoeFontにできるとともに、ユーザーは公開されているCoeFontを使って喋らせることができる、というもの。今回このCoeFontとゆっくりMovieMakerがシステム的に連携したことにより、まさに人のような声で、誰でも無料で、簡単にテロップ・音声入りの解説動画を作ること
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く