指定した音声ファイルを、楽器ごとのパートに分解してくれるソフトです。 音声ファイルをドラッグ&ドロップで放り込むと、該当のファイルを ボーカル ベース ドラム その他(キーボード、ギター 等) ボーカル以外のインストゥルメンタル といった 5 つのファイルに分解してくれます。 処理を GPU(CUDA)で実行することもできます。
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
自宅で友達と通話をしているとき、歌を歌っているとき、Zoomでミーティングをしているとき、「周りに迷惑をかけていないかな」と思ったことはありませんか? 今回はDIY未経験でも簡単かつ、安価でできる防音室作りに挑戦します! 初めまして! 近畿大学広報室でインターンをしている、理工学部 理学科物理学コース 2年生の中井七海です。 私は軽音サークルに所属しており、ボーカルとしてよくライブに出演しています。そのため、自宅でも歌の練習をしたいのですが、今住んでいる実家ではなかなか練習ができません。というのも、自分の部屋で歌うとよく音が響いてしまい、親に怒られる上に、近所迷惑にもなってしまうからです。 また、私はゲームが好きなため、よく友人と通話しながらオンラインゲームをします。ついはしゃぎすぎて、親に「うるさいで〜あんた電話控えてよ!」と怒られてしまいます。 そこで防音室があれば、自由に自分の趣味が
ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開
楽曲を最大5トラック(ヴォーカル/ドラム/ベース/ピアノ/その他)に分離できる、高速かつ無料のオーディオ分離ツール「Spleeter」が公開。音楽ストリーミングサービス「Deezer」のエンジニアリングチームが開発。機械学習によって楽曲を分離するツールです。 「Spleeter」には、3つの事前トレーニングモデルが付属されており、以下の3タイプへの分離が可能になっています。 2つ(ヴォーカル/その他の伴奏) 4つ(ヴォーカル/ドラム/ベース/その他) 5つ(ヴォーカル/ドラム/ベース/ピアノ/その他) 実行例: https://waxy.org/2019/11/fast-and-free-music-separation-with-deezers-machine-learning-library/ 「Deezer」内の紹介文 https://deezer.io/releasing-sple
ローランドが新製品、「Zenbeats(ゼンビーツ)」を発表。「Zenbeats」は、iOS/Android/Mac/Windowsに対応したマルチ・プラットホームの音楽制作ソフトウェアで、本日から無料で(!)ダウンロードすることができます。 Mac版「Zenbeats」 誰もが手軽に曲作りを楽しめることを目標に開発されたという「Zenbeats」は、シンプルで使いやすいユーザー・インターフェースを備えた新感覚の音楽制作ソフトウェア。多数用意された“ループ”をタイムラインに沿って並べるだけで、初心者でも簡単にオリジナルの楽曲を作ることができます。もちろん、ソフトウェア音源やシーケンサー、エフェクトといった機能も備えているので、自分でフレーズ/パターンを入力することも可能。長尺のオーディオを扱うことができる『オーディオ・エディター』や、ピアノ・ロール画面でメロディーを入力できる『ノート・エデ
本日、8月8日、808の日、TR-808の歴史が大きく塗り替えられます。TR-808の上位版もしくは新バージョンといっていい、新ドラムマシン、RC-808が誕生し、これが無料配布されることになったのです。開発したのは40年前にTR-808を開発した菊本忠男(Tadao Kikumoto)さんと、当時ローランドでTR-808を開発していた通称アナログマフィア(Analog Mafia)のみなさん。もちろん、みなさんすでにローランドを引退しているのですが、今も現役バリバリの技術を持ったエンジニアたち。40年前「本当はTR-808をもっと、こうしたかったけれど、当時の技術、当時の予算では成しえなかった」という悔しい思いを胸に、最新のテクノロジーを活用し、その理想を実現させたのです。 ここで採用したのは、その理想の回路をソフトウェア的に実現するという手法。RCとはReCreate=再創造という意味
商品が多すぎて選べない半年ほど前である。鏡にうつる自分の顔のみすぼらしさに嫌気がさし、スキンケアをきちんとしなければと思い立った。私の顔は全体的にひどかった。仕事帰り、電車の窓にうつった私はいかにも生気がなく、まるで「会社の金を横領してつかまった経理部の中年男性」といった独特の陰鬱さがあった。われながら、この容姿はどうしたものかと情けなくなったのである。できればもう少し、はつらつとした顔になりたい。肌や身体の手入れをおろそかにしてきたツケがきたと思った。それまでも、風呂上がりに無印で買った安価な化粧水ぐらいはつけていたが、きちんとしたケアをしなければと考え、ドラッグストアへ向かったまではよかったものの、私は混乱した。商品の数が多すぎて、何を買えばいいのか見当がつかないのである。 スキンケア用品売り場はまさにカオスであった。化粧水だけでも何十種類もの商品が並んでいる。それだけではなく、乳液、
数あるガジェットの中でも、コスパに優れていて実用的なガジェットというものは意外と少ないです。そんなガジェットのジャンルの中でこの要件を満たすものが「セットトップボックス」と呼ばれるもの。これまでも、Chromecastのクローンのような「Ezcast」や「AppleTV」を買ったことがあります。 ただこれらは使い勝手が微妙だったり、拡張性の面でちょっと・・・しかし、FireTV StickはベースがAndroidという事だけあって、拡張性でも小型なので携帯性にも優れていて仕事でも使えそうです。ということで、使い倒してみました。 ※Fire TV Stickは最近不穏な噂や制限だらけになってきたので、ChromecastやNebula 4Kに自分はお引越ししました。 Chromecastを購入して色々検証してみた Anker Nebula 4K Streaming DongleはFire T
骨伝導ヘッドセットAfterShokzを使い始めて1年以上。 もう完全に手放せない。 メガネと同じくらい装着しっぱなしの生活になっている。 骨伝導ヘッドセットを使い始めて1年 1年ほど前に骨伝導ヘッドセットの記事を書いた。 この時は使い始めて1ヶ月の時点だった。今回はさらに1年使った感想である。まずは前回の復習から始めよう。 俺が使っているのはワイヤレスの骨伝導ヘッドセット『AfterShokz Air』である。 AfterShokz Airオープンイヤーワイヤレス骨伝導ヘッドフォン、ポータブル収納ケース付き、ミッドナイトブルー AftershokzAmazon 骨伝導なので、常に耳は開放状態となる。外部の音も普通に聞こえるし、着けっぱなしでも外耳炎になるリスク*1も無い。 Msahid manik / CC BY-SA, Link この特徴のおかげで1年前 (使用1ヶ月) の時点で、平日
配信 まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 はじめに まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 配信のために高いパソコンや配信機材を買ったり、一人で頑張る必要が無くなります。 また。自宅のネットワーク環境を気にする必要がありません。 これまで手元のパソコンでイベント配信を運用してきて下記のような問題が発生しています。 配信するスタッフの確保問題(ほぼ趣味) 同等の環境を冗長することが難しい そのため当日の交代が出来ない イベント運用側としては頭の痛い問題です。 要は手離れができないです。 これらを解決する方法としてクラウド上のIaaSを利用しスタッフ共同運用を行えば解決できると考えています。 配信している方の一部には、すでにクラウド上から配信を行っ
◆◆◆ 「確率的に確からしい」という言葉を続けるロボット ――最近、ChatGPTという言葉をよくインターネットで目にします。なんとなく「こんなことができるのかな……?」というイメージは湧いているのですが、具体的なサービス内容を簡単に教えてもらえるでしょうか。 深津貴之氏(以下、深津) 一言で言えば「人間の言葉で質問すると、人間の言葉で答えてくれるロボット」です。 例えば、質問に答えてくれたり、相談に乗ってくれたり、長文を要約してくれたり……。これまでの“検索”とは違って、人間的な知性があるかのように“文章で返答をしてくれる”のが大きな特徴というサービスですね。 お昼ごはんについて質問したときの回答。これまでの“検索”とは良くも悪くも勝手が違うことがよくわかる これはAIに大量の単語を学習させることで、「直前の単語に対して、最も可能性が高い次の単語を予測している」んです。例えば「むかしむか
ASHIDAVOX® アシダ音響㈱ 🔊🎧🎙️ @ashidavox 【お詫び】本日のみで約三ヶ月分のご注文を頂き、「ST-90-05」が再欠品してご迷惑をお掛けしてしまい、大変申し訳ございません。 次回入荷予定は今月中旬頃でございます。入荷の際には再度こちらからご連絡させて頂きますので、今暫くお待ち頂ければ幸いです🙇💦💦 2022-02-01 17:57:43 詳しい解説 超高域がうたい文句のハイレゾ時代であります。 最初からワイドレンジで作るのが現代流ですが 最初に「中域を完成させて」そこに高品位の高音と低音をくっつけるのが古典派の考えるワイドレンジ なぜかわかりませんが、古典派のやり方は音に厚みが出る。 つまり完成度の高い中域に高音と低音を足してワイドレンジを作る、アシダ音響は昔かたぎであります。 ただ条件があって中域の再現性がハイレベルでない場合、上下を足してもよくならな
ラムダ🥒ラムダ技術部 @yoidea YouTubeをメインに数学や理科、コンピュータの知識が増えるかもしれない動画を投稿しています。お問い合わせは → forms.gle/wJam18y3fUfZfr… youtube.com/@lambdatech ラムダ🥒ラムダ技術部 @yoidea 8の字巻きのやり方を説明する動画はたくさんあるけど、原理にまで触れてるものがなかなか見つからなかったから作ってみた。 軽音界隈では知ってて当然みたいな風潮があるけど、原理までは知らずに使ってる人も多いから、誰かのモヤモヤを晴らせれば嬉しい。 pic.twitter.com/rFepI3nOGy 2023-09-11 02:06:56
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
ある日、自宅で仕事をしていたら、同僚から「便座が会社に届きました」とDMが飛んできた。 恥ずかしい。プライベートなものをECサイトで買って、配送先を誤って会社にしてしまい、それを見られてしまった(しかも安いモデル)。 そんな私の気持ちを知ってか知らずか、同僚から「風間さん、ついに便座もレビューするんすか?」と追い打ちのDMが来た。 冗談と思ってスルーすべきところだろうが、のせられやすい性格ということもあり、温水洗浄便座を記事にするにはどうすれば良いか、真剣に考え始めた。 弊社の媒体が伝統的に得意としている、同一条件での一斉レビューを行うのは難しい。たくさん便器を用意し、それに便座を取り付け、一つ一つ座って検証していけば良いのだろうが、そんなに便器や便座が用意できない。 ■電源で何か変わるのでは? 蘇る炊飯器の記憶 思いついたのが「電源」だ。オーディオについて詳しくない方のためにかんたんに説
米英ではオーディオブックがそのうちEブックと同じぐらいのシェアになりそうなくらい急成長しているって伝えると半信半疑なリアクションされる。iTunesのプログラムリスト見ればわかると思うんだけど、日本のポッドキャストってほんと貧困、何もないよね…とは思ってたさ。 しかも、オーディオブックを聞いてみることもしなくて「やっぱ紙で読む方が好き」とか断言してる人の多いこと。アタシなんて『ハリポタ』オーディオ版聞いたら読書人生、変わっちゃったよ? 聞きたいポッドキャストありすぎて、積ん読どころか、積んキャスト、時間なさすぎて時々泣く泣く消してるよ? 耳でも本を楽しめる、知識を得られるってことなんだけど? なんでこんなに温度差があるんだろう? スマートスピーカーが普及しないのと同じ理由なんだろうか? で、なんでかなー?って考えてみたんだけど、これがまた日本らしいと言うか、こういう文化のどこが美しいのかね
そこらへんの金網でラジオが聞けた、という記憶 一部のAMラジオ局が今月から暫定的に止まる、というニュースを聞いて思い出したのだ。 以前こどもとゲルマニウムラジオを手作りしたときに、うまく聞こえなくて送信所の近くまで行ったら聞こえたことがあった。で、試しにイヤホンをそこらへんの金網に直接つけてみたらそれでも聞こえたのだ。なんだこれでいいじゃん、となった記憶がある。 この機に、それが本当だったのか試してみたい。 思い出の場所に行く さっそく現地にやってきた。 埼玉県川口市にある、文化放送のラジオ送信所だ。駅から30分歩いてやってきた。 記憶では、ここに見えているあらゆる金属にイヤホンをくっつけたらラジオが聞こえたのだ。金網とか、ガードレールとか。 ちなみにくっつけるイヤホンはこんなやつだ。 クリスタルイヤホンといいます 弱い電流でもうまく音に変換してくれるイヤホンだ。両端がクリップになっている
手頃な価格で質のいいヘッドフォンを探していたところ、レトロなデザインのこちらを発見! かなりの人気商品らしく、2ヶ月待ってようやく入手することができました。 老舗メーカーが作った高音質ヘッドフォン アシダ音響「ST-90-05-H 灰色」6,600円(税込) ※メーカーサイト価格 創業80年を超えるアシダ音響は、ミュージシャンやエンジニアなどプロフェッショナルも御用達の音響機器メーカー。 中でもこの「ST-90-05-H」というモデルは、一般ユーザー向けに国内生産にこだわって開発された高音質ヘッドフォンです。 人気の秘密は、なんといっても価格帯に見合わない音のよさ。 Φ40のドライバユニットに1テスラ(理論値)の磁気回路を搭載するという高級ヘッドフォン顔負けので仕様で、パワフルかつ繊細で豊かな音質を実現しています。 リーズナブルなイヤホンやヘッドフォンには音域のいずれかに不得意な部分がある
「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり 2020年3月、あるツイートが話題となった。 聴覚障がい者であるくらはしさんが、アニメ音響監督の岩浪美和さんの手掛けた作品がいかに聞きやすいかを記したものだ。 岩浪音響監督は「サイコパス」シリーズ、『ガールズアンドパンツァー』、『ソードアートオンライン』、「ジョジョ」シリーズなど、数多くの人気作を手掛けている。 聴覚障害者としてアニメの声の聞き取りやすさをメモしているんですが、PSYCHO-PASS 3の聞き取りやすさは神レベルで、無線声、ささやき、室内残響の演出でもほとんどすべて聞き取れる。 音響監督は岩浪美和さんという方で、担当作品を調べてみたら「聞き取りにくかったメモ」に該当なしでした。 — くらはし (@TareObjects) March 27, 202
今使っているワイヤレスイヤホンのEdifier NeoBuds Proが2021年に出た製品でちょっと古めになったので新しいのが欲しいと思い、情報収集をしていた。入門記事で、あまり触れられていないことがあったのでまとめておきたい。 現在、Amazon新生活セールFINALでセール価格になっている製品が多いので、気になる製品は価格をチェックして欲しい。 LDAC接続は再生時間が短くなる ワイヤレスイヤホンの再生時間は初心者にはわかりにくい。10時間以上の再生をうたうものはバッテリーケースを使っての充電を含めての場合を言っているものがほとんどだ。*1更にイヤホン本体のみの再生時間はノイズキャンセルON/OFFと使うCODECによって変わってくる。 「LDAC接続は高音質」みたいなことはよく書かれるのだが、この再生時間がかなり短くなることについては触れられていないことが多くて罠だ。ハイレゾのCO
Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようです ライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 ざっくりと雑に解説。 どんな技術を使っていてこんな感じだろうという妄想は以下をどうぞ。 Clubhouse リアルタイム配信の仕組みについて (妄想編) 著者 商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 Clubhouse の仕組みはとてもシンプルで配信者が N 人で、それを数千人が聞くという co-streaming と呼ばれる仕組みの一つ。この方式は今までは主に映像ありでパネルディスカッション的な使い方が主だっだ。それを
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く