著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
先日公開したアニメ絵の実写版を作る記事はおかげさまで好評でした! アニメ絵生成の第二弾に行く前に、アニメ絵実写版生成でも威力を発揮する「雑コラ」をAIでリアルにする手法について今回は説明します。 実はAIアートグランプリの時も「雑コラ」と言われたりしていたのでしたw 渚の妖精ぎばさちゃん対キモノアゲハ/koizoom1/漫画@gibasachan 雑コラに見えるけど すごい技術 登場人物より多いモデル これはゆるキャラの未来きたな…#AIArtGp pic.twitter.com/5A4wMUJsND — Dr.(Shirai)Hakase #AI神絵師本 #技術書典14 (@o_ob) March 12, 2023 AIといえばラーメン(?)ですが、こんな画像も作れちゃいます!ラーメンの中にいる秘書さん! ラーメンの中にいる秘書さん絵面としては結構インパクトがありますが、実は作るのは全然
こんにちは。 苦しんでプログラミングを学んだ柴犬こと、「くるしば」と申します。 元々コンサルタントの仕事をしていましたが、独学でプログラミングを学習し、Webサービスを作って起業しました。 その後個人で開発したサービスを売却したり、また別のIT系の会社を創業、経営したりしています。 去年の8月から下記のTwitterにてプログラミング学習に関して発信し始め、ありがたいことに10000人以上の方々にフォローして頂きました。 プログラミング初心者に絶対覚えてほしい、ググる時の効率が10倍上がるコツ pic.twitter.com/hK1ZhNavwh — くるしば | 読めば10倍効率が上がるプログラミング学習の教科書 (@shiba_program) September 13, 2022 技術書、Webサービス、QiitaやzennのWeb記事など、最近は本当にプログラミングを学習できるコン
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。 それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。 春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。 そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース
こんにちは! 最近、ブレストをChatGTPとしているのですが、これはかなりやばく、自分の仕事に多大な影響を与えています。 これのやり方をちらっと紹介すると、割と反応がよかったので、実例ともに書いてみました。 ちなみに一応解説しておくと、OpenAIという企業によって開発されているChatGPTは、人工知能の一種である自然言語処理技術を用いて、自然言語での会話を可能にするチャットボットです。 ChatGPTでは、過去の文章や対話の情報を学習し、それを基に人間と同じように応答することになったのがすごいところです。 ブレスト方法結論でいうと、自分がファシリテーターになって、ひたすらChatGPTにいろいろな角度で話してもらうというだけです。 これを使うと、とにかく頭が刺激されるのでオススメです。 といってもよくわからないと思うので、実例をみていきます。 まず質問からいきます。僕は、たとえば以下
チャット、文章生成、翻訳、コーディングなどさまざまなタスクをこなす万能型ジェネレーティブAIツールである「ChatGPT」。同じ土俵では競合は少ないものの、翻訳、要約、ライティング、コーディングなど各機能に特化して見ると、競合は多数存在する。どのような競合がいるのか、4つの特化型ジェネレーティブAIの現状を探ってみたい。 細谷 元 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リア
今話題の高性能対話型AI、ChatGPTで遊んでみよう https://chat.openai.com/chat 猫耳メイドモードにする「語尾を"にゃん"にして!」とお願いすると… かわいいね~そのまま、「私のことはご主人さまと呼んで」「ハートマーク付けて」「かわいく読んで」などなどオーダーを増やしていくと…. かわいくなっちゃった! ・おまけ ツンデレパターンもあるのかあんしんモード組織に捕まって尋問されても情報を出さないように訓練することもできます 何も答えてくれなくなっちゃった根に持ってそう人間っぽくする淡白なChatGPTをより人間の温かみある感じにしたい場合は「人間の真似をしてください」のように依頼すると効果的です。 カニカレーって何?
賢いチャットAIとして話題のChatGPT。筆者も試しに課金をして、あれこれチャットを楽しんでいます。それで、ここまでの結論としては表題の通り、ChatGPTは質問をするよりも、作業を依頼する方が良さげだなと思いました。 知識が古くて、質問には使えない なぜかというと、ChatGPTは現状では学習データが若干古く、例えば2023年2月時点で「日本の総理大臣は誰?」と質問をすると、菅義偉氏であると回答されます。(実際には岸田文雄氏) また、情報をまとめて管理している訳ではなく、例えば「店名」と「住所」など関連しているはずの情報がバラバラに管理されているのか、例えば「新宿駅近くのイタリアンのお店は?」といった検索サイトの代わりに使おうと思っても、実在しないお店などが表示されてしまって、現状では使い物になりませんでした。 一番上の「イルポンテ」というお店は、該当の住所はなさそうです(上石神井には
現状、ネットで調べ物をしたいときは、Googleなど検索サイトを利用することが多いだろう。その場合、検索結果にリストアップされる無数のサイトは、質の高い有用なサイトばかりとは限らない。 広告だらけで内容が薄いページや、反対に難解なページばかりを引き当て、目的の情報にスムーズにたどり着けなかったという経験は誰しもあるだろう。 一方、ChatGPTは、質問文を投げかけるだけで、必要な情報を教えてくれる。情報を求めて、複数のサイトをさまよう必要はない。 Google幹部は非常事態を宣言した ユーザーにとって非常に便利なツールだが、Google社には脅威になっている。 ニューヨーク・タイムズ紙は昨年12月、検索の未来を書き換える可能性があるとしてGoogle幹部が危機感を抱き、社内に「Code red(非常事態)」を宣言したと報じている。ChatGPTに太刀打ちすべく、社内の開発体制を根底から変更
伊藤園が「お~いお茶 カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、本物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日本初になるという。 同社は発表に際して「AI技術で生成したAI model(AIモデル)を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。 「お~いお茶 カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外
2022年11月にOpenAIがリリースしたChatGPTはユーザー(人間)と対話を行う形式でテキストを生成する「大規模言語モデル(LLM:Large Language Model)」と呼ばれるものです。ユーザーとの間で文脈に沿ったテキストを生成するのが大きな特徴ですが、適切な返答があることもあれば、どう見ても間違った返答をすることもあります。それでも、これまでのテキスト生成AIよりも格段に品質の高い出力を行う大規模言語モデルだといえます。その品質の高さから、ChatGPTをどう活用すべきかとか、ChatGPTは使うべきではないといった議論も各所で行われるほどです。 本eBookでは、ChatGPTとは何かに始まり、ChatGPTがなぜユーザーの意図に沿った返答を返せるのか、ChatGPTの技術を取り込んだマイクロソフトのBingの概要、ChatGPTからの返答をよりよいものにするためのテ
「生成AIイヤー」とも言える2023年も終わりに近づいてきたが、ここにきてグーグルがさらに新しい技術を投入すると発表した。 グーグルは12月7日(日本時間)、生成AI向けの新しい大規模言語モデル「Gemini(ジェミニ)」を発表した。 自社のチャットAI「Bard」はもちろん、「Pixel 8 Pro」をはじめとしたAndroidスマートフォンへの組み込みも進める。 グーグルのスンダー・ピチャイCEOはリリースの中で、Geminiをこう表現する。 「賢いソフトウェアというよりも、より便利で直感的な、相談できる専門家または仲間のように感じられるようになる」 グーグルが本気で取り組んだGeminiとは、どんな存在なのだろうか。
ChatGPTに世間が沸いている。 長年この分野を見てきた者としては「ちょっと沸きすぎ」のようにも見える。深層学習を使った会話ロボットは、何もChatGPTが初めてというわけではない。 ところが、世界中が驚かざるを得ないゲームチェンジャーが現れた。 その名も「FlexGen」と言う。2月15日に公開された。 特筆すべきは、FlexGenが、ChatGPTなどの大規模言語モデルを「従来の100倍高速に動かせる」上に、NVIDIA Tesla T4という、わずか16GBのメモリーしかないGPUでその性能を使えるということだ。 つまり、大規模言語モデルを秋葉原で売っているパソコン程度で動かせる新しいフレームワークが登場したことになる。 このインパクトがどれほどすごいのかを解説してみよう。 目次: 「Google翻訳」と「大規模言語モデル」は技術的にかなり近い 会話AIの正体とは何か ChatGP
We’ve implemented initial support for plugins in ChatGPT. Plugins are tools designed specifically for language models with safety as a core principle, and help ChatGPT access up-to-date information, run computations, or use third-party services. In line with our iterative deployment philosophy, we are gradually rolling out plugins in ChatGPT so we can study their real-world use, impact, and safety
お知らせ(8/27 08:08)新サービスに移行しました。より便利に使いやすくなっています。そしてずっと無料です 開発の経緯はこちら https://note.com/shi3zblog/n/n8a3c75574053 夜更かしをしていたらすごい勢いでStable Diffusionが落ちてきて、あまりにうれしいのでこの喜びを皆様と分かち合いたく、無償で公開します。 使い方低コスト運用ですので、テキストボックスに文字を入力したあと、Requestボタンを押して、しばらくしたらリロードしてみるとどこかに自分の入れたものが表示されているはずです。といっても、今回のStableDiffusionはめちゃくちゃ速いので運が悪いと無視されます(そうしないと無限に電気代とサーバー代がかかってしまうので無料故の措置だと思ってください)。 注意事項Requestを連打しないでください。 腕に覚えのある方h
7000億円以上の営業損失を出したデバイス事業の見直しを進めているAmazonが手がける音声アシスタント「Alexa」は、2022年だけで100億ドル(1兆4000億円)を食いつぶす大きな失敗だったと、Amazonの社員が語りました。 Amazon Alexa is a “colossal failure,” on pace to lose $10 billion this year | Ars Technica https://arstechnica.com/gadgets/2022/11/amazon-alexa-is-a-colossal-failure-on-pace-to-lose-10-billion-this-year/ Amazonは営業不振により最大で1万人を解雇する史上最大規模の人員整理を進めており、その中で最も大きな影響を受けているのが音声アシスタントであるAlexa
賢木イオ🍀AIイラスト @studiomasakaki 水星の魔女が大好きなAIイラストレーター / 国内最大級の検証記事群「AIイラストが理解る!」「プロンプト超辞典」編集/過去のコンテンツは「ハイライト」、r-18はpixivにあります/自己紹介を兼ねた怪文書▶️ひたすらAI絵やってたら絵が描けるようになってた話ur0.jp/M2BtD studiomasakaki.fanbox.cc 賢木イオ@スタジオ真榊 @studiomasakaki AIイラストはControlnetの登場で完全にゲームチェンジしましたわ。線画から色塗りができるのは本当に素晴らしい機能!「あくまで自分の線のまま」にすることも、「AIに補正してもらう」こともできるのがポイントです。 これは色指定をしていませんが、「赤い髪・黒い服・黄色の目」と指定すると、 pic.twitter.com/V0flFRYmqp 2
画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って
ChatGPTのOpenAI社、日本に7つの提案。本気で普及を狙う2023.04.11 02:2063,794 かみやまたくみ OpenAI社のサム・アルトマンCEOが来日し、自民党の会合に出席、7つの提案を行なったと、同党衆議院議員 塩崎あきひさ氏がツイートしました。 OpenAI社のサム・アルトマンCEOが来日し、自民党・AIの進化と実装に関するPTに出席。日本での活発なChatGPTの利用などを引き合いに「日本がAIの利活用を通じて世界で大きな存在感とリーダーシップを発揮してほしい」と同氏。日本への期待を込めて、以下の7点の提案がありました。 1… pic.twitter.com/ZH0KZCDxEa — 塩崎あきひさ 【衆議院議員・愛媛1区】 (@AkihisaShiozaki) April 10, 2023社会全体に大きな影響を及ぼす可能性があるとみられている対話型AIサービス「
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く