ブースは、韓国の音声AI企業Supertoneが出展したもの。角刈りオジサンの美少女ボイスは、リアルタイム音声変換ソフト「SHIFT」のデモによるものだった。このSHIFT、少女だけでなく少年、成人女性、成人男性、渋いおじいさん、悪魔などさまざまな声がプリセットされており、リアルタイムかつ高精度に声を変換できるのが特徴。 独自の音声合成基盤モデル「NANSY」(Neural Analysis & Synthesis)を採用しており、ユーザーの声の事前学習も、10秒程度のサンプルスクリプトを読み上げるだけで完了。ユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低なども細かく調整可能だ。 同様の技術として「RVC」(Realtime Voice Changer)などが有名だが、快適に利用するにはNVIDIAの高性能なGPUを必要とする。一方、SHIFTはCPUのみで47ミリ秒と
Krita の AI Diffusion プラグイン、SD のインターフェースとしてかなり良い。話題の LCM によるライブペイントも便利だし、イラストレーションツールだからレイヤーや選択ツールが使えるのが強い。すでに SD でできたことだが、こんな感じの変換が素早く、気持ちよく行える。https://t.co/bUPOZrKs1n pic.twitter.com/0hn8iMHHms — Naoto Yokoyama (@builtinnya) November 18, 2023 これらを ControlNet8 で入力して AnimateDiff を使えば済むと考えていたが、甘かった。 動画生成 AI に期待しているのは、この2枚の画像の間のフレームを説得力のある形で補間することである。しかし、7秒という長さでは、例えば次の動画1のようになってしまう。 動画1. 図1と図2を使い、パラ
生成AIを使った実験を重ねるにつれて、クリエイティブ分野での限界が明確に理解されるようになってきた。AIとアーティストたちの力関係を変えようとする取り組みもいくつか始まっている。 by Melissa Heikkilä2024.06.30 190 6 この記事の3つのポイント AIとアーティストとの関係性はこの2年間で変化しつつある 独創的で面白いものを生み出すのは難しく、補強ツールとして使うのが最適 権利侵害を防ぐ技術やツールも開発が進み、不安を和らげている summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。 人工知能(AI)のジョークはありきたりだ。グーグル・ディープマインド(Google DeepMind)の研究チームがプロのコメディアン20人に依頼し、一般的なAI言語モデルを使ってジョークやコメディパフォーマンスの台本を書いてもら
AIにとって微分可能性が必須条件でなくなりつつある意味 2024.07.04 Updated by Ryo Shimizu on July 4, 2024, 12:26 pm JST かなり長い間、本欄でも「AI(人工知能)」と書くときに、注釈として「AI(人工ニューラルネットワーク)」と書く必要があった。 というのも、AIという言葉が指す意味は範囲がとても広く、解釈次第ではただの電卓や辞書、IMEまでもがAIと呼べてしまうからだ。 だから、「AI」という言葉を多用する人を見た時、それは「新しいインチキ(Atarashii Inchiki)」であると考えた方が良いというジョークを言ったものである。 ここ5年で、事態は一気に変化した。今やニューラルネットワークでないものを「AI」と呼ぶのは憚られる。まあそれでもニューラルネット以前の古いシステムをいまだに「AI」と呼ぶようなIT(インチキ)企
すまほん!! » テック » AI・人工知能 » 【悲報】WindowsのAIアシスタント「Copilot」、機能が大幅劣化。ただのチャットボットに 「お前を消す方法」のカイル君、そしてCortanaさん、後輩がそっちに行くかも。 Microsoftは、昨年11月にリリースした「Copilot in Windows」を発表。その後Windows向けのキーボードとしては30年ぶりに、キー配列に「Copilotキー」を追加するなどAIに対する本気度を見せていましたが、突然Copilot in Windowsの機能を大きく縮小させてしまったようです。 Copilot in Windows(以降Copilot)は、Copilotキーを備えるPCはそのキーを、そうでないPCからはWindows + Cのショートカットで起動するAIアシスタント。処理をクラウドに頼っているためレスポンスは早くありません
毎日のように、新たな生成AIのシステムが発表され、1年前には想像もつかなかったような時代に入ってきていますが、また非常にユニークで画期的なシステムが登場してきました。ヨーロッパのラトビアのメーカー、Sonarworksが開発したSoundID VoiceAI、というもので、ボーカルトラックをまったく別のシンガーが歌ったものに差し替えるというソフトです。つまり歌詞やメロディーはそのままに、違う歌声に差し替えることができる、というわけです。それに近いことはSynthesizer Vの「オーディオ・ノート変換」機能を利用することで実現していましたが、SoundID VoiceAIではプラグインエフェクトとして声を変換できるため、より手軽に扱えるほか、非常に多くのシンガーが利用できるというのがメリットとなっています。 さらにSoundID VoiceAIがすごいのは変換ターゲットが必ずしも人間のボ
2024年7月2日に、Metaが60秒以内にテキストから高品質な立体形状とテクスチャを備えた3Dアセットを生成できる「Meta 3D Gen」を発表しました。Metaは、3D Genを使うと従来の3~10倍の速度で3Dアセットを生成できるとしています。 Meta 3D Gen | Research - AI at Meta https://ai.meta.com/research/publications/meta-3d-gen/ Meta Unveils 3D Gen: AI that Creates Detailed 3D Assets in Under a Minute https://www.maginative.com/article/meta-unveils-3d-gen-ai-that-creates-detailed-3d-assets-in-under-a-minute/
ドバイを拠点とするAIエンジニアリング企業のLEAP 71が、大規模計算工学モデルのNoyronが設計して3Dプリンターで出力した液体燃料ロケットエンジンの燃焼試験に成功したことを発表しました。 LEAP 71 hot-fires 3D-printed liquid-fuel rocket engine designed through Noyron Computational Model | LEAP 71 https://leap71.com/2024/06/18/leap-71-hot-fires-3d-printed-liquid-fuel-rocket-engine-designed-through-noyron-computational-model/ We just test fired a 20,000 horsepower AI-generated rocket engi
Googleに買収されたAIスタートアップ・DeepMindの共同創設者であり、記事作成時点ではMicrosoftのAI開発部門であるMicrosoft AIのムスタファ・スレイマンCEOが、オープンウェブ上にコンテンツを公開した瞬間、誰でも自由にコピーして使用できる「フリーウェア」になるという考えを自身が持っていることを打ち明けました。テクノロジーメディアのThe Vergeは、「誤った考えを持っている」と批判しています。 Microsoft’s AI boss thinks it’s perfectly OK to steal content if it’s on the open web - The Verge https://www.theverge.com/2024/6/28/24188391/microsoft-ai-suleyman-social-contract-freew
ロンドン(CNN) ウクライナのゼレンスキー大統領の妻オレナ・ゼレンシカ氏が、訪問先のパリで高級車を購入したという偽情報の動画がインターネット上に投稿された。ロシア系の情報工作網の関与が疑われる。 人工知能(AI)で作られた「ディープフェイク」動画とみられ、パリ市内にある高級車ブランド「ブガッティ」ディーラーの従業員と称する架空の男性が登場。先月7日にゼレンスキー氏とともにパリを訪れていたオレナ氏が、ブガッティの新型「トゥールビヨン」を450万ユーロ(約7.8億円)で購入したと話している。 専門家によると、映像のカットや奇妙な抑揚、唇の動きなどにディープフェイクの特徴がみられるが、X(旧ツイッター)の閲覧数は24時間で約1800万回に達した。 ブガッティは2日、偽情報工作を非難する声明を発表。動画の偽造とその使用、なりすまし、名誉毀損(きそん)の被害を申し立てる法的措置を取ったことを明らか
Alibaba Cloudのエンジニア兼研究者であるEnnan Zhai氏が、LLMトレーニング向けデータセンターのGPUをイーサネットで相互接続する方法に関する研究論文を発表しました。この技術は特に、NVIDIAのGPU相互接続プロトコルであるNVLinkではなくイーサネットを採用している点で斬新とされています。 Alibaba HPN: A Data Center Network for Large Language Model Training (PDFファイル)https://ennanzhai.github.io/pub/sigcomm24-hpn.pdf Alibaba Cloud ditches Nvidia's interconnect in favor of Ethernet — tech giant uses own High Performance Network t
","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"
このテストは、こちらのページからWebブラウザ上で体験できる。 賞金総額110万ドルのコンテスト「ARC Prize 2024」 現在、ARCを用いたコンテスト「ARC Prize 2024」が開催中だ。ARC Prize 2024は、AGIに向けた新しいアイデアの探求を奨励し、その進歩をオープンソース化することを重視している。 ARC Prize 2024は、総額110万ドル(約1億7780万円、1ドル=161円換算)以上の賞金が用意され、グランプリの50万ドル(約8081万円)は、ARC-AGIの非公開評価セットで85%以上のスコアを達成した最大5チームに授与される(人間の正解率が平均84%なため)。 2024年の進歩賞として、トップスコア賞と論文賞がそれぞれ5万ドル(約808万円)を用意。トップスコア賞は、24年の競争期間中に最高スコアを記録した上位5チームに分配される。1位が2.5
リコーの国内販売子会社であるリコージャパンは2024年6月28日、生成AI(人工知能)が対話形式で社内情報に関する質問に回答するサービスを2種類、同日から提供すると発表した。RAG(Retrieval Augmented Generation、検索拡張生成)の仕組みを使い、LLM(大規模言語モデル)が社内規定や過去事例、業務報告書といった社内文書を参照できるようにすることで回答精度を上げる。 「RICOH デジタルバディ」は大企業での利用を想定する。PDF、Word、Excel、PowerPoint形式のファイルをアップロードできる。個人や部門ごとに利用範囲を制御でき、情報の漏洩を防ぐ。米Amazon Web Services(AWS)の生成AIサービス「Amazon Bedrock」を通じてLLMにアクセスする。既存データベースとの連係、長文読解や多言語対応に強いLLMへの切り替えなど、
by Anthony Quintano ブラジルの国家データ保護機関(Autoridade Nacional de Proteção de Dados:ANPD)が2024年7月2日に、FacebookやInstagramの投稿をAI開発に転用できるとするMetaの新しいプライバシーポリシーを無効とし、ブラジルの国民が生成したデータでAIをトレーニングすることを禁止すると発表しました。 ANPD determina suspensão cautelar do tratamento de dados pessoais para treinamento da IA da Meta — Autoridade Nacional de Proteção de Dados https://www.gov.br/anpd/pt-br/assuntos/noticias/anpd-determina-su
生成AI(人工知能)の用途として、与えられたプロンプトに応じてソースコードを生成したり補完したりするAIコードアシスタントに注目が集まっている。GitHubは2024年5月中旬に開いた記者説明会で、同社のAIコードアシスタントである「GitHub Copilot」の現状やAI法規制を巡る同社の貢献を説明した。 登壇したのは、GitHub Japanの日本・韓国エンタープライズ担当シニアディレクターである角田賢治氏、GitHub COO(Chief Operating Officer:最高執行責任者)であるカイル・デイグル(Kyle Daigle)氏、そして同CLO(Chief Legal Officer:最高法務責任者)のシェリー・マッキンリー(Shelley McKinley)氏の3人だ。 まず角田氏が、日本市場でのGitHubの利用状況について説明した。現在、300万人を超える開発者が
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く