大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを主宰し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。
PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。 大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。 ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。 例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。 高速ベクトルデータベ
マイクロソフトは、同社が提供する生成AIによるさまざまな支援機能を提供する「Copilot」製品群が、著作権侵害の心配なく使えると約束する「Copilot Copyright Commitment」を発表しました(英語、日本語) マイクロソフトは、生成AIがソースコードを生成してくれるGitHub Copilotや、プレゼン資料などを生成してくれる「Microsoft 365 Copilot」など、生成AIを活用した「Copilot」製品群を積極的に展開しています。 一方で、こうした生成的AIは既存のソースコード、画像、文書などを学習しているため、何らかの要因で既存のソースコードや画像、文書の複製に相当するものが生成され、それを知らずに利用した場合に利用者が著作権侵害により訴えられる可能性があるのではないか、と心配されています。 今回のマイクロソフトの発表した「Copilot Copyri
追記こうしてすぐ違う考えの相手を敵だとか馬鹿だとか決めつけてしまう態度ってSNSやネットが広めたのか人間の性質なのか悩む。「見ていてあまり気持ちのいいものではない」ってそれも倫理観やモラルの話じゃないですか。 どうしようもない反論が星集めてますが、根拠のないパクリ認定や誹謗中傷は普通に法に触れる可能性がありますよ。 本文パルワールド、生成AI叩き、トレパク魔女裁判、他にも最近だと呪術廻戦の演出へのパクリ批判とか、ちょっと古いところだとbuhitterやpixiv BL同人の論文無断引用とかもあったな。普段、二次創作は親告罪だからグレーゾーンと主張しておきながら特に著作権に関する知識があるわけでもなく、ただただお気持ちで騒ぐだけで中身がなにもない。 100歩譲って自分が気に入らないと表明するだけであれば好きにすればよいが、製作者やファンまで『倫理観、モラルがない』、『パクリを肯定する低俗なフ
無料かつ高機能なペイントアプリ「Krita」に画像生成AI「Stable Diffusion」を組み込むプラグインが「krita-ai-diffusion(AI Image Diffusion)」です。Generative AI for Kritaを使えば落書きのような下描き画像から美麗イラストを生成できるとのことなので、インストール手順や使い方をまとめてみました。 GitHub - Acly/krita-ai-diffusion: Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. https://github.com/Acly/krita-ai-diffusion ・目次 ◆1
米Amazonは9月7日(現地時間)、Kindle用電子書籍出版サービス「Kindleダイレクト・パブリッシング」のコンテンツガイドラインを更新し、人工知能(AI)コンテンツに関する条項を追加した。 出版するコンテンツ(テキスト、画像、翻訳)を生成AIベースのツールによって作成した場合は、申告することを義務付ける。 ガイドラインに従っていないことが判明したコンテンツは却下または削除される。 なお、自分の作品をAIツールで編集、改良、エラーチェックした場合は、AI生成コンテンツとはみなさない。また、アイデア出しの段階でAIツールを使っても、最終的に自分でテキストや画像を作成した場合は対象外という。 これは、Authors Guild(全米作家協会)が7月に公開した、AIのトレーニングに作家の作品を無断で使わないよう求める書簡を受けたものとみられる。 Authors Guildは同日、Amaz
いぐぞー!! ✈️ 旅するプログラマー @igz0 俺「クソ!! 納期までコードが完成しない!!!」 謎の備忘録おじさん「エラーが発生したので備忘録として書いておきます」 Stack Overflow「これを試して!!」 謎中国人のブログ「動くコードはこれ」 謎のインド人の解説動画「なるべく分かりやすく解説したよ!!」 ワイ「みんな……!!?」 2023-08-12 12:06:47 いぐぞー ✈️ 旅するプログラマー @igz0 旅とプログラミングをこよなく愛します。 アメリカ大陸🇺🇸を横断しました!!小学生からプログラミング→新卒SIer→Webに目覚め個人事業主兼会社員。テレビ出演経験あり。 Webサービスを作りました。AI・VRに没頭中。IT関連中心にツイートします!!アイコンは@ixy先生より利用許諾済み。Amazonアソシエイト。 note.com/igz0/
生成AIを活用する企業は増える一方だが、それとともに、AIの間違いによって損害を被る企業も増えている。 エア・カナダはチャットボットの誤回答で賠償金を支払うはめに。別の企業は生成AIが作成した解雇合意書に重要な項目が欠落していたため、高額な和解金を支払わなければならなくなった。 企業に求められるのは、生成AIは間違いを犯すという前提に基づいた準備や行動。AIが間違えているかどうか分からない領域では活用すべきではない。 (小林 啓倫:経営コンサルタント) チャットボットで損害を被ったエア・カナダ 企業内でのAI活用が加速している。社員や顧客と自然な言葉でやり取りできる生成AIが登場したことで、AIを応用できる業務が増え、具体的な成果も見えやすくなったためだ。 たとえば、カナダで1855年に設立され、現在では同国で最大の規模を誇るTD銀行(Toronto-Dominion Bank)は、コンタ
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米スタンフォード大学、米ノースウェスタン大学、米コーネル大学に所属する研究者らが発表した論文「Can large language models provide useful feedback on research papers? A large-scale empirical analysis」は、大規模言語モデル(LLM)が研究論文の査読を行えるかを調査した研究報告である。この検証のため、論文の査読を自動で行うシステムと、LLMによる査読コメントと人間による査読コメントとの間の共通点を探るシステムを開発した。 学術雑誌に投稿される研究
ノードベースの画像生成ソフトウェア「ComfyUI」向けに作られたノードの一つ「ComfyUI_LLMVISION」にマルウェアが仕込まれていることがわかりました。発覚後、ComfyUI_LLMVISIONのGitHubリポジトリが削除されています。 PSA: If you've used the ComfyUI_LLMVISION node from u/AppleBotzz, you've been hacked byu/_roblaughter_ incomfyui クリエイターのロブ・ラフター氏がRedditで共有したところによると、ComfyUI_LLMVISIONをインストールして使用した場合、ブラウザのパスワード、クレジットカード情報、閲覧履歴がWebhook経由でDiscordサーバーに送信されてしまうとのこと。 ラフター氏自身も影響を受け、ComfyUI_LLMVISIO
はじめに RAGとは 構成図 作成リソース Lambda 1. PDFから文書抽出&Embedding取得Lambda 2. 回答作成用Lambda AWS SAM テンプレート Streamlit 動作確認 まとめ はじめに こんにちは堤です。 Amazon BedrockがGAとなり、AWS内で完結してLLMアプリケーションを構築できるようになりました。 試しにRAGアプリケーションを作成してみようと思いましたが、現状AWSでRetrievalするデータソースを作成しようとすると、Amazon OpenSearch Serverless やAmazon Kendraを使用するしかありません。これらのサービスを使うのはコストもそれなりにかかり少しハードルが高いなーと思っていたら以下のブログを見つけました。 aws.amazon.com 構成図を見ると分かるように、S3にembedding
Stable DiffusionやMidjourneyの登場により、画像生成AIに対する期待は爆発的に高まっており、今やWindowsの標準ブラウザであるEdgeにも画像生成AI機能が搭載されています。そんな画像生成AIの活躍により、中国のゲーム業界ではさっそくイラストレーターたちが仕事を奪われつつあると、テクノロジーメディアのRest of Worldが報じました。 AI is already taking video game illustrators’ jobs in China https://restofworld.org/2023/ai-image-china-video-game-layoffs/ 2022年にDALL-E 2が登場して以来、MidjourneyやStable Diffusionといった画像生成AIが登場し、ユーザーはテキストから非の打ちどころのないイラストを
Research部門の近江崇宏です。 今回、ストックマークは最近の話題にも詳しいGPT-NeoXをベースとした14億パラメータの日本語のLLM(大規模言語モデル)をオープンソースとして公開します。モデルはHugging Face Hubからダウンロードいただけます。 https://huggingface.co/stockmark/gpt-neox-japanese-1.4b 当社はビジネスにおける情報収集・分析をサポートするサービスを運営しており、そのために最新のWebデータの収集を日々行なっております。今回の事前学習では、一般にLLMの事前学習によく使われるCommon Crawl由来のデータだけでなく、当社が所有している独自のWebデータ(2023年6月まで)も含めて事前学習を行うことで、最近の話題にも詳しいモデルを開発しました。具体的には、事前学習に用いたデータセットはCC100の
「人工知能」と称してアーティストやその他のクリエイターの権利を侵害する製品を作りだしたとして、Stability AI、Midjourney、DeviantArtの3社に対して集団訴訟が提起されました。 Stable Diffusion litigation · Joseph Saveri Law Firm & Matthew Butterick https://stablediffusionlitigation.com/ AI Art Generators - Copyright Litigation https://www.saverilawfirm.com/ai-art-generators-copyright-litigation Class Action Filed Against Stability AI, Midjourney, and DeviantArt for DMCA
・欧米では人権意識が高いリベラルな人ほどAIに反対してて、(人間の尊厳を奪う、人種ステレオタイプの助長、人権侵害、ネトウヨのプロパガンダや偽情報への悪用が主な理由)米国民主党もリベラル派がAIが人権侵害で反対してる事を理解して、その方向で動いている。 ・バイデン大統領も世界に先駆けて法規制に動いており、ニューヨークタイムズや大学教授などの知識人も反対の立場を取っている。 https://people.com/joe-biden-ai-executive-order-mission-impossible-villain-8385476 ・逆に、右翼ほどAIに肯定的で、4chに生息するアメリカネトウヨなどはクリエイター層を冷笑している。(クリエイター層はリベラル派が大多数だ) ・右翼は偽情報のプロパガンダが規制されると不利になるため、AI反対派を攻撃している。 ・AI推進派は表自(表現の自由戦
三菱電機が組み込みソフトウエア開発への生成AI(人工知能)活用を進めている。ソフトウエア開発に関連する過去数十年分のドキュメントの要約文を生成AIにより作成。これを検索用のインデックスとして使うことで、エンジニアの作業工数を最大40%削減できると見込む。 2024年6月20日に開催されたアマゾン ウェブ サービス ジャパン(AWSジャパン)の年次イベント「AWS Summit Japan」で、PoC(概念実証)の成果として明らかにした。今後は実用上必要最小の機能を備えたサービスであるMVP(Minimum Viable Product)として、従業員向けのアプリケーションを開発する予定だ。 三菱電機の組み込みソフトの開発部門では、製品開発部門から改修依頼を受けると、改修対象のソフトウエアの仕様書を検索して改修内容に関連する記述を確認。それを基にソフトウエアのソースコードを確認し、ソースコー
写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。 [2311.09221] Single-Image 3D Human Digitization with Shape-Guided Diffusion https://arxiv.org/abs/2311.09221 Human-SGD https://human-sgd.github.io/ 研究チームの1人であるJia-Bin Huang氏が、Human-SGDがどういうモデルなのかを解説するムービーをYouTubeで公開しています。 3D Human Digitization from a Single Image! - YouTube ライダージャケ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く