[B! deeplearning] skypenguinsのブックマーク

skypenguins id:skypenguins

deeplearningに関するskypenguinsのブックマーク (140)

大規模言語モデル (LLM) の技術と最新動向
マルチメディア，分散，協調とモバイル（DICOMO2024）シンポジウムでの招待講演の資料です。 https://dicomo.org/
skypenguins 2024/06/29
全体的にNLP寄りの話だった画像言語モデルのCLIPの話とかあるんかなって思ったけど

llm

資料

NLP

DeepLearning

機械学習
リンク
GNN の最新動向 (ICLR 2024) - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
拙著﹃グラフニューラルネットワーク﹄が重版して第3刷となりました。皆さまありがとうございます！拡散モデルと最適輸送でもやりましたが、漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。本稿では、ICLR 2024︵5/7 - 5/11 @ウィーン︶で発表されたグラフニューラルネットワーク (GNN) 関連の研究動向を紹介します。 ICLR 2024 で発表された GNN 関連の論文は全部で 170 本です。凄まじい量ですね。ICLR 2024 では全て合わせて 2296 本の論文が採択されたので、7.4 パーセントが GNN 関連ということになります。この分量からも、GNN が活気ある研究対象であることが伺えます。以下では、代表的なトピックについて
skypenguins 2024/05/15
機械学習

深層学習

gnn

deeplearning
リンク
僕たちがグラフニューラルネットワークを学ぶ理由
グラフニューラルネットワーク - Forkwell Library #50 https://forkwell.connpass.com/event/315577/ での講演スライドです。サポートサイト：https://github.com/joisino/gnnbook グラフニューラルネットワーク（機械学習プロフェッショナルシリーズ）好評発売中！：https://www.amazon.co.jp/d/4065347823 連絡先: @joisino_ (Twitter) / https://joisino.net/
skypenguins 2024/04/27
人間にとって結果の解釈がし易いのもええとこやな

機械学習

深層学習

deeplearning

GNN
リンク
LLM Visualization
A 3D animated visualization of an LLM with a walkthrough.
skypenguins 2023/12/04
llm

自然言語処理

nlp

deeplearning
リンク
Dive Into LoRA Adapters
skypenguins 2023/10/01
LoRA

deeplearning
リンク
機械学習と自動微分 (2023)
「最適化法」第15回(ゲストトーク), 2023年1月20日, 同志社大学.
skypenguins 2023/09/28
ちなみに「ゼロからつくるディープラーニング」(最初のやつ)で、ここのスライドの内容はぜんぶ載ってます

機械学習

深層学習

deeplearning
リンク
Stable Diffusionの画像条件付けまとめ｜gcem156
Stable Diffusionの画像生成を画像によって条件づける方法をまとめていきます。といっても実装とかを全部見たわけではないので、多少間違っている部分もあるかもしれませんが、まあイメージはあってるっしょ。手法の分類　画像の情報をUNetのどこに与えるかによって手法を分類します。とりあえず5つに分けてみましたCross Attentionに与える‥Prompt Free Diffusion, PFG, IP-Adapter Self Attentionに与える‥Reference only, FABRIC Time embeddingに与える‥UnCLIP, Revision その他の場所に与える‥ControlNet, GLIGEN, T2I-Adapter LoRAの重みを学習する‥HyperDreambooth あれ・・？もしかしてこの時点でたいていの人は脱落ですか。この辺の
skypenguins 2023/09/03
sd

DeepLearning
リンク
計算時間とメモリの壁を打破！Transformerの次世代モデルReformer
3つの要点 ✔️ Local-Sensitive-Hashingにより必要な要素同士のAttentionを計算することができるようになった ✔️ Reversible layerによってレイヤー数に比例して増加するactivationを保存するメモリの削減 ✔️ transf ormerの計算量を$O(L^2)$から$O(L \log L)$まで削減した Reformer: The Efficient Transf ormer written by Nikita Kitaev, Łukasz Kaiser, Anselm Levskaya (Submitted on 13 Jan 2020 (v1), last revised 18 Feb 2020 (this version, v2)) Comments: ICLR 2020 Subjects: Machine Learning (cs.L
skypenguins 2023/09/02
LLM

機械学習

DeepLearning

深層学習
リンク
CoDeF
Consistent Video Translation with the learned canonical image and deformation. Slide for comparison. For all the demos, the inputs are provided on the left. We present the content deformation field (CoDeF) as a new type of video representation, which consists of a canonical content field aggregating the static contents in the entire video and a temporal deformation field recording the transf ormati
skypenguins 2023/08/23
deeplearning

生成ai
リンク
ロボット工学や自動運転などで顕在化するAI課題を解決、MIT発「Liquid Neural Networks」とは何か - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報
現在の人工知能（AI）を取り巻く環境では、大規模言語モデル（LLM）の話題から、ますます大規模なニューラルネットワークの開発競争が起きている。しかし、すべてのアプリケーションが、大規模なディープラーニングモデルの計算量とメモリの要求をできるわけではない。このような環境の制約が、いくつかの興味深い研究の方向性につながっている。MIT（マサチューセッツ工科大学）の CSAL（コンピュータ科学・人工知能研究所）の研究者が開発した新しいタイプのディープラーニングアーキテクチャ「Liquid Neural Networks」は、特定の AI 問題に対して、コンパクトで適応性が高く、効率的なソリューションを提供する。これらのネットワークは、従来のディープラーニングモデルに内在する課題のいくつかに対処するように設計されている。 Liquid Neural Network は AI の新たなイノベーシ
skypenguins 2023/08/15
深層学習

DeepLearning
リンク
エンジニア・データ分析職の方々にお薦めしたい、LLM時代に不可欠な教養が身に付くテキスト3選 - 渋谷駅前で働くデータサイエンティストのブログ
︵﹃IT Text自然語処理の基礎﹄より︶3ヶ月ほど前に空前のLLMブームについて概観する記事を書きましたが、それ以降も世間のLLMに対する狂騒ぶりは収まるどころかますます拍車がかかるという有様で、あまつさえ僕自身の仕事における日常業務にもじわじわと影響が及びつつあり、今後も良きにつけ悪しきにつけLLMと共生し続ける必要がありそうだと感じている今日この頃です。そんな猫も杓子もLLMに群がるが如き空前のブームを受けて、エンジニアやデータ分析職の方々の中には﹁LLMに興味はあるんだけど世の中にあまりにも多くのLLM関連コンテンツが溢れ返っていて何から手をつけたら良いのか分からない﹂という向きもあるように見受けられます。そこで、僕も断じてLLM以下生成AIの専門家などではないのですが、個人的に﹁このテキストを読めばLLM時代を生き抜くことが出来そうだ﹂と感じた書籍を、全くの独断と偏見で3冊
skypenguins 2023/07/03
最初のテキスト、深層学習以前の昔ながらのNLPの手法も入ってていいね

llm

自然言語処理

nlp

deeplearning

機械学習
リンク
Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよ VRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよマイナス適用によって、概念を削除するだけでなく強調することもできたよ一度でも画像生成 AIに触ったことがあると、より楽しんで読めると思います。論文とかどうでもいいから学習方法知りたい！という方は実際に学習してみるへどうぞ！今回作成したものコード: モデルなど: 前提 Stable Diffusion とは、StabilityAI らが公開したオープンソースの画像生成 AIであり、テキストによる指示で様々な画像を生成することができる。本来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の
skypenguins 2023/06/30
ai

生成ai

deeplearning

機械学習
リンク
画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり
画像生成AIでグラビアアイドルを作りたい。でも実在する人と同じ顔が出たら困る。そんなあなたに獣頭人身というソリューション。 AIでグラビアアイドルを作ったら最近、画像生成AIでグラビアアイドルを作るのにハマっている。こういうやつだ。カエルイカサメカマキリ Twitterで貼っていたらこれがバズる。多少はウケるかなとは思っていたが、想像以上のバズりで驚いている。ネタとしては全く新しいものでもないし、色々と詰めの甘い部分も多い。それでも多くの人が興味を持ち、さらに画像生成AIネタなのに批判も少なかった。だが、ツッコミが皆無というわけではない。その中にはもっともな内容もあるが、そもそも﹁目的が違う﹂と言いたいものもある。これはある意味で仕方ない。今回はTwitterでのバズなので、文脈が切り離された単体のツイートが広まっていくのだから。なのでブログでまとめることにした。そも
skypenguins 2023/06/26
4090でこんな何回も生成の試行したら電気代やばそうだな

ai

人工知能

deeplearning

生成AI
リンク
大規模モデルを支える分散並列学習のしくみ Part1
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。自然言語処理分野における大規模深層学習の重要性は日に日に高まっていますが、GPT-3, GPT-4 などのモデルの学習には膨大な計算コストがかかり、容易に学習できなくなっています。実際、モデルサイズが近年急速に大きくなっていることにより、学習に必要な計算量(FLOPs)は以下のように年々膨大になっています。近年の大規模モデルでは、NVIDIA H100 80GB であっても1つの GPU では、モデルをのせることすらできません。 Compute Trends Across Three Eras of Machine Learning よりまたScaling Laws によると、大規模なモデルは小さいモデルと比較してより優れた性能を発揮するため、自動
skypenguins 2023/06/21
gpu

gpgpu

deeplearning
リンク
VoiceBox
Voicebox: Text-Guided Multilingual Universal Speech Generation at ScaleWe present Voicebox, a state-of-the-art speech generative model built upon Meta’s non-autoregressive flow matching model. By learning to solve a text-guided speech infilling task with a large scale of data, Voicebox outperforms single purpose AI models across speech tasks through in-context learning. Voicebox can synthesize spe
skypenguins 2023/06/17
音声合成

TTS

AI

機械学習

deeplearning
リンク
[輪講資料] LoRA: Low-Rank Adaptation of  Large Language Models
パラメータを固定した事前学習済みモデルに対して、ごく少数のパラメータからなる低ランク行列を導入・学習することで、モデル全体のfine-tuningと同等の性能を発揮できる手法であるLoRAと、その論文について解説した資料です。深層学習を用いた自然言語処理の歴史的な変遷と周辺技術から、LoRAが必要とされるに至った背景まで丁寧に解説します。
skypenguins 2023/04/19
機械学習

深層学習

deeplearning

lora

LLM
リンク
GPT-4のすごさとその影響範囲について - Qiita
こんにちは！逆瀬川 ( https://twitter.com/gyakuse ) です！今日発表されたGPT-4について見ていきたいと思います。なにがすごいのか専門的な問題を解けるようになったたとえば米国司法試験で上位10%、GPT-3.5は下位10%だった非常に長い文章を入出力できるようになった最大で32k tokens (日本語で約2.5万文字、文庫で50pくらい) 画像をもとに会話できるようになった (これは実験段階でまだ提供されません) 特に嬉しいのは32k tokensまで文章を扱えるようになったことでしょう。たとえば小説を書くみたいなときも、プロット、設定等に3000文字使っても、残り2.2万文字くらい使えます。画像をもとにした会話の例 USER: この画像はどこがおかしいですか？パネルごとに説明してください GPT-4: この画像は、3つのパネルで構成される
skypenguins 2023/03/15
“理想のキャラクター/AIとの会話は高い” ドラえもん「いいロボットは借り賃も高いんだよ」（「トモダチロボット」より）

ai

deeplearning

nlp

自然言語処理

深層学習

LLM
リンク
ChatGPTは馬鹿じゃない！真の実力を解放するプロンプトエンジニアリングの最前線
はじめに ChatGPTをはじめとしたLLMを使いこなすための必須スキル、プロンプトエンジニアリングについて解説します。最近は動きが早すぎてキャッチアップが難しくなっていますが、特に以下のような手法が注目されているようです。 In-context Learning (ICL) Chain-of Thought (CoT) Zero-shot CoT ReAct Self-Consistency Program-aided Language Model (PAL) 今回は、6つのテクニックの中からPart1として、ICL、CoT、そしてZero-shot CoTの3つを紹介します。これらのテクニックは、ChatGPTをはじめとするLLMのポテンシャルを最大限に引き出すために必要不可欠です。さらに、各テクニックを詳しく解説した論文も紹介していますので、是非ご一読ください。 In-con
skypenguins 2023/03/12
プロンプトエンジニアリングとか大層な名前付けてんなってちょっと思ってたけど、こりゃすげーな…LLMはデカすぎて奥が深い

ai

nlp

自然言語処理

LLM

gpt

deeplearning

機械学習
リンク
ControlNet in 🧨 Diffusers
Ever since Stable Diffusion took the world by storm, people have been looking for ways to have more control over the results of the generation process. ControlNet provides a minimal interface allowing users to customize the generation process up to a great extent. With ControlNet, users can easily condition the generation with different spatial contexts such as a depth map, a segmentation map, a s
skypenguins 2023/03/11
AI

stable diffusion

深層学習

deeplearning

機械学習

controlnet
リンク
The Annotated Transformer
skypenguins 2023/02/19
2018年のThe Annotated TransformerのPyTorch1.11.0を使ったリニューアル版

NLP

自然言語処理

機械学習

深層学習

deeplearning

transformer
リンク
1 2 3 4 5 6 7 次のページ