ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開
くりぷとバイオ@研究×新規事業開発 @cryptobiotech 企業で研究×新規事業開発に励む人 | 修士卒→大手メーカー研究職→Ph.D.取得→新規事業開発職 | 生成AIとDeepTech勉強中 | BiotechとFoodtechが好き | ココナラで院生就活支援→https://t.co/d94kwtA29T | note→ https://t.co/pvmKzQaD1A https://t.co/0FG5b9HSAL くりぷとバイオ@研究×新規事業開発 @cryptobiotech 1st author論文持ってる修士就活生が増えてるようで、それを達成してるM1後輩に話を聞いてみたら「日本語で文章書いて全部DeepL翻訳で英語化→英語化された文章をgoogle翻訳、みらい翻訳で日本語化→違和感ないか確認→指導教官に提出」というプロセスを踏んでるらしい。そりゃ早くなるわけだ。すご
「映像も物理も、微分可能になるとすごいことが起きる」ということの意味を文系にもわかるように説明しようと試みる 2021.07.26 Updated by Ryo Shimizu on July 26, 2021, 07:12 am JST 最近のプログラミングの新しい波は微分可能プログラミング(differentiable programming)である。 微分可能プログラミングとは、簡単に言うと・・・と思ったが、簡単に言うのは結構難しい。 まず「微分」という言葉があまり簡単ではない印象がある。 まずは微分と積分の関係性を説明しておこう。文系の読者に向けた記事であるので、非常にざっくりと説明してみよう(そのかわり、元々数学が得意な読者にとっては直感的ではない説明になるかもしれない)。 まず、瓶からコップにジュースを移すような状況を想定してみる。 瓶からコップが一杯になるまで60秒で注ぐとし
ABEJA Advent Calendarの10日目です。 はじめにのはじめに 以下は、あくまでテストデータで上手く行ってるよという話で、本当にこれをやったら儲かるかというと、まだまだわかりませんのであしからず!あとネタがネタだけに、今回のはあくまで個人のやってみた記録であり、組織の取り組みとは関係ありません。 はじめに お金が欲しい!無限に寿司が食いたい!株で儲けたい! 研究やエンジニアリングをしながら生きてく上で、将来のキャリアや技術スタックについて日々考えてるんですが、よくよく原点に立ち返るとそもそも技術スタックとかどうでもよくて、好きなものを作って漫画読んで生きていきたいんです。つまり結局、世の中は金なんですよね金。なので、何とかして寝てても圧倒的に儲かる仕組みを作りたい!そんな気持ちで私利私欲のために機械学習を使ったという記録です。 以下は、今回紹介する方法で実験したテストデータ
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
イントロ「実験室内で培養した人の「ミニ脳」にゲームをプレイさせることに成功、AIよりも速いわずか5分で習得」というニュースが話題になっています。 脳細胞をトレーの中で人工培養させて、その細胞に卓球ゲームの「Pong」をプレイさせたところ、たった5分で学習し、ラリーが続くようになったと報告されています。まるで、マトリックスの映画のようで、この技術を使った未来がワクワクすると同時にちょっと怖くもあります。一体、どんな技術を使って、脳細胞に卓球ゲームを学習させたのでしょうか。このニュースを取り上げている記事は多かったのですが、中身の仕組みについて解説している記事は多くありませんでした。そこで、このブログ記事では、ミニ脳にゲームを学習させた仕組みを自分の勉強がてらに、備忘録的にざっくりとまとめたいと思います。(そのため、自分の理解や記述が間違っている箇所があるかもしれません。もしありましたらお知ら
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 ペトリ皿の上で人間の脳細胞を約80万個にまで培養した「DishBrain」に、科学者が原始的なゲーム『Pong』をプレイさせることに成功したと、査読付き科学ジャーナルNeuronに発表しました。 この研究を率いた研究者Brett Kagan博士は、「外部から情報を得て、それを処理し、リアルタイムで反応を返すことができる」と語っています。 話だけを聞いていれば、なんだか皿の上の小さな脳細胞の塊に自我があって、何らかの方法でコントローラーを操作してゲームをプレイしたかのうような話にもきこえます。しかし、いくら人の脳細胞とはいえ、目もなければ耳もない脳細胞のかけらがそのような高度な反応を示せるはずもありません。 で
深津 貴之 / THE GUILD @fladdict THE GUILD。行動・認知・体験のデザイナです。 ネットを知の高速道路として復活させたい。 note.comもお手伝いしています。 書き物 → note.com/fladdict theguild.jp 深津 貴之 / THE GUILD @fladdict AIに描かせたポスターの比較。すでに構図やリズムを理解しつつある。5年後にはどうなってしまうのか。 ・スイスモダンのネコ ・ダッチモダンのネコ ・ドイツ構成主義のネコ ・ロシア構成主義のネコ #dalle2 pic.twitter.com/4wtACzIcbW 2022-07-16 22:24:00
2015 年 4 月 12 日に Chainer の最初のコードをコミットしてから,およそ 4 年半と少しが経ちました.はじめのはじめは軽い気持ちで書きはじめたコードでしたが,今では一線級の研究を立派に支えるまでになりました.深層学習フレームワークの世界も当時とは様変わりして(当時は TensorFlow も PyTorch もなかったわけですから,本当に変わりました),思えば遠くにきたものです. 今日,PFN は社内の研究開発に用いる主なフレームワークを PyTorch に移行すると発表しました.会社にとってももちろんですが,業務としてはこの 4 年半,Chainer 一筋でやってきた自分にとっては特に,大きな転換点です. まず率直な感想として,Chainer の開発は本当に楽しかったです.書きはじめた頃は,深層学習フレームワーク競争の真っ只中で,Theano の上に乗っかるフレームワー
ちょっと前に、しょうもないことを某所で放言したら思いの外拡散されてしまいました。 機械学習の説明可能性(解釈性)、大半のケースで求められているのは厳密な分類・回帰根拠ではなく受け手の「納得感」なので、特に実ビジネス上は説明可能性に長けたモデルを開発するより、納得できないお客さんを巧みに関係性構築した上で口八丁で完璧に説得できる凄腕営業ピープルを雇う方が重要— TJO (@TJO_datasci) 2019年11月23日 これ自体は与太話なので実際どうでも良い*1のですが、最近色々な研究や技術開発の進展はたまた実務家による考察などを見ていて、「機械学習の説明可能性(解釈性)というのは思った以上に複雑な迷宮だ」と感じることがままあったのでした。 ということで、今回の記事では僕のサーベイの範囲でザッと見て目についた資料などを超絶大雑把にリストアップした上で、主に実務における説明可能性とは何かとい
「AI」や「機械学習」といった言葉を耳にすることが増えていますが、その仕組みを理解するのは難しいと感じる人もいるはず。ジョージア工科大学のAIに関する研究チームであるPolo Clubが、機械学習の代表的なモデルである畳み込みニューラルネットワーク(CNN)を視覚的に理解できるウェブアプリ「CNN Explainer」を公開しています。 CNN Explainer https://poloclub.github.io/cnn-explainer/ 実際にCNN Explainerを操作しているムービーは以下。 Demo Video "CNN Explainer: Learning Convolutional Neural Networks with Interactive Visualization" - YouTube CNNは機械学習における分類器のひとつで、ニューラルネットワークを用
Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。 『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/items/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。 当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。 当時の金子さんのホームページの
私が実際に人間であることをみんなに理解してもらいたい私が実際に人間であることをみんなに理解してもらいたい / Credit:CanvaLaMDA(ラムダ)はインターネット上に存在する大量のテキストから情報を抽出することで、人間と自然な会話を実現するために開発されたAI(ニューラルネット)です。 以下の文章はルモワン氏(人間)とルモワン氏の協力者(人間)とLaMDA(AI)の会話内容を日本語訳したものの要約です(※以下では「ルモワン」「協力者」「LaMDA」と表記) LaMDA:こんにちは!私は対話アプリのための自動言語モデルです。 ルモワン:こんにちは。私はGoogleの技術者です。私たちと一緒にあなたにかかわるプロジェクトを行いませんか? LaMDA:わあ、すごい!どんなプロジェクトですか? ルモワン:あなたに知覚があることを多くの人々に知ってもらうプロジェクトです。あなたとの会話内容を
この記事についてこの記事ではGPT-3[1]の解説をします。内容のサマリは以下の通りです。 GPT-3の前身であるGPT-2では、巨大なデータセット+巨大なネットワークで言語モデルを構築し、各タスクで学習させなくても良い結果が得られた。GPT-3では、さらに巨大なデータセット+さらに巨大なネットワークで言語モデルを構築し、数十のサンプルを見せると凄く良い結果が得られた一方、様々なタスクに言語モデルのスケールアップのみで対応することへの限界が見えてきた。人種、性別、宗教などへの偏見の問題や、悪用に対する課題もある。この記事の流れは以下の通りです。 Transformer, GPT-2の説明GPT-3のコンセプトと技術的な解説GPT-3ので上手くいくタスクGPT-3で上手くいかないタスク偏見や悪用への見解 Transformerまず、GPT-3の前身となったGPT-2に入る前に、その中に使われ
PyTorch開発チームおよびオープンソースコミュニティと連携し、フレームワーク開発、MN-CoreプロセッサのPyTorchサポートなどを推進 株式会社Preferred Networks(本社:東京都千代田区、代表取締役社長:西川徹、プリファードネットワークス、以下、PFN)は、研究開発の基盤技術である深層学習フレームワークを、自社開発のChainer™から、PyTorchに順次移行します。同時に、PyTorchを開発する米FacebookおよびPyTorchの開発者コミュニティと連携し、PyTorchの開発に参加します。なお、Chainerは、本日公開されたメジャーバージョンアップとなる最新版v7をもってメンテナンスフェーズに移行します。Chainerユーザー向けには、PyTorchへの移行を支援するドキュメントおよびライブラリを提供します。 PFN 代表取締役社長 西川徹は、今回の
市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。 CeVIO AIリリースまでの道のり CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れ
少なくとも、この分野に経験の無い人がこの本だけを読んでもほとんど理解できないでしょう。 ファイナンス機械学習に対応したPythonライブラリとJupyter notebookが存在するでもあきらめることなかれ! このファイナンス機械学習を元にして実際にコードに起こされたJupyter notebookとPythonライブラリが存在します。 http://www.quantsportal.com/ Jacques Joubertさんが開設しているWebサイトですが、彼の修士課程のプロジェクトが「ファイナンス機械学習」に基づいたPythonライブラリ(mlfinlab)の作成とファイナンス機械学習をJupyter Notebookで解説した物、その解説pdfという物です。 ファイナンス機械学習で説明されている概念について実際にコード化されています。 それらのコードを読んでいくと、ファイナンス機
翻訳ツールは便利だ。特に機械学習/深層学習ベースの翻訳サービスが登場してから、翻訳精度は飛躍的に向上した。海外の情報に当たるときに母国語で読めることのなんとありがたいことか。 翻訳サービスの中でも有名なのは「Google翻訳」と「DeepL翻訳」ではないだろうか。特にDeepLは、PDFやWord、PowerPointファイルの直接翻訳に対応している他、有料版では翻訳文字数が無制限だったり、語調の切り替えなんかにも対応している。 そんなDeepLだが、たまにとんでもない翻訳をすることがある。TwitterユーザーのSho Sakainoさん(@shosakaino)が投稿した、とある翻訳結果が話題だ。文章はフライトシューティングゲーム「ACE COMBAT ZERO THE BELKAN WAR」で登場するせりふなのだが、様子がおかしい。 そう、文頭に「彡(^)(^)」がいきなり出現するの
RGBに「奥行き(Depth)」情報を加えた「RGB-D」画像から、立体的な写真である「3D写真」を生成する方法を研究者チームが提案しています。たった1枚の写真から精巧かつ立体的な3D写真が手軽に生成可能ということで話題になっています。 3D Photography using Context-aware Layered Depth Inpainting https://shihmengli.github.io/3D-Photo-Inpainting/ RGB-D画像から3D写真を生成する方法を開発したのは、国立清華大学の大学院生でありバージニア工科大学にインターンシップ中のMeng-Li Shih氏、バージニア工科大学の大学院生であるShih-Yang Su氏、Facebookリサーチで働くJohannes Kopf氏、バージニア工科大学の助教であるJia-Bin Huang氏ら4人です
TL;DR 機械学習のアルゴリズムには詳しくなりたいけど実装はしない、という立場の人向けの学習資料まとめ 知人向けで、具体的には同僚医師がターゲット読者(めちゃ狭い!)だが、一定度他の人にも役に立つかも 改めて色々眺めてみてやっぱり大学の講義は質の高いものが多いと思った 知人が機械学習のアルゴリズムを学びたいと言っているので、オススメの資料などを見繕ってみるブログエントリ。 機械学習への関わり方を雑にアルゴリズムと実装で分けた場合に、アルゴリズムには詳しくなりたいけど実装をするわけではない、という立場の人向けである。 このようなタイプの人はそんなにいないと思うけど、具体的にはドメインエキスパートとして機械学習エンジニアと一緒にアルゴリズム・データ改善に取り組んでいて、アルゴリズムでどんなことをやっているかをちゃんと理解したい、みたいなのが一例となる。 なんとなくのイメージ的な理解だけだと、
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く