このサービスの有償プランに申し込んで使って、少しプロンプトのコツが掴めたので、お伝えしたいと思います。 ただ、自分が使った目的は映画などの映像制作ではなく、あくまでも静止画、それも人物を動かすことなのでご注意を。より具体的には、11年前に他界した妻の動く姿を見ることです。 ■フィルムカメラの写真を動かすまずやってみたのは、実際に撮った写真をDream Machineで動かすことです。 使った写真は、1978年から1987年にかけてフィルムカメラで撮影したもの。子供が生まれてビデオカメラ(ビデオ8mm)を買ったのが1987年なので、それまでは動いている映像がほとんどなかったのです。 例外として、学園祭の劇で主役を演じたものと、特捜最前線でエキストラをやったときのものは残っていますが。 多くの人にとって、1980年代以前の、動きのある映像は残っていないと思います(8mmフィルム愛好家がいる家庭
数値や日付をさまざまな形式の文字列に! toLocaleString()を使ってスマートに変換しよう ウェブアプリケーションなどでは外部のAPIからデータを取得して表示することがあるでしょう。しかしながら、APIの値を必ずしもそのまま表示せず、ユーザーにとって分かりやすい文字列に加工することもあります。たとえば、数値をカンマ区切りにしたり、日付データを特定のフォーマットに変換したりといったことはみなさんも経験があるのではないでしょうか? そのような数字や日付を変換するのに便利なのが、JavaScriptのtoLocaleString()メソッドです。このメソッドを使うことで、数値や日付をさまざまな形式に変換できます。この記事では、toLocaleString()メソッドの使い方と、その応用例を紹介します。 サンプルを別ウインドウで開く コードを確認する toLocaleString()メソ
5月13日(現地時間)に米OpenAIが「GPT-4o」を発表したかと思えば、翌日のGoogle I/Oでは「Gemini 1.5 Pro」のアップデートと「Gemini 1.5 Flash」のリリースを発表するなど、AI業界がにわかに活気づいている。 その他生成AIでも画像、音楽、動画といった分野で次々に画期的な機能が実装され、多くの人がその恩恵に預かろうという直前まで来ている。 ただそれを横目に、AIの活用が十分になされていないのではないかと思われる分野が、「日本語入力」だ。OS標準の入力変換エンジン以外にも、Google日本語入力やATOKといった選択肢もあるが、AIの華々しい進化の恩恵にあずかっているようには思えない。「AIが自然な言葉で受け答え」も結構だが、まずは同音異義語の正しい選択や誤変換はどうにかならないのか。 まだ組み込まれるのはこれからだと思いたいが、AIが組み込まれた
こんにちはタキオンです。 アホみたいなタイトルをつけて1人でニヤついてます。 私が人に勝ってるものって何なのか? ふと考えたんです。 エロさじゃないな。 エロさはもしかすると並じゃないのか? 吉牛でも並しか頼まないし、きっとそのレベルだと思うんです。 なんだろうって考えました。 そして見つかりましたよ。 エロ変換能力。 話をエロに変換できる能力はトップクラスではないかとね。 コレは会社でも良く言われますから。 普通の話をしててもいつの間にかエロのワードになっていると。 最近は後輩もその話にすぐ乗っかるので 先輩や他の後輩から エロ兄弟と言われたりもしますからね。 もう本当に自然な流れでエロに切り替えれるんですよ。 ここまで来たらもう天才じゃないのかって少し思ってます。 もしかしてつく仕事間違えたかな?(笑) その手の業界の方!私を副業で雇ってみませんか? 本当にアホなんですよ。 事務所など
Exporters とは Hugging Faceが公開している Exporters というツールがある。 TransformersのモデルをCore MLにエクスポートするためのツールで、coremltoolsをラップしたものではあるが、変換に伴う色々な問題をツール側で吸収してくれている。要はこのツールを使えばcoremltoolsをそのまま使うよりも簡単にTransformersモデルをCore MLモデルに変換できる。 モチベーション Exporters は以下の公式ブログで紹介されていたもので、 Llama 2などのLLMモデルもこれを用いて変換されたようだ(あるいは、その変換の過程で得られた知見がこのツールに盛り込まれている) 公開されている変換済みモデルは、試してみたもののまだモバイル端末には大きすぎたので、 もっと小さいモデルを自前で変換したらよいかもしれない、と思い本ツール
「Twitter.com」という文字列を入力したはずなのに、Xにポストした瞬間、自動的にその文字列が「X.com」に変換されてしまう――トラブル続きのXで今度はそんな現象が発生し、詐欺に利用されかねないとして一部のユーザーが警戒を呼びかけた。問題は間もなく解消されたものの、Xの混乱ぶりにあきれる声や批判の声が飛び交っている。 米メディアのMashableやKrebs on Securityによると、自動変換はiOS向けのXで4月8日(米国時間)に始まった。この問題は「Twitter.com」が「X.com」に置き換わるだけにとどまらなかった。 例えば「space-twitter.com」というリンクをポストすると、末尾の「twitter.com」の部分の文字列だけが勝手に「x.com」に置き換えられて、Xの画面では「space-x.com」と表示される。一方で、実際のリンク先は変わらないま
Google アラートは便利だけど 情報収集をするのには Google アラートが便利。仕事や趣味に関係するキーワードをGoogleアラートに登録し、それをRSSフィードに出力することで、最新のニュースを見逃すことなく、リアルタイムで情報を取得することができる。 しかしながら、GoogleアラートのRSSフィードをSlackに表示させようとすると以下のような表示になって視認性が低くなってしまう。 Gooogleの転送URLを通るためSlackでカード展開されない ボールドタグが文字列として出力されている 本文が中途半端に出力される また同じようなニュースが重複することも多く、それもまたノイズになってしまう。 Google アラートのRSSフィードを変換するプロキシを作成 この課題に対応するため、以下のシーケンスでGoogleアラートの生成するRSSフィードを変換するサーバレス関数を作成し、
音声・テキスト・画像・音楽など複数の種類のデータを一度に処理できるマルチモーダルな大規模言語モデル(LLM)の「AnyGPT」が発表されました。 AnyGPT https://junzhan2000.github.io/AnyGPT.github.io/ 既存の大規模言語モデル(LLM)のアーキテクチャやトレーニングパラダイムを変更することなく、安定してトレーニングすることができるという新しいマルチモーダルLLMがAnyGPTです。AnyGPTはデータレベルの前処理のみに依存しており、新しい言語を組み込むのと同様に、新しいモダリティのLLMへのシームレスな統合を促進することが可能。マルチモーダルアライメントの事前トレーニング用に、マルチモーダルテキスト中心のデータセットを構築することで、生成モデルを利用して大規模な「Any-to-Any」(任意のデータ形式から任意のデータ形式に出力できる)
ページに挿入する画像の形式として「WebP」や「AVIF」を採用するウェブサイトが増えつつあります。しかし、画像ビューワや画像編集ソフトの中にはWebPやAVIFに対応していないものも多く、「ウェブページから画像をダウンロードしたものの、WebP形式の画像だったから編集ソフトやビューワで開けない」といった状況に遭遇した経験がある人も多いはず。ブラウザ向けの拡張機能「WebP / Avif image converter」を使えばWebPやAVIF形式の画像をJEGやPNGなどの扱いやすい形式に変換しつつダウンロード可能とのことなので、実際にインストールする手順や使い方を確かめてみました。 WebP / Avif image converter – 🦊 Firefox (ja) 向け拡張機能を入手 https://addons.mozilla.org/ja/firefox/addon/we
先日、Gmail、米国Yahoo!から相次いでメール送信者ガイドライン変更のアナウンスがありました。詳しい内容についてはこちらの記事に詳細がまとまっているのでご参照ください。 DMARCのレポート アナウンスを受けてSPF/DKIMの確認やDMARCの設定を始めた方も多いのではないでしょうか。そしてDMARCのレポートをいざ受け取ってみて、XML形式で読み取りにくいと思う方も多いのではないでしょうか。以下のXMLは実際に私のドメインで受け取ったDMARCレポートです。レコードは1つですが、これだけ長くなります。 <?xml version="1.0" encoding="UTF-8" ?> <feedback> <report_metadata> <org_name>google.com</org_name> <email>noreply-dmarc-support@google.com<
Global OTECは、2023年11月3日、オーストリアで開催された「International Vienna Energy and Climate Forum(IVECF)」で、同社が開発した次世代海洋温度差発電(OTEC:Ocean Thermal Energy Conversion)プラットフォーム「Dominique」の最新コンセプトについて公式プレゼンテーションを行った。 OTECとは、表層海水と深層海水の温度差を利用してクリーンで持続可能なエネルギーを生み出す再生可能エネルギー技術だ。太陽光で温められた暖かい表層海水を利用して沸点の低い液体を蒸発させて、タービンを回転させる蒸気を液体から発生させる。その後、深海からくみ上げた冷水で蒸気を冷却し液体に戻すことでサイクルを継続できる。こうして、海に蓄積された太陽熱エネルギーを電力に変換できる。 熱帯地方では、海面の温度は25℃か
Amazon Connect アドベントカレンダー 2023、1日目の記事です! クラスメソッドとギークフィードさん、スカイアーチHRソリューションズ さんの有志が募ってチャレンジしている企画になります。 (アドベントカレンダーのカレンダー一覧はこちら↓) はじめに Amazon Connect + GPT-4 Turbo JSONモードで、予約内容を復唱して確認後、顧客の色々な返答を正しくヒアリングできるか検証しました。 前回、Amazon Connect + GPT-4 Turbo JSONモードで、1回の発話から下記の5つの予約情報をヒアリングするチャットボットを構築しました。 名前 電話番号 予約日 予約時間 人数 予約情報をヒアリング後、Connect側で予約内容を復唱するところまでを前回行いました。 今回、予約内容を復唱後、顧客の返答をヒアリングするチャットボットを構築しました
株式会社ディー・エヌ・エー(本社:東京都渋谷区、代表取締役社長兼CEO:岡村信悟、以下DeNA)は、スマートフォンでリアルタイム音声変換を実現できる生成AI技術を独自に開発しました。高品質・低コストの技術であることから、幅広いシーンでの活用の可能性を見込んでおり、このたび協業先の募集を開始したこともお知らせします。 今回開発した技術について DeNAでは2019年から自分の声が別人の声になる音声変換技術の開発を進めてきました。2021年に公開した「VOICE AVATAR 七声ニーナ」(公開は終了)を皮切りに、社内事業での技術検証を経て、誰でも手軽にリアルタイム音声変換を実現できるAI技術を開発しました。これにより、従来利用が難しかった動作環境においても多くの方が音声変換AIを利用できるようになります。 リアルタイム音声変換AIは、音声を受け取るAIと変換音声を出力するAIのペアからなりま
はじめに ブラウザ上で画像を扱う際に、扱うオブジェクトが複数あり、その全体を把握・整理するためのドキュメントです。 何ができるようになる? ブラウザ上での画像変換用に扱うオブジェクトの概要 それぞれのオブジェクトの生成方法 画像形式の変換 jpeg→png / gif→png など 画像のリサイズ 本記事での対象としないこと PDFファイルの扱い ブラウザでの画像変換で扱うオブジェクト一覧 File https://developer.mozilla.org/ja/docs/Web/API/File ObjectURL https://developer.mozilla.org/ja/docs/Web/API/URL/createObjectURL DataURL https://developer.mozilla.org/ja/docs/Web/HTTP/Basics_of_HTTP/D
デジタルプロダクション「factory4」でアプリやさまざまなIoTプロジェクトのUIUXデザインを手がける新谷友樹さんが、UIやUXにまつわるトピックについて解説する本連載。今回は「Vectorizer.AI」についてです。 こんにちは!株式会社Cosmowayが組織するデジタルプロダクション「factory4」のUIUXデザイナー新谷です。 今回は以前、AIを活用したロゴ作成に関する記事で少し触れた「Vectorizer.AI」について深掘りしていきたいと思います。 この一年でプロンプトを打ち込むチャット型AIツール「ChatGTP」や、画像生成系のAIツール「Midjourney」「Stable Diffusion」などさまざまなAIサービスが登場しています。そのなかでも「Vectorizer.AI」は、ほかとは少し違う角度のAIサービスではないでしょうか。簡単に言ってしまえば、JP
AI技術を応用したソフトを開発するクリムゾンテクノロジーから、AIリアルタイムボイスチェンジャー「Voidol3」が2023年9月8日に登場しました。Voidol3はシンセサイジングによる超高速声質変換エンジンによるボイスチェンジャー「SYNTHモード」と、自身の声を特定のキャラクターの声に変換するAIリアルタイム声質変換が可能な「AIモード」を搭載し、さらにその両方を連結したリアルタイムの声質変換も可能だとのこと。まずはVoidol3のSYNTHモードによるボイスチェンジャーを試してみました。 Voidol3 | 変幻自在の声質変換 | クリムゾンテクノロジー株式会社 https://crimsontech.jp/apps/voidol3/ 今回Voidol3を使うにあたって、オーディオインターフェースとしてコンデンサーマイクのMPM-1000とヤマハ・AG-03をPCに接続して使用しま
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く