本文「チューニング」を検索 - はてなブックマーク

1 - 40 件 / 5880件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

チューニングの検索結果1 - 40 件 / 5880件

Meta、コード最適化のためのAIモデル「LLM Compiler」を商用ライセンスで公開
- 16 users
- www.itmedia.co.jp
- テクノロジー
- 2024/06/28
米Metaは6月27日︵現地時間︶、コード最適化のためのLLMモデル﹁Meta Large Language Model Compiler﹂︵以下﹁LLM Compiler﹂︶を発表した。特別な商用ライセンスの下でリリースしており、Hugging Faceでダウンロードできる。70億パラメータと130億パラメータの2サイズ構成だ。 LLM Compilerは、研究者や開発者がコードの最適化とコンパイラの最適化をさらに研究開発するための、スケーラブルで費用対効果の高い基盤を確立することを目指しているという。このモデルを利用することで、コードサイズを大幅に削減したり、プログラムの実行速度を向上させることができるとしている。従来のコード最適化手法は、手作業で設計された特徴やグラフニューラルネットワークに依存しており、プログラムの表現が不完全だが、LLM Compilerは﹁ソースプログラムを完
- AI
- あとで読む
これが本当のコスパですよ。AVIOTの全部入りイヤホン＆120時間使えるヘッドホンは、迷わず両方いけるレベル
- 4 users
- www.gizmodo.jp
- テクノロジー
- 2024/06/28
これが本当のコスパですよ。AVIOTの全部入りイヤホン＆120時間使えるヘッドホンは、迷わず両方いけるレベル2024.06.28 11:00Sponsored by AVIOT ヤマダユウス型気がついたら何年も愛用してる、そんな製品になりうる。ワイヤレスイヤホンやヘッドホンが当たり前化してきた昨今、皆さんはどんな基準でイヤホンorヘッドホンを選んでいますか？音質、デザイン、バッテリーなどなど、様々なニーズがあるでしょう。ここでコスパを挙げる人も少なくないと思いますが、このコスパって言葉に僕はちょっと言いたいことがある。そのコスパ、本当の意味で﹁コストとパフォーマンスの両立﹂ができているのかい…？まぁこれは色んな製品にも言えるテーマだとは思います。そんななか、日本発のオーディオブランドのAVIOT︵アビオット︶が手掛けるワイヤレスイヤホン﹁TE-W1﹂およびワイヤレスヘッドホン﹁W
Arduinoで航空無線が聴ける——Arduino Nanoで制御するエアバンド受信シールド「SCARP」｜fabcross
- 3 users
- fabcross.jp
- テクノロジー
- 2024/06/28
Arduino向けエアバンド（航空無線）受信シールド「SCARP」がKickstarterに登場し、人気を集めている。 SCARPは、Arduinoに実装したSDR（ソフトウェアラジオ）でエアバンドを受信するArduino向け無線シールドだ。周波数合わせやスケルチレベルの調整をしなくても、航空機と地上との交信を簡単に聞くことができる。RFボード、I/Oボード、Arduino Nano、LCDディスプレイ（170×320）をスタックできるよう、小型化したデザインとなっている。 RFボードにはヘッドホンジャックとオーディオアンプ、音量コントロールを、I/Oボードにはタクタイルスイッチを搭載する。電源とスピーカー、アンテナは、自分で用意する必要がある。航空無線のチャネル間隔は25kHzとナロー化された8.33kHzに対応し、1Hzレベルの分解能でチューニングが可能。受信のずれはオシレーターの調
NTTデータ、国産LLM「tsuzumi」を「Microsoft Azure」で提供
- 5 users
- japan.zdnet.com
- テクノロジー
- 2024/06/27
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます NTTデータは6月27日、NTTが開発する大規模言語モデル（LLM）「tsuzumi」を「Microsoft Azure」で11月以降に提供すると発表した。「Azure AI Studio」を利用してtsuzumiのチューニングやビジネスアプリケーション開発が可能になるとしている。 tsuzumiは、NTT研究所が40年以上にわたって蓄積した自然言語処理技術をベースに開発され、高性能ながらパラメーターサイズが6億～70億と海外のLLMより軽量な点が特徴。少ないリソースでチューニングが行え、企業や組織の業界、業務に特化型した生成AIとして利用することもできる。 tsuzumiの商用提供は3月に始まっているが、ユーザー側でtsuzumiを利
- 人工知能
- techfeed
- AI
LLM開発にもオープンソースの哲学を ―Red HatがIBMとともにInstructLabで挑むAI民主化へのアプローチ | gihyo.jp
- 3 users
- gihyo.jp
- テクノロジー
- 2024/06/27
LLM開発にもオープンソースの哲学を ―Red HatがIBMとともにInstructLabで挑むAI民主化へのアプローチここ最近、大手テクノロジベンダが開催するカンファレンスでは必ずと言っていいほどメインテーマに生成AIが掲げられています。5月6日～9日︵米国時間︶にかけて米デンバーで開催されたRed Hatの年次カンファレンス﹁Red Hat Summit 2024︵RHS 2024⁠︶⁠﹂も同様で、カンファレンス期間中に発表された10数本のリリースはすべて生成AIに関連した内容でした。また、Red Hatの親会社であるIBMが米ボストンで開催した﹁IBM Think 2024﹂︵⁠5/20～5/23︶も同様で、同社のアービンド・クリシュナ︵Arvind Krishna︶CEOは﹁企業が生成AIを活用し、大規模にビジネス価値を創出できるようにする﹂と基調講演で明言しています。両社
- article
「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました｜ELYZA, Inc.
- 69 users
- note.com/elyza
- テクノロジー
- 2024/06/26
本記事のサマリーELYZA は、﹁Llama-3-ELYZA-JP﹂シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で﹁GPT-4﹂を上回る性能を達成しました。各モデルは Meta 社の﹁Llama 3﹂シリーズをベースに日本語で追加学習を行なったものです。 ■﹁Llama-3-ELYZA-JP-70B﹂ 700億パラメータモデル。﹁GPT-4﹂を上回る日本語性能を達成。無料で利用可能なデモを用意しています。 ■﹁Llama-3-ELYZA-JP-8B﹂80億パラメータと軽量ながらも﹁GPT-3.5 Turbo﹂に匹敵する日本語性能を達成。モデルを商用利用可能な形で一般公開しました。使用したAPIのバージョンなど、より詳細な評価結果については本記事の後段
Google AI Studioを使ってみる
- 68 users
- techblog.gmo-ap.jp
- テクノロジー
- 2024/06/26
こんにちわ。 GMO NIKKOのT.Mです。 Google AI Studioとは Google AI Studioは、GoogleのAIモデルであるGeminiを使ってプロンプトの検証やモデルのチューニングなどが行える開発ツールです。Gemini APIのAPIキーの取得もできます。 Google AI Studioの始め方 Googleアカウントがあれば始められます。企業などでGoogle Workspaceを使っている場合は、「早期アクセスアプリ」を有効にする必要がありました。システム管理者に相談してみましょう。 Google AI Studioの起動 Google AI Studioの公式ページから「Google AI Studioにログイン」ボタンを押せば、画面が開きます。ログインするとGoogle AI Studioが開きます。クイックスタートクイックスタートのドキュ
- AI
- google
- あとで読む
- 人工知能
- api
RDBMSの基礎を学ぶーインデックス編
- 3 users
- zenn.dev/convers39
- テクノロジー
- 2024/06/26
エンジニア何年もやって、ちゃんとDB学んでいなかった悔しさがずっとあったので、この間は色々とコースなり、本なりを探って勉強した。 DBMSは非常に大きなトピックで自分もまだまだほんの少ししか触れていなかったが、この記事では、とりあえずはインデックスからスタートしてようと思う。（結構長くなってしまったので、TL;DRとして節ごとにまとめを置いています） DBMSのアーキテクチャー概要データベースによって実装が異なるが、一般的に含まれるDBMSの構成コンポーネントとして、次のように挙げられる[1]。 DBMSはサーバークライエントのモデルを使っている。クライエントはクエリーを構成してトランスポートのレイヤーを経てサーバー側に送られる。クエリーに対してサーバー側が解析や最適化して、適切な実行プランを出す。実行プランは実行エンジンに渡されて、ローカルとリモートの実行結果を集計する。リモートとい
新しいスタンダード？Elastic Serverlessの使い方や料金体系、特徴をまとめてみた - Taste of Tech Topics
- 20 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/06/25
こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。はじめに Elasticのマネージドサービスである Elasticsearch Service (Elastic Cloud) にサーバレスが登場しました。今回はその使い方や特徴などについて紹介し、どういったシーンでの利用に適しているのか考察してみました。 ※記事中の情報は執筆時点のものであり、今後変更となる可能性があります。利用する際は最新の情報をご確認ください。 Elastic Cloud Serverless とは？従来のElastic Cloudは、オンプレミスでElasticsearchを運用するのに比べ管理コストを大きく削減することができる点や、柔軟にス
- あとで読む
いま聴くべき「本当に“ヤバい”凄腕ギタリスト」邦楽編！技術、表現力、音楽性の広さ…森大翔＆崎山蒼志が紹介 | J-WAVE NEWS
- 6 users
- news.j-wave.co.jp
- エンタメ
- 2024/06/24
森大翔と崎山蒼志が、「本当に“ヤバい”凄腕日本人ギタリスト」を紹介した。 2人が登場したのは、J-WAVEで放送中の番組『SONAR MUSIC』（ナビゲーター：あっこゴリラ）。オンエアは6月20日（木）。【SONAR MUSICは番組公式LINEでも情報発信中】「新世代が幕開けていった」と感じるギタリストいまチェックしておきたい、凄腕の日本人ギタリストは誰なのだろうか？若手の実力派ギタリストである森大翔と崎山蒼志が、“40歳以下のギタリスト”に限定して語った。森：言葉では言い表せない感じなんですけど、初めて聴いたときの衝撃は本当に覚えていて。この曲だったんですけど、ギター1本で宇宙を作っているという（感じがする）。6、7年前から大好きでした。ちょうどギターのムーブメントがSNS中心になってきたときに突然現れたギタリストで、Ichikaさんの登場から新世代が幕開けていったんじ
- あとで読む
[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜
- 290 users
- zenn.dev/seya
- テクノロジー
- 2024/06/24
この記事は "What We’ve Learned From A Year of Building with LLMs" という記事を著者の一人である Eugene Yan さんから許可を得て翻訳したものです。 https://applied-llms.org/ Thank you for giving me a permission to translate this wonderful article! 著者の方々 Eugene Yan Bryan Bischof Charles Frye Hamel Husain Jason Liu Shreya Shankar 原文の公開日 2024/６/8 今は大規模言語モデル︵LLM︶を使った開発がとってもエキサイティングな時期です。この1年間で、LLMは実世界のアプリケーションに対して﹁十分に良い﹂ものになりました。そして、年々良くなり、安く
- LLM
- AI
- あとで読む
- 開発
- RAG
- GPT
- プロダクト
- ChatGPT
- programming
解像度とフォーマット対応状況の両方に配慮してWebP画像やAVIF画像を扱う
- 6 users
- zenn.dev/monicle
- テクノロジー
- 2024/06/24
こんにちは、Webサイト作ってますか？ Webサイトを作っていると、Lighthouseスコアを上げるために画像のサイズやフォーマットにも気を配りたくなりますよね。筆者は画像のフォーマットにはあまり頓着してこなかったので、「フラットな画像ならPNG」「込み入ったイラストはJPEG」「なんかWebPとかいうのもあるらしいけどよくわからん」くらいの解像度で適当に使っていました。しかし、最近の開発でLighthouseスコアのチューニングをしてみたところ、色々新しい知見が溜まったので、自分用の備忘録として残しておこうと思います。 3行まとめちゃんと複数の解像度の画像を用意しようね WebPやAVIFといった次世代フォーマットも使ってみようね <picture> と <source> は便利画像のサイズを複数用意する表示するディスプレイの解像度に合わせて、表示する画像の大きさを調整すること
- あとで読む
₲$₭ @__gsk__ エルデンリングのレラーナを﹁思考﹂のみで倒す女性。自分でチューニングした非侵襲型脳波読み取りデバイス(EEG)を使ってる。思考を操作にアサインするチューニングがものすごく大変らしいが、それを超えたら入力デバイスとして特定分野で優秀な可能性がある。もはや魔法。

● 3 users

● x.com

● アニメとゲーム

●2024/06/24
AWSアーキテクチャー図作成おすすめサイト - Qiita
- 3 users
- qiita.com/JK447
- テクノロジー
- 2024/06/22
AWSアーキテクチャー図作成おすすめ❕ AWSを利用したシステム構築の要件定義、基本設計、詳細設計 AWS︵Amazon Web Services︶を利用したシステム構築においては、要件定義、基本設計、詳細設計の各フェーズでさまざまな要素を考慮する必要があります。この記事では、コスト、信頼性、セキュリティ、運用自動化、パフォーマンスに重点を置きながら、それぞれのフェーズでの考慮事項について解説します。︻要件定義︼コスト予算設定: 初期投資および運用コストの予算を設定し、各サービスのコストを把握します。コスト最適化: 必要なリソースの選定を行い、予算内で最大のパフォーマンスを発揮するよう設計します。リザーブドインスタンスやスポットインスタンスの利用も検討します。信頼性可用性: サービスの可用性要件を定義し、冗長構成やフェイルオーバー機能を組み込む計画を立てます。バックアップ:
- システム
- AWS
- 資料
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
- 450 users
- wirelesswire.jp
- テクノロジー
- 2024/06/21
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているからだ。昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日本語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function
- LLM
- AI
- あとで読む
- 人工知能
- ChatGPT
- 生成AI
- 開発
- GPU
- IT
- 機械学習
賢い生成AIが出た時それを最大限活かすデータの準備は？　比戸将平氏・中山心太氏・中村龍矢氏が考えるLLMの“課題”
- 3 users
- logmi.jp
- テクノロジー
- 2024/06/20
生成AIによって作業は楽になるけれど、レビューは楽にならない田中邦裕氏︵以下、田中︶‥ここからは活用上の課題に入っていきたいと思うのですが、これは順番に当てても大丈夫ですかね。では、中山さんから紹介してもらえればと思います。お願いいたします。中山心太氏︵以下、中山︶‥そうですね。今の生成AIがこの後どうなっていくかというと、作業は楽になるけどレビューは楽にならない。先ほど契約書のレビューの話が出たので﹁うっ﹂て思っちゃったのですが、作業は楽になるけどレビューは楽にならないというのが、この後に起こっていくことかなと思っています。僕は、仕事は基本的に2種類に大別されると思っています。仕事は2種類あって、1つは作業です。これは手を動かして実際の成果物を作ることで、今の生成AIの支援を比較的受けやすいと思っています。一方でレビューは何かというと、人の成果物を評価して修正を指示すること、そし
無二のヘヴィ・リフを生み出した、悪魔の二本角。トニー・アイオミのSG | ギター・マガジンWEB｜Guitar magazine
- 3 users
- guitarmagazine.jp
- エンタメ
- 2024/06/20
1961年の登場以来、世界中で長きにわたり愛され続けているギブソンSG。その逸話や魅力を、ギタリストとの物語をとおしてお届けする“ロックの歴史を作り上げた、伝説のSG特集”。第4回は、ブラック・サバスのトニー・アイオミ。彼とギブソンSG＆SGタイプの物語をお届けしよう。文＝細川真平　Photo by Ian Dickson/Redferns 偶然手に入れることが出来た左利き用のSGスペシャルロックの楽曲において、リフの重要性は言うまでもない。リフこそがロックをロックたらしめていると言っても過言ではないほどだ。だからこそ、ロックの名曲と名リフは切っても切れない関係性があるが、ブラック・サバスの楽曲群は、レッド・ツェッペリンと並ぶほどに名リフの宝庫と言っていいだろう。リフ・メーカーとしてのジミー・ペイジとトニー・アイオミを大雑把に比較すると、ペイジのリフには躍動感があり、アイオミのリフ
TensorRTとTriton Inference Serverで推論サーバの性能を劇的に改善し本番導入した話 - LayerX エンジニアブログ
- 3 users
- tech.layerx.co.jp
- テクノロジー
- 2024/06/20
機械学習エンジニアの吉田です。前回は NVIDIA Triton Inference Server の性能を検証した話を書きましたが今回はその続編となります。 tech.layerx.co.jp 前回の記事以降も継続してTriton Inference Serverの検証を重ねた結果、推論サーバの性能を大幅に改善することができ、無事本番に導入することができました。この記事では本番導入までにどのような改善や検証を行ったのか書きたいと思います。はじめに背景バクラクでは請求書OCRなどの機械学習モデルを開発しており、リアルタイムで推論結果を返す必要があります。推論APIはNginx、Gunicorn w/ Uvicorn、FastAPIで実装され、PyTorchモデルをGPUで推論、SageMaker Endpointでサービングしており、リリース以降問題なく稼働してきましたが、お客
Go界隈で巻き起こった go:linkname 騒動について - ANDPAD Tech Blog
- 171 users
- tech.andpad.co.jp
- テクノロジー
- 2024/06/20
お久しぶりです、ANDPADボードの tomtwinkle です。この記事はGoの go:linkname 騒動は 6/18に行われた Go Bash で話した内容を要約したものです。そもそも go:linkname とは何かといえば internal packageやprivate var/funcなど普通はアクセスできないオブジェクトシンボルをエイリアス出来るようCompilerに指示して、アクセス可能にするcompiler directiveです。 go:linkname はprivateな変数へアクセス可能な便利なものでしたが unsafe packageのimportを必須とする通り、せっかく互換性や安全を考慮して作られているGoプログラムを簡単に破壊できる諸刃の剣でした。詳細は発表スライドを見てください。 go:linkname 禁止騒動 Go 1.23 のリリースまで2
- golang
- go
- あとで読む
- 言語
- library
- history
- プログラミング
大規模サービスのローンチに向け、パフォーマンスチューニングした話 #go #aws
- 59 users
- developers.cyberagent.co.jp
- テクノロジー
- 2024/06/20
背景こんにちは！Hanoi Dev Centerでバックエンドエンジニアをしているminhquangです。この記事では、私がAI事業本部のある新規プロダクト開発に参画した際に経験したパフォーマンスチューニングについて話したいと思います。皆さんはサービスのローンチ(サービスを世の中に初めて出すリリース)をやったことがありますか。サービスローンチするときに、リクエストのスパイクや、ユーザー数の増加によるサーバー負荷増加など、様々な未知な課題が存在します。私のチームでは数百万人の利用が見込まれるサービスにおいて、18000RPSを実現するべく負荷試験とパフォーマンスチューニングを実施しました。本記事では、上記のサービス要件を満たすために私たちが取り組んだ負荷試験やパフォーマンスチューニングについて説明しつつ、これらの経験から得られた学びを共有したいと思います。前提技術スタックサーバ
- performance
- あとで読む
- api
- aws
- サービス
- 開発
【図解】Next.jsで理解するSSRとクライアントルーティングの通信の仕組み
- 54 users
- zenn.dev/manalink_dev
- テクノロジー
- 2024/06/19
「Next.jsで理解するSSRとクライアントルーティングの違い」という名目で社内にて簡単に勉強会を行いました。本記事は、その内容を適宜編集して公開するものです。 TL;DR 以下の要約を読んで、「なんだその話か」って思った方は引き返していただいて大丈夫です。逆に「えっそうなの・・・？」と思った方は、ぜひ読んでください！ Next.jsアプリケーションにおいて、/hogeと/fugaというページがあり、それぞれgetServerSideProps()が定義されているとします最初ブラウザで/hogeを開いたとき、Next.jsアプリケーションはブラウザから/hogeへのGETリクエストを受け取り、getServerSideProps()を実行します次に/hogeから/fugaへrouter.pushで遷移すると、Next.jsアプリケーションはブラウザから/fugaへのGETリクエストを
- Next.js
- あとで読む
- SSR
- サーバ
- Web制作
- development
- javascript
LLMの価値を享受できないのは「全従業員向け」だから　95パーセントがニッチ業務だからこそ必要なチューニング
- 3 users
- logmi.jp
- テクノロジー
- 2024/06/19
ニッチなものに短期間でいいアルゴリズムが提供できるところに大きな価値がある田中邦裕氏︵以下、田中︶‥では、中村さんからお願いしてよいでしょうか？中村龍矢氏︵以下、中村︶‥はい。私は今LayerXでAI・LLM事業の責任者をしていて、そこでのいろいろな気づきをお話しできればと思っています。︵スライドを示して︶先ほどのところてんさんの話にもかなり絡むのですが、私たちがLLMに関して思っているところとしては、DXにおける標準化みたいな話を一部変えているところかなと思っています。先ほど﹁プログラムができること﹂という話がありましたが、まさに近い話で、従来のプログラムでやるためには、大雑把に言えば業務の方法をプログラミングできるレベルまで標準化しないと難しかったかなというところです。一方LLMだと、標準化が必要なこと自体は変わらないのですが、その必要な度合いが思いっきり緩和されて、LLMに
シェイングウ、 AI 研究者としての現在地｜Gemini - Google の AI
- 8 users
- note.com/google_gemini
- テクノロジー
- 2024/06/19
*本 note は、Google がシェイングウにインタビューした内容を編集して掲載しています。こんにちは。Google のAI﹁Gemini︵ジェミニ︶﹂の公式 note 編集部です。今回は日本のみなさんに、Google のAIについてより理解を深めていただくために、Google DeepMind で Gemini モデルの日本語対応にも深く関わっている、Google 社員のシェイングウのインタビューを3回にわたりお届けします。シェインは、幼少期を日本で過ごし、カナダ、イギリス、ドイツ、アメリカで研究を重ねてきました。彼の研究テーマはディープラーニング、生成AI、強化学習など多岐にわたり、手掛けた論文は業界に多大な影響を与えています。 Google が目指すのは、あらゆる場所で、あらゆる人にとって、AIが役に立てる世界です。そのためにもAI開発の各段階で、潜在的
Gemini について全部解説！使い方やモデル、プランまで｜Gemini - Google の AI
- 39 users
- note.com/google_gemini
- テクノロジー
- 2024/06/19
こんにちは、Google のAI﹁Gemini︵ジェミニ︶﹂の公式 note 編集部です。この記事ではGoogle のAI、Gemini に対するみなさんの疑問に答えていきたいと思っています！ "Gemini" という名称でAIモデルやサービスが複数あるけど、違いは何？有料版 / 無料版はどう選べばよい？アプリはあるの？などなど。誰でもすぐに使える会話インターフェースの Gemini︵gemini.google.com︶の紹介を中心に、企業や開発者向けサービスの展開、すべての基盤となる Gemini モデルの話まで全体像を解説します。この記事を通じて、Google のAI﹁Gemini﹂をもっと知って、みなさんの役に立てていただけるようまとめました。 ※この記事は随時更新します︵最終更新 2024 年6月19日︶。 Google のAI、Gemini︵ジェミニ︶
- Gemini
- AI
- Google
- あとで読む
セキュリティ研修〜マネジメントパート〜（サイバーエージェント新卒研修2024）
- 4 users
- speakerdeck.com/cyberagentdevelopers
- テクノロジー
- 2024/06/19
スマートフォンGPUの特性を解析！社内で実施予定のGPUパフォーマンスチューニング研修を紹介します！
- Security
身近なBtoCサービスを支えるアーキテクチャ大解剖　技術選定のポイントと今後の展望 - Findy Tools
- 155 users
- findy-tools.io
- テクノロジー
- 2024/06/19
公開日 2024/06/18更新日 2024/06/18身近なBtoCサービスを支えるアーキテクチャ大解剖　技術選定のポイントと今後の展望多くのIT企業では、ユーザーに対してより高品質で安定した体験を提供するために、システムアーキテクチャを進化させ続けています。本特集では、日常生活の中で多くのユーザーに利用されているサービスのアーキテクチャ設計に携わるエンジニアの方々から、技術選定の背景や意図、そして現在のアーキテクチャの課題から未来への展望まで、詳しく伺いました。この記事を通じて、各企業のエンジニアたちがどのように技術的な課題を克服し、システムの柔軟性と効率を高めているのか、知見を得ていただければ幸いです。 ※ご紹介は企業名のアルファベット順となっておりますアソビュー株式会社アソビュー株式会社では「遊び」という領域に対し、マーケットプレイス型EC「アソビュー！」やD2C型SaaS
分散トレーシングを使ってパフォーマンス改善をやってみたら、レスポンスタイムを2割近く改善できたお話 - Tabelog Tech Blog
- 41 users
- tech-blog.tabelog.com
- テクノロジー
- 2024/06/18
目次目次はじめにそもそもシステム運用改善チームとは何か？なぜアプリAPIのパフォーマンス改善が必要になったのか？どうやって改善箇所を見つけるのか？分散トレーシングを使って、店舗詳細APIを細かく分析する計測結果の見方計測結果から分かったこと計測結果から見つけたポイントに改善を実施していくコースに紐づくクーポンの取得口コミを取得する処理と公開画像数のカウントユーザーごとの公開口コミ投稿数の合計数カウント全体での改善効果はどうだったか？パフォーマンス改善の影響ユーザー体験が向上した今後の食べログ成長に備えたシステム上の余裕ができた食べログの分散トレーシングを使って改善を実施してみてよかったことおわりにはじめにこんにちは。食べログ開発本部ウェブ開発1部システム運用改善チームの @4palace です。今回は、私の所属するシステム運用改善チームが食べロ
- performance
- あとで読む
SB Intuitions、独自の日本語LLMを構築アカデミアや産業界の研究開発に資するために70億、130億、650億パラメータの日本語LLMを公開 | プレスリリース | SB Intuitions株式会社
- 3 users
- www.sbintuitions.co.jp
- テクノロジー
- 2024/06/17
SB Intuitions、独自の日本語LLMを構築アカデミアや産業界の研究開発に資するために70億、130億、650億パラメータの日本語LLMを公開 2024年6月14日 SB Intuitions株式会社 SB Intuitions株式会社︵本社‥東京都港区、代表取締役社長兼 CEO 丹波廣寅、以下﹁SB Intuitions﹂︶は、この度70億、130億、650億パラメータの日本語大規模言語モデル︵Large Language Model:LLM︶を公開しましたのでお知らせします。なお、SB Intuitionsは2024年度中に3,900億パラメータのLLM構築を目指しています。公開モデル Sarashina1-7B Sarashina2-7B Sarashina1-13B Sarashina2-13B Sarashina1-65B Sarashina2は、Sarashin
AWS、生成AI人材の育成に向けた新たな認定資格を発表
- 3 users
- ascii.jp
- テクノロジー
- 2024/06/17
アマゾンウェブサービスジャパンは、2024年6月14日、AI人材育成に関する記者説明会を開催した。 AWSでは、生成AIの活用拡大に向け、データセンターや各種クラウドサービスの強化に注力しており、人材育成においても同様だ。今回、生成AIに特化した新しい﹁クラスルームトレーニング﹂と﹁AWS認定資格﹂が発表された。アマゾンウェブサービスジャパンの執行役員サービス & テクノロジー統括本部統括本部長である安田俊彦氏は、﹁人材こそがデジタル競争力の根幹であり、技術への投資と同じくらい重要。個人エンジニアから企業の営業担当まで、様々な人が最新テクノロジーを使いこなし、新たな価値を生み出すことを応援している﹂と説明する。新しい生成AIに特化したクラスルームトレーニング・AWS認定資格 AWSはかねてより、デジタル人材の育成支援を展開してきた。日本では、2017年からの約7年半で延
近似近傍探索のチューニングで気をつけること
- 3 users
- zenn.dev/dmmdata
- テクノロジー
- 2024/06/16
本記事ではFaissやScaNNといったライブラリに実装されているIVF-PQ系の近似近傍探索手法のパラメータチューニングの際に気をつける点を紹介します。pythonのプログラム上で動かすことを想定していて、vertex AI vector searchのようなAPIで行うものは対象外です。ただ、OpenSearchではfaissを近似近傍探索として選ぶことができるため、チューニングの参考になるかもしれません。はじめに: ANN-Benchmarksの罠 ANNの性能とパフォーマンスの参考になるサイトとして、ANN-Benchmarksというサイトがあります。このサイトでは各近似近傍探索のパフォーマンスが様々なベンチマークにより比較されており、近年ではFaissに実装されているFastScanやTensorFlow recommendersから使えるScaNNといった、高速化されたIVF
- performance
- search
みかラジ！ライブ　〜チューニングしながらだいたい１９時までまったりトーク〜 - 水景の雑記帳
- 3 users
- mikagez-diarynotez.com
- エンタメ
- 2024/06/16
本日、17:15より、 stand.fmでライブ配信予定です。もし、よかったら、ぜひお気軽にお越しくださいね〜サイドバーの﹁みかラジ！﹂のところから、ページジャンプ→みかラジ放送リストまたは、以下のURLからどうぞ！ https://stand.fm/lives/666e9f42929cabe9c1519952 アカウントを作らなくても、視聴は可能ですので！ご機嫌斜めなハープちゃん、今日は、頼むよ！
【資料公開】AthenaとStep Functionsで簡単ETLオーケストレーション #midosuji_tech | DevelopersIO
- 3 users
- dev.classmethod.jp
- テクノロジー
- 2024/06/15
Amazon AthenaとAWS Step Functionsで作る簡単なETLの仕組みのメリットと、さらに必要とされる要件に対してなにが求められるのかについて発表しました。データアナリティクス事業本部インテグレーション部機械学習チームの鈴木です。 2024年6月12日にクラスメソッドの大阪オフィスで開催された勉強会Midosuji Tech #1で『AthenaとStep Functionsで簡単ETLオーケストレーション』というタイトルで話しましたので資料を公開します。当日は淀屋橋の大阪オフィスでオンサイトでイベントが開催されました。発表後にはワイワイガヤガヤタイムということで、参加者の方も交えたディスカッションが大変盛り上がりました。発表資料ポイント Step FunctionsのAPI統合で、S3バケットに配置したSQLファイルをステートマシンから読み込み、Athen
- aws
【研究のススメかた】避けるべき論文の見分け方｜Dr. MM
- 3 users
- note.com/mmatsunaga
- テクノロジー
- 2024/06/14
1. 記事の狙いと想定読者層研究を進めるうえでのTIPSをまとめていくシリーズです。大学や大学院等における研究活動に関して、お読みいただいている皆さまになにかしら示唆をご提供できればという思いで書いています。読者層としては、大学院等の研究機関で研究活動に取り組む方々を想定しています。今回テーマとして取り上げるのは、「避けるべき論文」、すなわちハゲタカジャーナルに掲載されている論文の見分け方。 2. 「避けるべき論文」とは？なぜ避ける必要があるのか？このテーマで記事を書こうと思った背景がいくつかありまして、最大の要因はいわゆるハゲタカジャーナル（英語だと、Predatory Journal。ハゲタカだからってVulture journalとは言いません）の氾濫猖獗。以前、別記事「先行研究レビューの実作業のやりかた」でも触れましたが、世の中には一見学術誌の体裁をとりつつ、じつは粗悪な著作物で
- search
AIがゲーム攻略情報でプレイをお助け？ PCのチューニングまで面倒を見てくれる「Project G-Assist」は何ができるのか
- 10 users
- www.4gamer.net
- テクノロジー
- 2024/06/14
AIがゲーム攻略情報でプレイをお助け？PCのチューニングまで面倒を見てくれる﹁Project G-Assist﹂は何ができるのかライター‥西川善司 COMPUTEX 2024の開幕直前である6月1日，NVIDIAは，CEOであるJensen Huang︵ジェンスン・フアン︶氏による基調講演を行った。その内容は，エンタープライズ向けGPUサーバーやGPGPU関連製品が中心で，民生向け製品に関連する発表や言及は非常に少なかった。では，COMPUTEX 2024において，NVIDIAのブース展示がエンタープライズ関連，GPGPU関連ばかりだったかというとそうでもない。本稿では，ゲームファン向けの新技術﹁Project G-Assist﹂︵以下，G-Assist︶を実際に体験してみた様子をレポートしたい。 G-Assistのデモコーナー。右の人物は，今回のデモを担当したGuillermo S
- AI
- game
- ゲーム
- あとで読む
ElasticsearchによるLearning To Rank(LTR)入門 - Qiita
- 5 users
- qiita.com/daixque
- テクノロジー
- 2024/06/13
はじめに Elasticsearchではv8.12からLearning To Rankという機能が実装されました。これまでにもコミュニティープラグインでは同様のことが実現できていましたが、今回Elasticが公式にサポートしましたので概要について紹介したいと思います。検索の良し悪しは主に以下の観点で評価できます。適合率 / Precision : どれだけノイズが少ないか再現率 / Recall : どれだけもれなく検索できているか Learning To Rank（LTR）はこのうち適合率 / Precisionを、事前に用意したデータを学習することによって向上させるための仕組みです。この機能はElasticsearchの外部で機械学習によって作成したモデルを使って実現します。流れとしてはData Frame Analyticsやベクトル検索で実現しているのと同様、Pythonで
- Python
- search
サイバーエージェント、日本語に強い“視覚言語モデル”公開　パラメータ75億、商用利用もOK
- 21 users
- www.itmedia.co.jp
- テクノロジー
- 2024/06/13
サイバーエージェントは6月13日、75億パラメータの日本語大規模視覚言語モデル（Vision Language Model、VLM）を一般公開した。Hugging Faceで商用利用可能なAIモデルや、研究用途でのみ使えるデモを公開中だ。 VLMとは、画像とテキストを複合して扱えるマルチモーダルなAIモデル。画像とテキストを理解できることで「この写真に写っているものは何ですか？」のような質問にも対応できる。米OpenAIの「GPT-4o」などが代表的なモデルで、近年では画像を扱えるAIモデルの進化が急速に進んでいる。一方で「VLMのほとんどは英語のデータを中心に学習しており、日本文化の理解や日本語での会話に強いVLMは少ない状況」とサイバーエージェントは説明する。このような背景から同社は日本語に強いVLMを公開。日本語大規模言語モデルで合成して作ったデータセットをメインに学習させたという
- AI
- あとで読む
- 日本語
- 画像
独自の日本語LLM「CyberAgentLM2」に視覚を付与したVLM（大規模視覚言語モデル）を一般公開 ―商用利用可能な画像チャットモデルを提供―
- 21 users
- www.cyberagent.co.jp
- テクノロジー
- 2024/06/13
株式会社サイバーエージェント（本社：東京都渋谷区、代表取締役：藤田晋、東証プライム市場：証券コード4751）は、75億パラメータの日本語VLM（Vision Language Model、大規模視覚言語モデル）を公開したことをお知らせいたします。近年、OpenAI社が開発した「GPT-4o」※1 を始めとした画像も扱えるLLMが急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。当社においてもデジタル広告におけるクリエイティブ制作において、2023年5月に画像を考慮した「広告コピー自動生成機能」を実装するなど、画像とテキストの複合領域での研究開発および活用に取り組んでおります。一方、既存の公開されているVLMのほとんどは英語を中心に学習されているため、日本文化の理解や日本語での会話に強いVLMは少ない状況です。こうした背景のもと、当社は日本語VLMの開
- 人工知能
- あとで読む
PKSHA製基盤モデルの特徴とは？　「Transformer」ではなく「RetNet」だから実現できた“3つの強み”
- 5 users
- www.itmedia.co.jp
- テクノロジー
- 2024/06/12
PKSHA製基盤モデルの特徴とは？　「Transformer」ではなく「RetNet」だから実現できた“3つの強み” 生成AIブームの今、注目のキーワードが「基盤モデル」だ。大量のデータを事前学習したAIモデルのことで、少しのチューニングを施せば、さまざまなタスクに対応できる。米OpenAIの「GPT-4」といった生成AIも包含する概念だ。さまざまな企業が生成AIを使った業務効率化を試行錯誤する中、各AIベンダーたちの間では基盤モデルの開発競争が激化している。そこでこの特集では、基盤モデルを開発するAIベンダーに一問一答メールインタビューを実施。開発状況や独自の強みなどを探っていく。今回は、日本マイクロソフトの技術支援の元で、独自の基盤モデルを開発する、AIベンチャー・PKSHA Technology（東京都文京区）に話を聞いた。 PKSHA Technologyの基盤モデルの特徴や強
BigQuery アンチパターンレコメンデーションツールで、パフォーマンスの悪い SQL を使っていないか確認してみる。 | DevelopersIO
- 9 users
- dev.classmethod.jp
- テクノロジー
- 2024/06/12
BigQuery アンチパターンレコメンデーションツールで、パフォーマンスの悪い SQL を使っていないか確認してみる。こんにちは、みかみです。本州も梅雨入りの季節になってまいりましたが、沖縄はそろそろ梅雨明けです！やりたいこと BigQuery で実行している SQL のパフォーマンスチューニングをしたい BigQuery のアンチパターン SQL を使っていないか確認したいどんな DWH を使うにしろ、SQL チューニングは避けて通れない道ではないかと思います。実行計画確認して、データ処理エンジンの思想に思いを馳せて・・・。というのも、特に顕著な改善効果が得られた時にはこの上ない喜びを感じられる作業ですが、SQL が複雑だったり、大量の SQL を確認しないといけない場合は、心折れそうになる場合もあります。 BigQuery でも、クエリプランを確認しながら SQL をチュ
OpenAIの投資計画はアポロ計画の70倍？加速し膨張するAI開発投資、バブルの懸念も：朝日新聞GLOBE＋
- 7 users
- globe.asahi.com
- テクノロジー
- 2024/06/12
AI開発企業が抱えるもうひとつの課題は、AI開発投資が極端なまでに大規模化しつつあることだ。OpenAIやマイクロソフトのようなAI開発企業は、今後数年の間に、AI関連の開発投資を「1000億ドル（約15兆6000億円）」あるいは「7兆ドル（約1092兆円）」と極端な規模へと拡大する野望を抱いている。現状のAIの100倍、あるいはそれ以上の規模のAIを作り出すためだ。大規模投資計画は現状の100倍以上 2024年2月、AI開発企業OpenAIのCEOであるサム・アルトマンが、AI向け半導体の増産とAIデータセンター増強のために実に5兆〜7兆ドル（780兆〜1092兆円相当）の資金を集めていると経済紙ウォールストリート・ジャーナルが報じた。アラブ首長国連邦（UAE）政府、ソフトバンクの孫正義CEO、台湾の半導体メーカーTSMCと話し合いをしているという。この7兆ドルという数字は誇大妄想と
- 人工知能
- ai