MLOpsの人気記事 482件 - はてなブックマーク

1 - 40 件 / 482件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

MLOpsの検索結果1 - 40 件 / 482件

MLOpsに関するエントリは482件あります。機械学習、学習、 AI などが関連タグです。人気エントリには﹃機械学習システムの設計パターンを公開します。﹄などがあります。

機械学習システムの設計パターンを公開します。
- 583 users
- engineering.mercari.com
- テクノロジー
- 2020/04/23
メルカリで写真検索とEdge AIチームに所属している澁井︵しぶい︶です。機械学習のモデルを本番サービスに組み込むための設計やワークフローをパターンにして公開しました。 GithubでOSSとして公開しているので、興味ある方はぜひご笑覧ください！PRやIssueも受け付けています。私の作ったパターン以外にも、有用なパターンやアンチパターンがあれば共有してみてください！ GitHub‥https://github.com/mercari/ml-system-design-pattern GitHub Pages‥https://mercari.github.io/ml-system-design-pattern/README_ja.html なぜ機械学習システムのデザインパターンが必要なのか機械学習モデルが価値を発揮するためには本番サービスや社内システムで利用される必要があります。そのた
- 機械学習
- あとで読む
- 設計
- mercari
- 開発
- machinelearning
- 学習
- kubernetes
- システム
- mlops
2019年のDevOps/MLOpsエンジニアの標準的スキルセット - Qiita
- 378 users
- qiita.com/poly_soft
- テクノロジー
- 2019/08/21
ちなみに、IT業界全体のシェアとしてはMicrosoftのAzureの方がGCPを上回っていますが、Web業界においてIaaSにAzureを採用している企業さんは2019年時点ではまだまだ少ないので、現状ではとりあえずAzureへのキャッチアップは後回しにしておいて問題ないと思われます。クラウドアーキテクチャ設計前述したAWSやGCPの各種マネージドサービスを適切に組み合わせてアーキテクチャ設計を行い、それを構成図に落とし込める能力は必須となります。いわゆる「アーキテクト」という職種の担当領域でもありますが、「サービスを安定稼働させたまま、バリューをユーザに迅速に届ける」ためには、自動化のしづらい構成が採用されてしまったり、無駄な機能が開発されてしまったり、アンマネージドなツールやサービスが使用されて管理工数が肥大化したりしないように、アーキテクチャ設計の段階からDevOpsエンジニ
- devops
- あとで読む
- エンジニア
- cloud
- 学習
- gcp
- aws
- kubernetes
- サービス
- ツール
大規模言語モデルで変わるMLシステム開発
- 338 users
- speakerdeck.com/hirosatogamo
- テクノロジー
- 2023/03/26
GPTはじめ大規模言語モデルの登場により、MLシステム開発にもパラダイムシフトが起こっています。流れが速すぎてやや混沌としてきたので、プロンプトエンジニアリングの考え方をはじめとした新しい概念について有用な引用と共に交通整理をしてみました。今から始めたい人はまずこれを読むと、どんな点に配慮すべきかがざっくり分かるかと思います。
- ChatGPT
- あとで読む
- AI
- 機械学習
- LLM
- 自然言語処理
- GPT
- ML
- microsoft
- nlp
機械学習システム開発と運用の落とし穴
- 229 users
- speakerdeck.com/asei
- テクノロジー
- 2022/12/14
クローズドで行われた勉強会の資料です、画像認識まわりでありがちなハマりどころについて解説しています
- 機械学習
- あとで読む
- MLOps
- 開発
- 運用
- 学習
- AI
- ML
- 勉強

データ基盤チーム0人で運用は回るのか？！前人未踏チャレンジ・クックパッドデータ基盤のすべて2020 - クックパッド開発者ブログ
- 220 users
- techlife.cookpad.com
- テクノロジー
- 2020/12/29
技術部データ基盤グループの青木です。ここ1、2年はなぜか成り行きでBFFをでっちあげたり、成り行きでiOSアプリリニューアルのPMをしたりしていたのであまりデータ基盤の仕事をしていなかったのですが、今年は久しぶりに本業に戻れたのでその話をします。突然の1人チーム、そして0人へ…… 今年のデータ基盤チームは消滅の危機から始まりました。間違いなく去年末は5人のチームだったと思うのですが、メンバーがイギリスへグローバルのデータ基盤チームを作りに行ったり、山へ検索システムを直しに行ったり、川へレシピ事業の分析業務をやりに行ったり、海へ広告のエンジニアリングをしに行ったりするのをホイホイと気前よく全部聞いていたら、なんと4月から1人だけのチームになってしまいました。事はそれで終わりません。恐ろしいことに10月にはわたし自身も育休に入ることになったので、 10月はデータ基盤が0
さよならFlask ようこそFastAPI / goodbye Flask, welcome FastAPI
- 216 users
- speakerdeck.com/amaotone
- テクノロジー
- 2021/01/28
DeNA社内の技術共有会でFastAPIの便利さについて語った資料です。 ▼ 要点・機械学習の推論API立てる用途ならFastAPIが便利・型定義で開発UXばっちり・ドキュメント自動生成でつなぎこみも円滑 ▼ ソースコード https://github.com/amaotone/fastapi-example
- python
- flask
- FastAPI
- api
- あとで読む
- DeNA
- slide
- 資料
- 学習
GCPで構築する、これからの変化に対応出来るデータ分析基盤の作り方
- 199 users
- speakerdeck.com/rtechkouhou
- テクノロジー
- 2021/03/04
2020/3/31 Google Cloud Data Platform Dayでの、山田、佐伯、白鳥の講演資料になります
- GCP
- あとで読む
- BigQuery
- データ分析
- Kubernetes
- データ
- cloud
- DB
- クラウド
AWSとGCP間でVPNを設定する方法 - Gunosy Tech Blog
- 193 users
- tech.gunosy.io
- テクノロジー
- 2019/11/29
はじめに AWSのネットワーク構成 GCPのネットワーク構成 AWS と GCP 間での通信 VPN設定手順 TGWを用いたルーティングの設定 (AWS) Shared VPC の設定 (GCP) Terraform まとめはじめにこんにちは。DR & MLOps Group というところで働いている阿部といいます。Data Reliability & Machine Learning Operations の略で、データ基盤やML基盤を作って運用するグループです。私はもともとは記事配信ロジックやデータ分析をやっているグループにいましたが、今年移ってきました。こちらが紹介記事です: DREの使命とは？「数が神より正しい」と言うための正確性を求められる技術力 – Gunosiru 弊社のシステムは基本的にはAWSで動いていますが、とあるプロジェクトでGCPを使うことになりました。そ
- aws
- GCP
- VPN
- あとで読む
- network
- cloud
- ネットワーク
- DevOps
- Google Cloud Platform
- gunosy
機械学習なdockerfileを書くときに気をつけとくと良いこと - nykergoto’s blog
- 192 users
- nykergoto.hatenablog.jp
- テクノロジー
- 2020/07/25
みなさん機械学習系の環境構築はどうやってますか?僕は最近は Docker を使った管理を行っています。特に師匠も居なかったので、ぐぐったり人のイメージを見たり手探りで docker をつかいつかいしている中で、最初からやっとけばよかったなーということがいくつかあるのでメモとして残しておきます。大きく2つです。キャッシュは消すテストを書くキャッシュは消すライブラリをいろいろと install すると大抵の場合ダウンロードしたファイルを保存されている場合が多いです。何かのタイミングで再びそのライブラリをインストールする際にはダウンロードしたファイルを使って、素早くインストールすることができます (この仕組みがキャッシュです)。キャッシュがあると容量が重くなるという欠点があります。重たいイメージは pull に単に時間がかかりますから、システムとしてデプロイする時にトラフィックが
- docker
- 機械学習
- あとで読む
- Dockerfile
- python
- cache
- CI
- MachineLearning
- MLOps
- techfeed
ワークフローオーケストレーション入門
- 190 users
- speakerdeck.com/nsakki55
- テクノロジー
- 2024/03/05
「Data Engineering Study #23 Data orchestration 特集」の発表資料ですイベントページ: https://forkwell.connpass.com/event/310011/
- airflow
- あとで読む
- MLOps
- エンジニア
- workflow
- aws
- slide
CyberAgent AI事業本部MLOps研修応用編
- 188 users
- speakerdeck.com/nsakki55
- テクノロジー
- 2023/05/24
CybagerAgent AI事業本部 2023年度新卒研修 MLOps 応用編で使用したスライドです。ハンズオンで使用したGitHub Repository: https://github.com/nsakki55/aws-mlops-handson
- MLOps
- あとで読む
- AI
- 機械学習
- AWS
- slide
- github
- Python
「機械学習」という技術で価値を創出する技術 / techniques-to-create-values-with-ml-layerx
- 187 users
- speakerdeck.com/yuya4
- テクノロジー
- 2022/10/15
2022年10月15日、技育祭2022秋における講演資料です。様々なコンテンツやクラウドサービスの充実により、機械学習という技術を利用するハードルは低くなりました。一方で、機械学習を用いて価値を生み出すことは容易ではありません。本勉強会では、プロダクト開発において「機械学習」という技術で価値を創出する技術について、バクラク請求書の実例とともにお話ししました。 https://talent.supporterz.jp/events/725b64f3-2791-4c99-84cf-6a2dbcfe909d/
- 機械学習
- あとで読む
- MLOps
- ai
- 学習
- 勉強
Generative AIのビジネス動向を把握する20のレポート集｜k1ito
- 181 users
- note.com/k1ito
- テクノロジー
- 2024/01/12
このNOTEの使い方◯ビジネス観点でGenerative AIの考え方を養うため ◯ファクト集・投資動向・インプリケーション ✗生成AIとは・技術解説・技術動向など注：サマリーはすべて生成AIで要約し翻訳したものです。とりあえずこれを読め
- AI
- あとで読む
- LLM
- MLOps
- 生成AI
- ビジネス
ゆるふわMLOps入門 - Re:ゼロから始めるML生活
- 179 users
- www.nogawanogawa.com
- テクノロジー
- 2020/03/02
MLOpsに関してちゃんと勉強中でして、色々事例とか調べてました。とは言うものの、現在ではMLOpsを様々な観点から語られて、MLOpsという言葉にいろんな意味が含まれています。という事情から色々探していたら、こちらをお見かけしました。 medium.com 書籍へのリンクはこちらです。n月刊ラムダノート Vol.1, No.1(2019)︵紙書籍＋PDF版︶ – 技術書出版と販売のラムダノートこちらの書籍では基本的な背景からきれいに整理されていました。こちらを参考にしつつ、頑張ってMLOpsの動向について整理してみたので、そのメモです。それでは張り切って書いていきます。 tl;dr; 背景・問題設定機械学習は学習のアルゴリズムよりその周辺のほうが大きい機械学習システムに携わる人の役割の違いによってうまくいかないことがある機械学習システムの構築・運用する上で課題も多い問
- MLOps
- 機械学習
- あとで読む
- ML
- 開発
- お役立ち
データオーケストレーションツールDagsterの紹介
- 172 users
- zenn.dev/datamarket
- テクノロジー
- 2023/05/13
データオーケストレーションとはデータオーケストレーションという言葉をご存知でしょうか？日本ではまだ耳慣れない言葉ですが、data orchestrationでgoogle検索すると実に3000万件以上ヒットし、世界的には十分に市民権を得ている言葉です。Databricksではデータオーケストレーションを以下のように説明しています。データオーケストレーションとはデータオーケストレーションとは、複数のストレージからサイロ化したデータを取り出し、組み合わせて整理し、分析に利用できるようにするための自動化されたプロセスです。このプロセスでは、レガシーシステム、クラウドベースのツール、データレイクといったあらゆるデータセンターが接続されます。データは標準形式に変換されるため、理解しやすく、容易に意思決定に利用できます。オーケストレーションとは、コンピュータシステム、アプリケーション、および
- データ分析
- あとで読む
- データ
- Workflow
- python
- ツール
- 分析
- 仕事
- data
Qiitaのスパム狩りをしたらAutoMLに仕事を奪われた件 - Qiita
- 169 users
- qiita.com/dcm_chida
- テクノロジー
- 2019/12/01
知っている人は知っていると思うが、Qiitaではたびたび大量のスパム記事が投稿されている。深夜24~26時頃に記事一覧を確認してみて欲しい。スパム記事がわんさか出てくるはず。登録したてのQiitaユーザは不安よな。1 ———— @dcm_chida 動きます🧐 はじめにこれはNTTドコモサービスイノベーション部AdventCalendar2019の1日目の記事です。我々の部署では日頃から﹁KDDCUP2﹂や﹁論文読み会﹂に取り組んでおり、若手から中堅社員まで最先端の技術取得に励んでいます。そうした活動をもっと外部へと発信していこうと始めたのがこのAdventCalendarです。社員一人一人が書いた記事を通して、少しでも多くの方に興味を持って頂ければ幸いです。さて、僕は4年目社員ですがプログラミング初心者の頃から現在に至るまで、Qiitaにはかなりお世話になりました。自分
- 機械学習
- AutoML
- qiita
- あとで読む
- データ分析
- BERT
- spam
- lambda
- データ
- AWS
ABEJAの技術スタックを公開します (2019年11月版) - ABEJA Tech Blog
- 169 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/11/11
2021/10/22追記：最新版は下記記事になります！こちらもご一読くださいませ。 tech-blog.abeja.asia どうも、Tech Blog編集長(自称)の緒方(@conta_)です。よくエンジニアの方にご質問いただく ABEJAってよく聞くけど、実際どんなことやってるのかよくわからないという点をクリアにするために、事業内容と技術視点でのABEJAの取り組みを紹介したいと思います。 ABEJAに興味のある方や、未来の一緒に働くメンバーに読んでいただけると嬉しいです！割とAIコンサルの会社と思われているらしいので、ちゃんとプロダクト作ってますよ！ということを伝えていきたい ABEJAの事業紹介 ABEJAは2012年から約7年間、機械学習・ネットワークやIoTデバイスを活用したプロダクトの研究・開発・運用を行っています。様々な産業・業種へ機械学習の適用・運用を培ってきたナ
- abeja
- あとで読む
- 機械学習
- 開発
- mlops
- 学習
- プロダクト
- 技術
- architecture
- Python
学習が何で律速してるか、把握してますか？ - arutema47's blog
- 155 users
- aru47.hatenablog.com
- テクノロジー
- 2022/12/07
(最新SSD IOはPCIe x4でした。ご指摘ありがとうございます。）はじめにどの処理で律速しているか調べる各処理の速度改善方法データ読み込み速度の改善データ前処理速度の改善 GPU処理速度の改善コンピューティングについての他記事はじめに Kaggle Advent Calendar 2022 8日目です。突然ですが、あなたはDNN学習時にどの処理で学習速度が律速しているか把握してますか？ DNN学習には図に示すように大きく3つの要素があります：（SSDからの）データ読み込み（CPUによる）データ前処理（GPUによる）DNN計算学習時のデータの流れとしては SSDからデータが読み込まれ、CPUに送られる(SATA or PCIe) CPUにてaugmentationや正規化などの前処理が行われ、GPUにデータが送られる(PCIe x16) GPUにてDNNの計算・
- CPU
- あとで読む
- GPU
- 機械学習
- 学習
- AI
Google Cloud、ジェネレーティブ AI を開発者、企業、政府に提供 | Google Cloud 公式ブログ
- 153 users
- cloud.google.com
- テクノロジー
- 2023/03/15
※この投稿は米国時間 2023 年 3 月 14 日に、Google Cloud blog に投稿されたものの抄訳です。ジェネレーティブ AI は、インタラクティブなマルチモーダル体験の新しい波の到来を告げるものであり、情報、ブランド、そして互いとの関わり方を変えるものです。Google Cloud は、AI に対する Google の数十年にわたる研究、革新、投資の力を活用し、企業や政府に対して、シンプルな自然言語のプロンプトからテキスト、画像、コード、動画、音声などを生成する機能を提供します。この技術の可能性を実現することは、すべての開発者、企業、政府の手にこの技術が提供されることを意味します。これまで、組織がジェネレーティブ AI にアクセスすることは難しく、カスタマイズはおろか、時には信頼を損ないかねない不正確な情報が生成されることもありました。10 年前、企業や開発者が新しい
- AI
- あとで読む
- Google
- gcp
- 人工知能
- 技術
- 開発
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
- 146 users
- www.slideshare.net/pfi
- テクノロジー
- 2021/04/16
Preferred Networks（PFN）は深層学習などの最先端の技術を最短路で実用化することで、これまで解決が困難であった現実世界の課題解決を目指しています。コンピュータビジョン、自然言語処理、音声認識、ロボティクス、コンパイラ、分散処理、専用ハードウェア、バイオインフォマティクス、ケモインフォマティクスといった幅広い分野で研究開発を行っており、それを支えているのが Kubernetes を用いて構築しているオンプレミス/ベアメタルの GPU クラスタです。本セッションでは、PFN が Kubernetes を用いてクラスタを運用するなかでどのような障害が起きるのかを紹介し、また障害対応をどのように自動化しているのかを具体的に使用/開発したソフトウェアを含めてご紹介します。また Kubernetes クラスタの管理、アップグレードの自動化にも取り組んでおり、それを実現する Clus
- kubernetes
- あとで読む
- 運用
- MLOps
- GPU
- slide
- 機械学習
WebAssemblyでの機械学習モデルデプロイの動向
- 141 users
- www.tkat0.dev
- テクノロジー
- 2020/12/02
本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly（Wasm）は機械学習モデルをデプロイする新たな手段になりうるでしょうか。この記事では、機械学習モデル（特に Deep Learning）を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript？とか機械学習で何に役立つの？とか思ってる方も多いと思います。しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き
- WebAssembly
- 機械学習
- あとで読む
- wasm
- machinelearning
- TensorFlow
- MLOps
- deploy
サイバーエージェント、AI開発手法「MLOps」の研修資料を無償公開　全140ページ
- 136 users
- www.itmedia.co.jp
- テクノロジー
- 2023/05/25
サイバーエージェントではこれまでも、新卒エンジニア向けに「チーム開発の進め方」や「良いコードとは何か」といった資料や、Unityエンジニア向けのゲームシステムの高速化に関するノウハウなどを無償公開している。関連記事ミクシィ、新卒向け研修資料を無償公開　「Git」と「テスト・設計」　今後も随時公開 MIXI（旧社名ミクシィ）は、同社の新入社員向け技術研修で使用した資料を無償公開した。日経新聞、新卒エンジニア向けセキュリティ研修資料を無償公開日本経済新聞社は、新卒エンジニア向けセキュリティ研修資料を無償公開した。同社が4月の新人研修で使用したもので、ページ数は30ページ以上。ゲームシステムを高速化する社内ノウハウを無償公開　Unityエンジニア向けに　サイバーエージェントサイバーエージェントは社内研修用の書籍「Unity パフォーマンスチューニングバイブル」のPDFを公開した。 3
- MLOps
- あとで読む
- AI
- 人工知能
- 機械学習
- techfeed
- 資料
高速で持続可能な開発のためのソフトウェア工学と機械学習への適用
- 129 users
- zenn.dev/zerebom
- テクノロジー
- 2023/05/25
こんにちは、Wantedlyで推薦システムを開発している樋口です。Kaggleや実務での機械学習の開発にて、過去に下記のような失敗がありました。精度改善のために実験を繰り返し追加したら、PRが巨大になり、レビューに時間がかかった学習結果を確認したら、パラメータを一部だけ間違えていて、再度長い実験をやり直したこのような悩みを解決するために、書籍や経験で学んだプラクティスを取り組んできました。例をあげると以下のようなのものがあります。小さい単位でPRを作成するパラメータを設定ファイルに切り出して、ヌケモレを減らす学習データをサンプリングして、実行時間を短縮して結果を素早く確認するこれらのプラクティスに取り組む中で、もっと "高速で正確な開発を行うための知見や方法が体系化されているのではないか" という疑問が湧きました。この疑問を解決するべく"継続的デリバリーのためのソフトウェア
- 機械学習
- あとで読む
- 開発
- 学習
- AI
データ基盤のメタデータを継続的に管理できる仕組みを作る - Hatena Developer Blog
- 110 users
- developer.hatenastaff.com
- テクノロジー
- 2020/04/16
こんにちは。MackerelチームでCRE(Customer Reliability Engineer)をしているid:syou6162です。 CREチームではカスタマーサクセスを進めるため、最近データ分析により力を入れています(参考1, 参考2)。データ分析を正確に行なうためには、データに関する正確な知識が必要です。今回はより正確なデータ分析を支えるためのメタデータを継続的に管理する仕組みについて書いてみます。データに対する知識: メタデータデータ分析を正確に行なうためには、データ自身に関する知識(=メタデータ)が必要です。例えば、Mackerelのデータ分析タスクでは以下のような知識が必要とされることが多いです。このテーブル / カラムは何のためのテーブルなのか似たようなカラムとの違い集計条件の違い、などデータがどのような値を取り得るか SELECT column, COU
小さく始めて大きく育てるMLOps2020 | | AI tech studio
- 100 users
- cyberagent.ai
- テクノロジー
- 2020/06/01
AI Labの岩崎(@chck)です、こんにちは。今日は実験管理、広義ではMLOpsの話をしたいと思います。 MLOpsはもともとDevOpsの派生として生まれた言葉ですが、本稿では本番運用を見据えた機械学習ライフサイクル︵実験ログやワークフロー︶の管理を指します。 https://www.slideshare.net/databricks/mlflow-infrastructure-for-a-complete-machine-learning-life-cycle 参考記事のJan Teichmann氏の言葉を借りると、エンジニアがDevOpsによって健全で継続的な開発・運用を実現している一方、多くのデータサイエンティストは、ローカルでの作業と本番環境に大きなギャップを抱えているクラウド含む本番環境でのモデルのホスティングが考慮されないローカルでの作業本番のデータボリュームやス
- MLOps
- あとで読む
- 機械学習
- workflow
- AI
学びを仕事に繋げる / 外貨を稼ぐ / 継続的に成長する - Sansan Tech Blog
- 97 users
- buildersbox.corp-sansan.com
- テクノロジー
- 2023/01/24
﹁公立はこだて未来大学﹂にお招きいただき、学生さん向けに講義をさせていただきました。講義で用いたスライドは公開済みで、既にTwitterやはてブでも反響をいただいております。スライド内には埋め込み動画やリンク等、Speaker Deckでは再現されないものもあるので、講義資料をあらためて﹁記事形式で﹂全ページ公開したいと思います。講義のテーマ／構成について講義のタイトルは﹁学びを仕事に繋げる﹂としていますが、﹁海外進出﹂︵外貨を稼ぐという選択肢を持つ︶﹁成長サイクル﹂︵継続的に成長する︶と併せた3本立て1にしています。講義のテーマは非常に悩んだのですが、私の経験から学生さん向けに話せるもっとも価値のある内容はなんだろう？どうやったら90分飽きずに聞いてもらえるだろう？と考えた結果このようになりました。2学生さん向けの講演ではありますが、現場でバリバリ活躍されている
- MLOps
- あとで読む
- 技術
- blog
- 学習
- tech
- technology
- 海外
機械学習アプリケーションにおけるテストについて - Re:ゼロから始めるML生活
- 96 users
- www.nogawanogawa.com
- テクノロジー
- 2020/04/18
機械学習系の話題が多い昨今ですが、実際触ってみると期待した精度・結果が出ないなんてことはよくあることではないでしょうか。機械学習特有の性質として、データ自体がモデルを変化させ、結果として業務に影響を与えたりします。仮に、機械学習屋さんが精度が出るモデルを構築したと言っても、それを導入するときに、システム全体での品質の維持に苦労したりします。ということで、不確実性の大きい機械学習系開発についての、設計・テスト戦略でどうやってリスクを低減していけるかが一つカギになってくると思い、方法論について勉強しましたので、そのメモです。非常に参考にしたのはこちら。 arxiv.org テストそのもののテクニックなどは、一般的なテスト駆動開発に関する書籍を合わせてをご参考ください。テスト駆動開発作者:Kent Beck発売日: 2017/10/14メディア: 単行本（ソフトカバー）テスト駆動P
メルカリ・ヤフー・ZOZO開発者が語る「画像検索」の最前線！　 Bonfire Data & Science #1 イベントレポート
- 93 users
- techblog.yahoo.co.jp
- テクノロジー
- 2019/11/14
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog 祝！　データサイエンス領域で初めての Bonfire！！そんな記念すべき初回のイベントレポートを書かせていただきます、Yahoo!ショッピングでサイエンス領域を担当している東孝信です。 Bonfire Data & Scienceは、データとサイエンスに関わる人たちが情報共有できる勉強会/交流会です。今後も定期的に開催される予定ですので、興味のある方は第2回以降もぜひチェックしてください！さて、第1回のテーマは「画像検索」です！最近EC系のサイトで類似画像検索が出来るようになったけどどうやってるの？画像検索のモデルってどうしてるの？画像検索のインフラはどうしてるの？私たちの会社でも画像検索を用いたサービスを構築できる
- 機械学習
- あとで読む
- 検索
- zozo
- 画像
- mlOps
- yahoo
PythonでApache beam 入門
- 87 users
- shunyaueta.com
- テクノロジー
- 2020/12/26
2020-12-26 TensorFlowの勉強をしていたら、Apache beam を前処理に採用していたケースがあり、興味を持ったので深堀りしてみます。興味が湧いたモチベーションとしては、データ量が増加しても前処理部分を難なくスケールできそう(前処理部分をスケールさせて高速に実験を回したい、並列化などはすべて良い感じにbeamに任せれそうバッチとストリーミングの両者に対応可能なので、柔軟な機械学習の推論サービスが提供できるのでは? (GCPの参考資料 Data preprocessing for machine learning: options and recommendations)Apache beam を触りつつ分散データ処理を学びたいhttps://github.com/jhuangtw/xg2xg#services を見てみるとGoogle 内部のFlume という並列
- beam
- apache
- あとで読む
- Dataflow
- Python
AI Project Management Anti Pattern
- 87 users
- speakerdeck.com/yurfuwa
- テクノロジー
- 2020/02/21
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
データ基盤を支える技術 - ETLフレームワークの実践的な選び方・組み合わせ方 - JX通信社エンジニアブログ
- 86 users
- tech.jxpress.net
- テクノロジー
- 2020/07/29
JX通信社シニア・エンジニア兼データ基盤担当大臣の@shinyorke（しんよーく）です. 最近やった「ちょっとした贅沢」は「休日, 自宅で🍺片手に野球を見ながらUberEatsで注文したランチを楽しむ」です. ⚾と飲食を提供してくださる皆さまに心から感謝しております🙏 JX通信社では, 機械学習を用いたプロダクト開発・施策プロダクト・サービスの改善に関する分析日々のイベントをメトリクス化して可視化（いわゆるBI的なもの）を円滑かつ効率よく行うため, 昨年からデータ基盤を整備・運用しており, 現在では社員のみならず（スーパー優秀な）インターンの皆さまと一緒に活用し, 成果を出し始めています. ainow.ai なぜデータ基盤が必要か?どういった事をしているのか?...は上記のインタビューに譲るとして, このエントリーでは「データ基盤を支える技術 - ETL編」と称しまして, Py
- ETL
- データ基盤
- python
- workflow
- コンテナ
- データ
- あとで読む
- 運用
- docker
ML Ops: Machine Learning as an Engineering Discipline
- 86 users
- towardsdatascience.com
- テクノロジー
- 2020/01/08
So, your company decided to invest in machine learning. You have a talented team of Data Scientists churning out models to solve important problems that were out of reach just a few years ago. All performance metrics are looking great, the demos cause jaws to drop and executives to ask how soon you can have a model in production. It should be pretty quick, you think. After all, you already solved
「仕事ではじめる機械学習第2版」を読んで思った「ソフトウェアエンジニアとデータサイエンティスト, ML Ops」のこと - Lean Baseball
- 86 users
- shinyorke.hatenablog.com
- テクノロジー
- 2021/04/22
このエントリーのテーマですこのエントリーは, 「仕事ではじめる機械学習第2版」出版お祝いのエントリーとなります. 仕事ではじめる機械学習第2版作者:有賀康顕,中山心太,西林孝オライリージャパンAmazon 私自身, 第1版登場の2018年頃*1から「機械学習エンジニア」「企画・提案のフェーズから機械学習プロジェクトを回すマン」など, まさに機械学習を仕事とするロール・立ち位置で働いたり個人開発をしたりしていた身として, 色んな場面で参考にしていた書籍の待望の第2版登場で嬉しいです. 待ちに待った仕事ではじめる機械学習第2版、戴きました🙏 週末読んで感想書くぞ📕 pic.twitter.com/66mcTzxja5— Shinichi Nakagawa / 中川伸一 / Senior Engineer (@shinyorke) 2021年4月15日縁あって著者の皆様およ
データ系エンジニアの職種の違い - satoshihirose.log
- 84 users
- satoshihirose.hateblo.jp
- テクノロジー
- 2020/08/12
はじめに自分は Martin Kleppmann が言うデータ指向アプリケーションやそれを実現する周辺の技術領域が好きで、業務としてそのような領域のエンジニアリングを引き続きやっていけたらなと思っています。世の中には関連する職種の求人が多々ありますが、同じ名前のロールでも職務内容がコンテキストによって異なることが多かったりします。ここではそれぞれの職種の違いについて自分の観点からまとめます。 1. データエンジニア求人を眺めていると、データエンジニアは企業によって割と役割がぶれるので分けて説明します。 1-1. 小さめの事業会社のデータエンジニアまずは、小さめの事業会社のデータ分析基盤の構築・運用をするロールです。ここでは ETL 処理の実装・運用のほかに、各種ツールを使ったデータ基盤の構築・運用知識やクラウド上のアプリケーション構築の知識などが求められることが多いです。さら
本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)
- 80 users
- www.scutum.jp
- テクノロジー
- 2021/01/21
おまたせしましたこの度、ついにこの記事を完成させることができました。これは私が数年前からずっと書きたいと思っていた、ウェブのアクセスログに対する、機械学習を使った異常検知の実例です。私は事あるごとに(※1)﹁情報セキュリティ分野でもデータサイエンスの技術は非常に重要だ﹂と繰り返していますが、この記事の内容はまさにその1つの証となると思います。この記事で示される内容を見れば、﹁うわ、機械学習、マジでヤバイい(語彙力)んだな...﹂となるでしょう。以下に心当たりのあるセキュリティエンジニアはぜひ読んで、そして実践してみてください。機械学習に興味はあるものの、どこから手を付ければよいのかイメージがわかない本当にAIやデータサイエンス、機械学習がセキュリティの分野で役に立つのか、確信がもてないデータサイエンスや機械学習は難しそうだと思っているログ解析において、grepや単純な統計処理より
- 機械学習
- waf
- secuirty
- あとで読む
- 異常検知
- セキュリティ
- security
- ログ
- log
- データ
MLOps: 機械学習における継続的デリバリーと自動化のパイプライン | Cloud アーキテクチャセンター | Google Cloud
- 79 users
- cloud.google.com
- テクノロジー
- 2020/03/06
デジタルトランスフォーメーションを加速お客様がデジタルトランスフォーメーションに乗り出したばかりでも、あるいはすでに進めている場合でも、Google Cloud は困難な課題の解決を支援します。
- MLOps
- あとで読む
- cd
- 機械学習
- 開発
機械学習研究者＆エンジニアが頭を抱える実験管理に役立つツールを比較した - のんびりしているエンジニアの日記
- 79 users
- nonbiri-tereka.hatenablog.com
- テクノロジー
- 2020/02/17
皆さんこんにちは。お元気でしょうか。GoogleQA20thで悔しいけど楽しかったです。自然言語処理のみのコンペを真面目に挑んだのは初で、勉強になることが多かったです。今回は実験管理ツールの紹介と比較をします。特徴がわかる範囲で簡単に実装も書いているので、参考にしてみてください。実験管理ツール実験管理の必要性実験管理ツールの要件実験管理ツールの紹介 Excel Excelとは良い点欠点 mag magとはサンプル実装良い点ここが少し残念 Weights and Biases Weights and Biasesとはサンプル実装良い点ここが少し残念 MLFlow サンプル実装良い点ここが少し残念まとめ最後に実験管理ツール実験管理の必要性コンペティションや研究では多くのハイパーパラメータや構造などに対して様々な変更を加えます。私の場合の例ですが、
- 機械学習
- ツール
- MLops
- あとで読む
- data
- 学習
- 研究
次世代のワークフロー管理ツールPrefectでMLワークフローを構築する CyberAgent Developers Blog | サイバーエージェントデベロッパーズブログ
- 78 users
- developers.cyberagent.co.jp
- テクノロジー
- 2022/11/02
※ DynalystではAWSを全面的に採用しているため、AirflowもManaged版を調査しています。導入後の状態 Prefect導入後は、以下の構成となりました。ポイントは以下の点です。ワークフローをDocker Image化することで、開発・本番環境の差を軽減 staging・productionはECS Taskとしてワークフローを実行、開発ではローカルPC上でコンテナ実行 ML基盤のGitHubレポジトリへのマージで、最新ワークフローが管理画面であるPrefect Cloudへデプロイ従来のyamlベースのdigdagから、DSに馴染み深いPythonベースのPrefectに移行したことで、コード量が減り開発負荷が軽減しました。 Prefect 入門 ~ 基礎 ~ 注意: 本記事ではPrefect 1系を扱います。Prefect 2系が2022年7月にリリースされてい
- MLOps
- workflow
- aws
- ツール
- あとで読む
MLOps の利用を開始: ユースケースに適した機能の選択 | Google Cloud 公式ブログ
- 77 users
- cloud.google.com
- テクノロジー
- 2021/07/12
※この投稿は米国時間 2021 年6月25日に、Google Cloud blog に投稿されたものの抄訳です。MLシステムを構築および運用化する成熟した MLOps 手法の確立に際しては、適切な手法が得られるまで数年の歳月を要する場合もあります。Google ではこのほど、この重要な作業の時間短縮を支援する MLOps フレームワークを公開しました。 MLOps の使用を開始する際に、これらのプロセスと機能を必ずしもすべて実装する必要はありません。ワークロードのタイプおよびそれにより生み出されるビジネス価値や、プロセスもしくは機能の構築または購入にかかるコストとのバランスによって、プロセスや機能の中で優先順位の差が生じます。フレームワークを実用的手順に変換しようとするML担当者を支援するため、このブログ投稿では、お客様をサポートした経験を元に、何から始めるべきかを左右す
- MLOps
- あとで読む
- 202107
- GCP
- google
- HotEntry
- cloud
- 機械学習
- クラウド
GKE Autopilotで作るMLリアルタイム推論基盤 | PLAID engineer blog
- 77 users
- tech.plaid.co.jp
- テクノロジー
- 2021/02/25
本日ついに待望のGKE Autopilotがリリースされましたね！この記事では、GKE Autopilot上で動いているリアルタイム推論基盤でなぜ我々がGKE Autopilotを利用することにしたのかについてお話しします。
- kubernetes
- GCP
- GKE
- MLOps
- あとで読む
- 機械学習
- machineLearning