※本記事は2023年1月1日に公開された記事の翻訳版です。 メルカリのマーケットプレイスにおける商品検索は、お客さまが欲しい物を発見する最も基本的な方法です。この中核となる機能は、テキストマッチングによる情報検索システムによって実現されています。 しかし最近、私たちは自問自答しました。お客さまの検索体験を向上させる、合理的な機械学習ベースのアプローチはあるのだろうか?という疑問が生まれました。メルカリアプリ上のお客さまの行動を、彼らにとってより関連性の高い検索結果についてのヒントとして捉えることはできないでしょうか?学習データにラベルを付け、単体のユーザークリックという行為をもとにした分析の限界を念頭に置きながら、モデルが学習するための、より情報量の多いコンテキストを構築できないでしょうか?ビジネスKPIとの関係を把握するために、どのようにデータラベリングを利用できるでしょうか? それは、
はじめに 検索性能を評価するための適切なデータセットが手元にない場合、自前でオフライン評価セットを構築することが選択肢としてあります。 ユーザー行動ログに基づく評価も有効ですが、人手で集められた高品質なデータセットを用いることで、様々な検索手法を手軽に検証することが可能になります。 本記事では、検索性能評価のためのアノテーションを設計する際に気になった点を中心に、設計ポイントを紹介します。 目次 はじめに 目次 用語の定義 概要 トピック数の設計 アノテーションのアプローチ Pointwise vs Pairwise vs Listwise アプローチ Pointwise, Pairwise, Listwiseアプローチの比較 再利用可能なデータセットの構築 効率的なアノテーションのためのデザイン インタラクティブな検索インターフェース LLMを利用した自動評価 おわりに 参考 用語の定義
024年6月28日に開催された 開発生産性Conference 2024 の講演資料です。 講演詳細についてはこちらをご覧ください。 https://dev-productivity-con.findy-code.io/2024
Dharma Type is a font design project by Ryoichi Tsunekawa. Free Bebas Neue fonts and many premium fonts e.g. La La Land.
入門EOL対応 ~SREが鉄板の流れ全部見せます編~ https://fortee.jp/yapc-hiroshima-2024/proposal/8b778ed2-df11-4bee-a4b7-81e2b85b51c4 ソフトウェアは進化する一方で、全てのバージョンをサポートし保守し続けるのはリソースを効果的に割り当てる観点から現実的ではありません。 セキュリティリスクや管理コストを考慮し、サポート終了期間を設けるEOLを用いた運用が一般的に採用されています。 サービスを運営する中で、EOLに対して時間に余裕を持って対応できればよいですが機能開発が優先されることでリソース不足となってしまうなどでソフトウェアのEOL対応に対して後手に回ってしまうという課題がありました。 このセッションでは、GMOペパボのSREがソフトウェアのEOL対応をベースとした、ソフトウェアをただアップデートするだけ
Rustで双方向連結リストが欲しいと思ったときは、意外と簡単に実装できる代替品が使えるかも?という記事です。 Rustでの連結リスト実装に関しては、何よりもまずIntroduction - Learning Rust With Entirely Too Many Linked Listsという有名な文献があります。この最初のページに、「Linked Listが本当に必要な場面は思ったよりかなり限られているので、まずはVecかVecDequeあたりの使用を検討しろ」ということが書いてあります。 ただそれでも連結リストが必要なときというのはあります。筆者はソフトウェアNAT(こちらの記事で詳しく解説しています)でIPアドレス・ポートのマッピングをタイムアウトの順に並べて管理するために連結リストが欲しくなったのですが、ここではもう少し単純な問題を考えてみましょう。 以下のような状況をプログラムで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く