タグ

前処理に関するsh19910711のブックマーク (4)

  • Amazon SageMaker Data Wrangler に画像の前処理が追加 - Qiita


     AWS UpdateAmazon SageMaker Data Wrangler Data WranglerAmazon SageMaker Studio csv, parquet, json, jsonl, orcimage   S3      S3 S32   S3File typeimage 
    Amazon SageMaker Data Wrangler に画像の前処理が追加 - Qiita
    sh19910711
    sh19910711 2024/04/23
    "Data Wrangler: SageMaker Studioの機能の一つで、データの前処理が行えるサービス / 組み込みの変換も用意 + 今回は重複削除とノイズ付与 / カスタムで作成したスクリプトをステップに追加することもできる" 2023
  • tidymodelsを使った機械学習 - Qiita

    cv_data ## # 10-fold cross-validation using stratification ## # A tibble: 10 × 2 ## splits id ## <list> <chr> ## 1 <split [135/15]> Fold01 ## 2 <split [135/15]> Fold02 ## 3 <split [135/15]> Fold03 ## 4 <split [135/15]> Fold04 ## 5 <split [135/15]> Fold05 ## 6 <split [135/15]> Fold06 ## 7 <split [135/15]> Fold07 ## 8 <split [135/15]> Fold08 ## 9 <split [135/15]> Fold09 ## 10 <split [135/15]> Fold10

    tidymodelsを使った機械学習 - Qiita
    sh19910711
    sh19910711 2024/04/20
    "tidymodels: 機械学習もtidyに行いたい人向け + パッケージごとに異なる変数を使っているのを統合可能 / 何を予測させるかの指示と、正規化などの前処理をrecipeに指定 / min_nは後でハイパラ探索するのでtune()とする" 2023
  • 特徴量選択の3つの基本戦略 - Qiita


     Python  3     sklearn  SelectPercentile   1 使
    特徴量選択の3つの基本戦略 - Qiita
    sh19910711
    sh19910711 2024/04/17
    "SelectPercentile: 他の特徴量と組み合わさって意味を持つような特徴量は捨てられる / SelectFromModel: RandomForestで特徴量の重要度を元に選択しロジスティック回帰 / RFE: 基準が満たされるところまで1つずつ特徴量を加えていく" 2017
  • WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”

    ARG 第7回Webインテリジェンスとインタラクション研究会 企画セッション2「不揃いなデータ達の分析を行う前のTips」

    WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
  • 1