はじめに AWS UpdateでAmazon SageMaker Data Wranglerに画像の前処理機能が追加されました。 Data WranglerはAmazon SageMaker Studioの機能の一つで、データの前処理が行えるサービスです。 従来はファイルタイプとしてcsv, parquet, json, jsonl, orcに対応していたようですが、﹁image﹂が追加されました。 利用イメージは以下のようになります。 やってみる ﹁S3からインポート → 重複削除 → ノイズ付与 → S3にエクスポート﹂という流れを試してみます。 インポートするS3バケット内に同じ画像データを2枚用意しました。 この画像に処理を行い、エクスポートするまでを試してみます。 データインポート データソースをS3としてインポートします。File typeは﹁image﹂を選択しました。 イン
![Amazon SageMaker Data Wrangler に画像の前処理が追加 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/e82eb88901057e592c9aaea5fd4eac1842c5c37b/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9QW1hem9uJTIwU2FnZU1ha2VyJTIwRGF0YSUyMFdyYW5nbGVyJTIwJUUzJTgxJUFCJUU3JTk0JUJCJUU1JTgzJThGJUUzJTgxJUFFJUU1JTg5JThEJUU1JTg3JUE2JUU3JTkwJTg2JUUzJTgxJThDJUU4JUJGJUJEJUU1JThBJUEwJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz00YjYyNjc0NTk3MTVkZGM5NTViYWIxZTY2NTJjMDMwMw%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTcxNiZ0eHQ9JTQwdF90c3VjaGlkYSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTMyJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9Y2QyMWE4NTI5ZjI2NTBjYWMzNzM1NDgwZDkxMmViZDU%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Db3abc1fbc90d9ead33e46e7005cff615)