並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 162件

新着順 人気順

dbtの検索結果41 - 80 件 / 162件

  • 今さら聞けないdbtの基本LT

    dbt(data build tool)はもはやデータ領域ではデファクトスタンダードになりつつあります ここ1〜2年ぐらいで急速に発展したdbtですが、なんで使ってるの?なんでデファクト?とかって疑問あるかと思います。 なので社内勉強会向けに作ったdbtの基本のき 的なLTを作りましたので放流します!

      今さら聞けないdbtの基本LT
    • Snowflakeの力を引き出すためのdbtを活用したデータ基盤開発の全貌 - CARTA TECH BLOG


      dbt | Advent Calendar 2023 - Qiita 23 CARTA MARKETING FIRM@pei0804 SnowflakeVisiondbtdbtSQL dbtdbt / tokyo-dbt-meetup-4 - Speaker Deck dbt
        Snowflakeの力を引き出すためのdbtを活用したデータ基盤開発の全貌 - CARTA TECH BLOG
      • dbtでCIを実現するために、Github ActionsでAWSのVPC越えしたい。 - KAYAC engineers' blog


        Tech KAYAC Advent Calendar 20238 SRE@mashiike   Github ActionsRedshift  TL;DR dbtCIunit-testGithub ActionsRedshift Github ActionsRedshift kayac/ecspressoECS Task fujiwara/ecstaportforwarding mashiike/redshift-credentials 
          dbtでCIを実現するために、Github ActionsでAWSのVPC越えしたい。 - KAYAC engineers' blog
        • dbtではじめる クエリの再利用と正確性の向上について

          複雑なドメインを扱うプロダクトの探索フェーズではいつどのようにテストをするのか / How to testing during exploratory phase

            dbtではじめる クエリの再利用と正確性の向上について
          • dbt Semantic Layer ( MetricFlow ) の理解を深める

            OODAふりかえり 何って…ただ毎スプリント、違うふりかえり手法を採用してるだけだが? / Retrospectives with OODA

              dbt Semantic Layer ( MetricFlow ) の理解を深める
            • BigQueryにおけるdbtの増分更新についてまとめてみた - Timee Product Team Blog


               Timee | Advent Calendar 2023 - Qiita128 okodooooooon BigQuery dbt  dbtmaterialized=incrementalBigQueryincremental使
                BigQueryにおけるdbtの増分更新についてまとめてみた - Timee Product Team Blog
              • dbtを活用したデータ基盤の 論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt

                dbtを活用したデータ基盤の 論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt

                  dbtを活用したデータ基盤の 論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt
                • dbt Semantic LayerとSteepで実現するデータ民主化 - Gaudiy Tech Blog


                  Gaudiykuwaken GaudiySQLBiz dbt Semantic LayerSteep2 1. dbt Semantic Layer 2. Steep 3. dbt Semantic Layer 3-1.  3-2. dbt Cloud CLI 3-3. dimensiondatetimeBigQuery 3-4. entities 4.  5.  1. dbt S
                    dbt Semantic LayerとSteepで実現するデータ民主化 - Gaudiy Tech Blog
                  • データエンジニア界隈で話題のdbt(data build tool)のまとめ - Qiita

                    概要 データエンジニア界隈で話題となってきたdbtに関する調査内容を共有します。 OSS版のdbtでも機能が充実しており、データエンジニアの方には一部の機能の利用だけでも価値があるツールです。 必要に応じて、この記事を更新します。 dbt(Data Build Tool)とは dbtとはData Build Toolの略であり、dbt Labs社が開発しているデータ連携のELTにおけるT(データストア内でのデータ変換)の実施をサポートするツールです。 機能をざっくり整理すると下記のものがあり、SQL文のコンポーネント化やドキュメントの自動生成に特異性があります。 有償版であるdbt cloudとOSS版であるdbt Coreがあります。dbt cloudにて、developer版という個人検証用の無償ライセンスもあるので、とりあえず触りたい方はこちらがおすすめです。 引用元:dbt Pri

                      データエンジニア界隈で話題のdbt(data build tool)のまとめ - Qiita
                    • Classiのデータ分析基盤であるソクラテスの紹介 - Classi開発者ブログ

                      こんにちは、データプラットフォームチームでデータエンジニアをやっている滑川(@tomoyanamekawa)です。 データプラットフォームチームはデータAI部のメンバーで構成されていて、データ分析基盤を中心としたデータ活用に関するシステムに責務を持つチームです。 データAI部が出来てから3年が経ち、データ分析基盤を今の形で運用をして1年半が経過しました。 データエンジニアの採用活動の中でデータ分析基盤を紹介する必要がある一方、説明コストが高く困っていました。 そこで今回は「ソクラテス」と呼んでいる社内のデータ分析基盤について紹介します。 (データAI部ではシステム基盤に哲学者の名前をつける慣習があります。) ソクラテスの責務 Classiのデータ分析基盤ではData Lake(DL), Data Warehouse(DWH), Data Mart(DM)の3層構造を採用しており、そのETL

                        Classiのデータ分析基盤であるソクラテスの紹介 - Classi開発者ブログ
                      • 【データ可視化/Streamlit】Streamlitで作ったアプリからSnowflakeのテーブルを自由に更新する方法 - Qiita

                        前置き こんにちは。データエンジニアの山口です! Streamlitでデータ可視化アプリを作成しており、 Streamlitアプリ上に手入力した値とSnowflake内の値を結合してデータを可視化したいなと思ったので、やり方を考えてみました。 結論 Streamlitアプリ上に手入力した値をSnowflakeのテーブルにデータを挿入・更新して、 すでにSnowflakeに入っているデータと結合すればいいのではないかと言う考えに至りました。 Streamlitのform_submit_button関数が使えそうだったので、そちらを使っていきます! 機能を実装する 早速機能を実装していきます! 前準備 まずはStreamlitから更新をするテーブルを用意しておきます。 今回は従業員マスターというテーブルを以下のクエリで作成して、 このテーブルの中にINSERT文などで、いくつか適当にデータを入

                          【データ可視化/Streamlit】Streamlitで作ったアプリからSnowflakeのテーブルを自由に更新する方法 - Qiita
                        • Beatrust における Modern Data Stack(Exploratory / Hightouch / Holistics) の可能性検証 - Beatrust techBlog


                          Beatrust  Data Scientist  Ouyang  Beatrust 使  Exploratory Reversed ETL  Hightouch  Holistics Beatrust 
                            Beatrust における Modern Data Stack(Exploratory / Hightouch / Holistics) の可能性検証 - Beatrust techBlog
                          • dbt snapshot から学ぶ Slowly Changing Dimension - Gunosyデータ分析ブログ

                            こんにちは、Gunosy Tech Lab DR&MLOps チームの楠です。 この記事は Gunosy Advent Calendar 2022 の 11 日目の記事です。 昨日の記事は UT@mocyuto さんの『RailsのフロントをReactへリファクタしたとき、スキーマをOpenAPIベースの自動生成にした話』でした。 この記事では、ELT パイプラインにおける Transformation ツールである dbt の snapshot という機能について紹介した後、snapshot の手法を一般化したディメンションモデリングにおける概念である Slowly Changing Dimension を包括的に紹介します。 はじめに dbt とは? dbt についての参考資料 dbt snapshot とは? どんなときに使える? dbt snapshot のまとめ dbt snap

                              dbt snapshot から学ぶ Slowly Changing Dimension - Gunosyデータ分析ブログ
                            • 最近のデータカタログの各種機能の有無を確認してみた(2024年4月時点) | DevelopersIO

                              さがらです。 ここ1~2年は新しい製品のリリースが落ち着いてきた印象ですが、Modern Data Stack界隈ではたくさんのデータカタログ製品が存在しています。 私も2年くらい前に色々触って調査したものの、この2年間での各製品のアップデートが凄まじく「どの製品がどの機能を持っているんだっけ…?」と知識が怪しくなってきてしまっている状況です。 そこで、今回改めて各製品の公式ドキュメントをベースに、最近のデータカタログの各種機能の有無を確認してみたので、本記事でまとめてみます。 ※注意事項:各製品のアップデートのスピードは本当に早いため、半年も経てば現時点で出来ていなかったことが出来ているようになっている可能性が高いです。最新の情報はご自身で確認の上、本記事は参考程度にご利用ください。 比較対象のデータカタログ 比較対象としては、以下のデータカタログを比較します。 SaaS Atlan S

                                最近のデータカタログの各種機能の有無を確認してみた(2024年4月時点) | DevelopersIO
                              • ディメンショナル・モデリング


                                VOYAGE GROUP Techlog Advent Calendar 2020 13   Wikipedia Dimensional Modeling (DM) is a data structure technique optimized for data storage in a Data warehouse.   211 
                                  ディメンショナル・モデリング
                                • dbt のデータモニタリングツール Elementary を使ってデータ品質管理を試してみた - Techtouch Developers Blog

                                  テックタッチアドベントカレンダー 13 日目を担当しますデータエンジニアの acchan です。 この間完全個室型のサウナに初めて行ってきまして、贅の極みを堪能してきました。みなさんもこの 1 年間頑張ってきた自分のご褒美にいかがでしょうか。 はじめに Elementaryとは チュートリアルをやってみる 下準備 パッケージのインストールと Elementary の初期設定 Elementary テストの追加 テストの実行とレポートの生成 Slack通知を試してみる さいごに はじめに 弊社では最近、データ分析基盤のモデリング用途として dbt を使い始めました。まだ間もないですが、モデルの共同開発が以前より活発になり、導入したことによるメリットが実感として現れつつあります。 しかし、作成されたモデルは本当に正しいデータを持っているのか?定義された指標通りに集計がされているのか?といった品

                                    dbt のデータモニタリングツール Elementary を使ってデータ品質管理を試してみた - Techtouch Developers Blog
                                  • dbtvault 入門

                                    データモデリングである Data Vault 2.0 をベースに作られた dbtvault パッケージを使い、 BigQuery に分析用のテーブルやビューを作成する手順をまとめた本になります。 dbt に関する説明は含まれておりませんので、詳しく知りたい方は下記をご参照ください。 https://zenn.dev/dbt_tokyo/books/537de43829f3a0 https://zenn.dev/foursue/books/31456a86de5bb4

                                      dbtvault 入門
                                    • 社内勉強会「Modern Data Stack入門」の内容をブログ化しました - PLAID engineer blog

                                      プレイドの社内向けに行ったModern Data Stack勉強会の内容が好評だったので、データ基盤に携わる方に向けてModern Data Stackの概要、主要サービス、重要だと思うトレンドをまとめました。

                                        社内勉強会「Modern Data Stack入門」の内容をブログ化しました - PLAID engineer blog
                                      • dbtで管理しているデータの可用性をelementaryで分析する - yasuhisa's blog

                                        データの可用性を可視化したい データの可用性の解像度を上げたい: elementary-data elementaryによる細かい可視化 大雑把にデータセット単位で可用性を可視化したい まとめ データの可用性を可視化したい データ品質は正確性や最新性など様々な項目に分解することができますが、可用性(Availability)はその中でも基礎的な項目です。使いたいときにデータが使えないと困るので。 自分が所属しているチームはdbt(cli)およびdbt cloudを使っていますが、可用性を考えるのであれば cli: dbt runの実行結果 dbt cloud: Jobsの実行結果 をそれぞれ確認したり、こけているようであればアラートを飛ばすという運用が多いと思います。これだけだと「いつこけた」しか分からないので、Datadogを使って「いつこけた」「いつ復旧した」「こけて落ちていた時間はど

                                          dbtで管理しているデータの可用性をelementaryで分析する - yasuhisa's blog
                                        • データエンジニアリングの背景を踏まえてdbt(Data Build Tool)を少し深く理解してみる - Qiita


                                           dbtData Build tooldbt姿dbt dbt  SparkPrestoDelta LakeHudiIcebergACID
                                            データエンジニアリングの背景を踏まえてdbt(Data Build Tool)を少し深く理解してみる - Qiita
                                          • dbtのモデルとTableau上で使われているWorkbookの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog

                                            3行まとめ dbtのジョブが失敗した際やテーブルの廃止検討の際に、BI上のどのダッシュボードで利用されている(データリネージ)か知るのは重要です TableauのGraphQLのAPIからWorkbookとBigQuery上のモデルの埋め込みの関係を知ることができます dbtのモデルとTableau上で使われているWorkbookの依存関係をexposureとして出力するスクリプトにより、dbtのジョブの失敗やテーブルの廃止がTableauのダッシュボードに与える影響などを調べやすくなりました 3行まとめ 背景 課題: dbtのexposureとしてダッシュボードを手動で記入し続けるのは難しい 解決方法: TableauのGraphQLのAPIを使い、 dbtのexposureを自動生成する 発展的話題 背景 業務において、DWHやデータマートの生成にdbtを、BIツールとしてTablea

                                              dbtのモデルとTableau上で使われているWorkbookの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog
                                            • クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2023年7~9月合併号 | DevelopersIO

                                              データアナリティクス事業本部 コンサルティングチームの石川です。コンサルティングチームメンバーを中心に、日々AWSのアナリティクス関連サービスのアップデートとそのブログを追っています。 先月、先々月は業務多忙のため、合併号とさせていただきます。(ゴメンナサイ m(_ _)m) Amazon Redshiftは、Redshift Serverlessのスケジューラやシングルサインオンの対応、 Amazon Forecastとの統合、QUALIFY句のサポートを開始しました。AWS Glueは、AWS Glue for RayがGAになった他に、AWS Glue for Apache Spark 向け Snowflake 接続の一般提供開始、Amazon CodeWhisperer をサポートするようになりました。Amazon QuickSightは、CI/CDを可能にするアセットのデプロイを

                                                クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2023年7~9月合併号 | DevelopersIO
                                              • DuckDBとdbtとRillで作るローカルで動くDWHっぽいもの

                                                この記事はdbt Advent Calendar 2022の12月1日の記事です。 サマリ DuckDBとdbtを使えばローカル環境で一定のデータ量であればオレオレDWHっぽいものが作れるようになる 社内にデータ分析基盤がない、データ活用しようにもデータ基盤がなく本格的に取り組もうと思うとセキュリティや運用までかんがえると始めることすらままならないようなプロジェクトや会社でも始められる可能性がある MLのデータの前処理とdb Pythonモデルを使ってローカル環境で一定のクレンジングと前処理のパイプライン等も作れるかも? DuckDBとは? SQLiteをベースとした軽量で高速なOLAPデータベースです。 近年のPCのメモリ増加で16GBとか乗っていると数百万行ぐらいのデータでもローカルで高速に一定処理することが可能になってしまっています。 詳しくは @notrogue さんが書いた記事を

                                                  DuckDBとdbtとRillで作るローカルで動くDWHっぽいもの
                                                • タイミーのデータ基盤品質。これまでとこれから。 - Timee Product Team Blog

                                                  はじめに 以前のデータ基盤 3つの問題解決と振り返り 問題1: データパイプラインの更新遅延 解決策 実装 振り返り 問題2: 分析チームへのクエリ修正依頼の増加 解決策 実装 振り返り 問題3: ETLパイプラインにおける加工処理の負債 解決策 実装 振り返り これからの品質に関する改善 はじめに 初めまして、タイミーのDRE (Data Reliability Engineering) チームの土川(@tvtg_24)です。 本記事ではデータ品質の保守に着目してここ1年くらいで試行錯誤したことを振り返っていきたいと思います。 対象にしている読者は以下の方々です。 データ品質について考えている方 データ分析の品質担保に困っている方 ETLからELTへの基盤移行を考えている方 この記事は Data Engineering Study #11「6社のデータエンジニアが振り返る2021」 -

                                                    タイミーのデータ基盤品質。これまでとこれから。 - Timee Product Team Blog
                                                  • dbt exposureによるデータ基盤アウトプットの登録を自動化しました - Timee Product Team Blog

                                                    はじめに 課題感・背景 使用しているBIツールについて BIツールの使用ボリューム感について やったこと:概要 やったこと:詳細 referenced tableにテーブル名ではなくdbtモデル名が入るようにしたことについて 各種アウトプットの公開設定をmeta情報として付与する方針としたことについて tagを追加してexposureの検索性を向上させたこと exposureのnameにシートとダッシュボードのタイトルを反映する方針にしたこと 今後の発展 保守運用の設計 カラムレベルリネージュ ✖️ exposure おわりに We're Hiring!! はじめに こんにちは。okodooonです!! データ基盤を参照したアウトプットが社内に溢れかえっていませんか? 弊社は追いきれていないLookerStudioやConnectedSheetがめちゃくちゃ溢れかえっていました。 そんな折

                                                      dbt exposureによるデータ基盤アウトプットの登録を自動化しました - Timee Product Team Blog
                                                    • dbt Core を GCPのCloud Run JobsやBatchで実行する方法


                                                       dbt DWHSnowFlake, dbt Cloud  DWHSnowFlake, dbt core  ECS Fargate  dbt core  AirFlow(Cloud ComposerMWAA) Fit BigQueryBigQueryOK 11 OK dbt or()
                                                        dbt Core を GCPのCloud Run JobsやBatchで実行する方法
                                                      • dbt 入門

                                                        dbt(data build tool)というアナリティクスエンジニアがデータ変換をデータウェアハウス(DW)でかんたんに行うためのツールについての本です。 dbt はいわゆる ELT(Extract, Load, Transform)の T を担当するツールで、データがすでに DW にロードされてる状況で使います。 いわゆるモダンデータスタック(MDS)を構成する技術スタックの一部に挙げられることが多くなってきています。 また dbt はアドホックなコードでカオスに陥ってしまいがちなアナリティクスエンジニアが、バージョン管理や CI などのメリットを享受しソフトウェアエンジニアのように働くための一助にもなり得るツールです。

                                                          dbt 入門
                                                        • 需要急増「データエンジニア」はなぜアツいの?「縁の下の力持ち」を面白がるデータのスペシャリストたちを直撃

                                                          TOPインタビュー需要急増「データエンジニア」はなぜアツいの?「縁の下の力持ち」を面白がるデータのスペシャリストたちを直撃 DATUM STUDIO株式会社 CTO 光田健一 横浜国立大学大学院にて応用数学を専攻。卒業後、凸版印刷で電子書籍事業の立ち上げを経て、GREEでSNSやゲームの分析を経験。その後、人工知能研究・深層学習研究の先駆者、松尾豊氏が技術顧問を務める「PKSHA Technology」で、アルゴリズム・システム開発に携わる。2019年DATUM STUDIO(データム スタジオ)株式会社に入社し、現在はCTOとしてプロジェクト遂行、組織の技術力向上に貢献している。 ちゅらデータ株式会社 CTO 兼DATUM STUDIO株式会社 菱沼雄太 北海道出身。名古屋市の専門学校を卒業後、市内の金融系SIerのエンジニアとして上流工程を担当した後、東京でエンタメ・ゲームなどの業界で

                                                          • dbtとDataformを比較し、dbtを使うことにした


                                                            AuthorsTwitter@__Attsun__Published onWednesday, February 10, 2021  DWH / Datamart 調 dbt  Dataform  TL;DRdbt 使Dataform  Web dbt  (Ubie,
                                                              dbtとDataformを比較し、dbtを使うことにした
                                                            • 【インターンレポート】LINEの大規模ETL batch pipelineにおけるdbtの導入によるデータ分析での課題解決の検証

                                                              LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは、早稲田大学政治経済学経済学科 学部3年の滝田愛澄と申します。2023年8月7日から6週間、LINE株式会社のIU Data Connectチームにて、就業型インターンシップに参加させていただきました。本インターンでは、LINEの大規模ETL batch pipelineであるVinitusが現在抱えている課題を解決することを目的に、data build tool (dbt) の調査とdbtを用いた新たなworkflowのプロトタイプの設計・実装に取り組みました。このレポートでは、現在のVinitusが抱えている課題を確認し、dbtの導入によってどのようにそれらの課題を解決できるか、具体的にこのプロトタイプでは何をど

                                                                【インターンレポート】LINEの大規模ETL batch pipelineにおけるdbtの導入によるデータ分析での課題解決の検証
                                                              • Tonamelのデータ基盤 ~データモデリング編~

                                                                #nakanoshima_dev 9/22 18:30~ https://nakanoshima-dev.connpass.com/event/221243/ nakanoshima.dev #21 LED!! (Let's enjoy データ分析!!)の発表資料です。

                                                                  Tonamelのデータ基盤 ~データモデリング編~
                                                                • 元アナリストがdbtでプロダクトのデータパイプライン構築できるようになった話

                                                                  こんにちは、@tenjinです。 本日12月3日は、待ちに待った映画「THE FIRST SLAM DUNK」の公開日ですね! 僕は初日の座席指定券を予約してあったので、この後日比谷の映画館まで観に行ってきます! ちなみに最近のお気に入りスーパーは、長野県のツルヤです。 道民なので、そもそも長野県は空気が肌に馴染む

                                                                    元アナリストがdbtでプロダクトのデータパイプライン構築できるようになった話
                                                                  • dbtのモデルとLooker Studioのレポートの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog

                                                                    シリーズの第三弾です。読者の宿題にしてたけど、誰も書いてくれなさそうだったので結局自分で書きました。 背景 Looker StudioはGoogle Workspaceを使っていれば基本的に無料で使えますし*1、権限管理にGoogle Groupとも連携できるので、人気のBIの一つだと思います。私が初めて触ったBIもLooker Studioだったので、(API強化して欲しいとか不満は山のようにありつつも)何だかんだで憎めないし、さっとダッシュボード作りたいときはLooker Studioを使うことが多いです。会社によっては社内の公式のダッシュボードをLooker Studioで作っているところもあると思います。 dbtで作ったテーブルがConnected Sheetsから参照されている場合、一定程度利用されているスプレッドシートからのテーブルの参照状況はデータ基盤を管理する人間としては把

                                                                      dbtのモデルとLooker Studioのレポートの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog
                                                                    • データカタログの本格導入に向けたdbt-osmosisへの貢献について紹介します - 10X Product Blog

                                                                      Analytics Engineerの吉田(id:syou6162)です。BigQueryを中心に10X社内のデータ管理の仕事をしています。 最近、データカタログの本格導入の準備を進めていて、それに向けた補助ツールとしてdbt-osmosisもゴリゴリと使い倒すようになってきました。その中で「10Xでの運用を考えるとこういうケースで困るし、前職までの経験を踏まえると解決できると他社でも役に立ちそう」「この挙動は普通にバグっぽいな...」というものがあったので、立て続けにPull Requestを送りました。ありがたいことに全部マージしてもらえましたが、せっかくなのでデータカタログの導入に向けてdbt-osmosisを採用した背景やどういったPull Requestを送ったか紹介します。 データカタログ導入の必要性 メタデータをいかに効率よく入力するか: dbt-osmosisの導入 取り込

                                                                        データカタログの本格導入に向けたdbt-osmosisへの貢献について紹介します - 10X Product Blog
                                                                      • dbt と Dataform を比較して Dataform を利用することにしました | MoT Lab (GO Inc. Engineering Blog)


                                                                        GOGO BUSINESSGO Dinedbt  Dataform  Dataform  Dataform   ELT  MoT Engineer Challenge Week 2022 Spring  dbt  Dataform 2Dataform  Dataform 
                                                                          dbt と Dataform を比較して Dataform を利用することにしました | MoT Lab (GO Inc. Engineering Blog)
                                                                        • dbt-osmosisを利用して、なるべくコストを抑えつつ効率的にメタデータ管理を行なう - yasuhisa's blog

                                                                          3行まとめ ビジネスメタデータはデータ生成者にとってもデータ活用者にとっても重要 しかし、カラムのメタデータを同じ説明をあちこちに書いていくのは大変... dbt-osmosisはビジネスメタデータの管理を省力化したり、自動化できる便利なツール 3行まとめ 背景: メタデータの重要さとメタデータ管理の大変さ 大変さ1: 多段のデータレイヤーにどうメタデータを付与していくか 大変さ2: 継続的な運用をどうするか dbt-osmosisでメタデータ管理を行なう 依存関係を考慮したメタデータの伝播 自動化による継続的な運用 基本的な使い方 使ってみた感想 背景: メタデータの重要さとメタデータ管理の大変さ データマネジメントにおいてメタデータの重要性は今さら説明するまでもないと思います。メタデータは以下の3種類が代表的です。 A: テクニカルメタデータ B: オペレーショナルメタデータ C: ビ

                                                                            dbt-osmosisを利用して、なるべくコストを抑えつつ効率的にメタデータ管理を行なう - yasuhisa's blog
                                                                          • データアナリストがdbtを使って育てるデータマネジメント[連載1/3] - Retty Tech Blog

                                                                            はじめに データアナリストとして今年中途入社した上野(@hiro_30_1000)です。 本日より、Retty分析チームの連載「#dbtでデータの民主化」を始めます! この連載では、Rettyのデータアナリストが約3ヶ月間取り組んできた「dbtの導入」を中心テーマとし、 その仕事の裏側、プロセスを公開していきます。 「#dbtでデータの民主化」の公開スケジュール 本日から3週間に渡り、週1回ペースで記事を公開予定です。 9/14(水):データアナリストがdbtを使って育てるデータマネジメント 9/22(木):dbt移行プロジェクトを振り返ってみた 9/29(木):DWHの管理を内製ツールからdbtに移行した話 本記事では、データアナリストがdbtを用いてデータマネジメントをすることで実感したメリットを中心に共有したいと思います。 また、具体的なdbt導入のプロジェクト進行プロセスは、新卒の

                                                                              データアナリストがdbtを使って育てるデータマネジメント[連載1/3] - Retty Tech Blog
                                                                            • ダンボールワンのデータ分析基盤〜dbt導入してみた〜

                                                                              背景 ダンボールワンがラクスルグループに加わり、データ分析基盤を整備したのでその事例紹介 ラクスルグループの中で、はじめて dbt を導入してとても良かったので、その部分を中心に紹介 整備前はサービスDBの Read Replica に Redash から接続してデータ分析していた Redash で SQL を書いて分析できるメンバーが限られるため、SQL を書けないビジネス側メンバーも自分で分析できる環境が欲しかった(利用者は30名程度) データ分析基盤構成 Data Warehouse Data Warehouse は BigQuery を採用 ラクスルグループでは Snowflake を採用しているケースもあるが、今回は Googleスプレッドシート や Googleデータポータル といった BI環境との接続性を重視 BI BI環境は Googleスプレッドシートのコネクテッドシート

                                                                                ダンボールワンのデータ分析基盤〜dbt導入してみた〜
                                                                              • dbt の導入、毎日30分の輪読会でチームに浸透させる - Techtouch Developers Blog

                                                                                テックタッチアドベントカレンダー15 日目担当の teru です。今年の個人的ベスト家電はスマートフォンで見れるネットワークカメラでした。子ども達が寝室で寝ている様子を確認しながら家事ができるのでとても便利です。 きっかけ 輪読会の準備 輪読会の実施 やってみてどうだったか 良かった点 気になった点 終わりに きっかけ 13 日目の記事 でも触れているように、弊社でデータ分析基盤のモデリング用途に dbt の利用が始まりました。私の所属する分析運用チームでもこの流れに乗って、dbt を使って分析業務に関わる範囲のデータテーブル構築を自分たち自身で行えるように取り組むことにしました。 分析運用チームには、この記事を書いている時点で私を含む 2 名が在籍していました。二人とも BI ツールを用いて SQL クエリを書いたりレポートを作成したりといったデータアナリストの業務経験はありましたが、d

                                                                                  dbt の導入、毎日30分の輪読会でチームに浸透させる - Techtouch Developers Blog
                                                                                • 『エンタープライズ』という言葉の重さ 〜Data Vault 2.0をやめた2022年冬〜

                                                                                  https://forkwell.connpass.com/event/263245/ こちらのイベントの登壇内容です。

                                                                                    『エンタープライズ』という言葉の重さ 〜Data Vault 2.0をやめた2022年冬〜