タグ

model*に関するsh19910711のブックマーク (153)

  • Fitbitデータでスパース推定に入門してみる③ 〜心拍数データに対してfused lassoを使い、変化点を検出する〜 - mikutaifukuの雑記帳

    はじめに 前回の記事では、個々の変数を選択するための様々なスパース推定の手法をまとめ、Fitbitデータに適用することでそれぞれの手法を比較しました。 mikutaifuku.hatenablog.com 今回のエントリでは、少し趣向を変えて心拍数データに対して、fused lassoと呼ばれる隣合う変数の関係性を加味した手法使ってみます。なお、今回のエントリは、書籍の第3章のfused lassoの部分を自分なりに整理してまとめただけなので、丁寧に学びたい方は、書籍を読んでいただければと思います。 スパース推定法による統計モデリング (統計学One Point) 作者: 川野秀一,松井秀俊,廣瀬慧出版社/メーカー: 共立出版発売日: 2018/03/08メディア: 単行この商品を含むブログを見る fused lassoの概要 fused lassoは以下のような性質をもつデータに対して

    Fitbitデータでスパース推定に入門してみる③ 〜心拍数データに対してfused lassoを使い、変化点を検出する〜 - mikutaifukuの雑記帳
    sh19910711
    sh19910711 2024/06/21
    "fused lassoと呼ばれる隣合う変数の関係性を加味した手法 / 実務においては、このように全てのデータが揃ってから変化点を検出しても遅く / 「スパース推定法による統計モデリング」第3章" 2018
  • StanとPythonでベイズ統計モデリング その1 - Easy to type


    StanR() StanR (Wonderful R) : ,/: : 2016/10/25:  (8)   使statmodeling.hatenablog.com ()  使 
    StanとPythonでベイズ統計モデリング その1 - Easy to type
    sh19910711
    sh19910711 2024/06/21
    "「あいまいさ自体をパラメータ化してしまう」という特徴が他にどのように活かせるのか理解しやすく / 難しいところは「パラメータを生み出す分布がある」という感覚の理解 / Stan: 2.10.0辺りで新しい文法が提案" 2017
  • StanとPythonでベイズ統計モデリング その2 Chapter5 - Easy to type


    (StanR)Chapter5Python Python Chapter1~3Chapter4 Chapter5        Scatterplot matrix MCMC : MCMC(1)    : 
    sh19910711
    sh19910711 2024/06/20
    "MCMCを行う前に、各データのオーダーを大体(1前後に)そろえる / 因果関係の推定: どちらが先に起こりうるか、といった事前知識が必要 / EAPなどの点推定量より、幅がどうなっているかが大事(0を跨いだりしていないか" 2017
  • レプリカ交換モンテカルロ法(パラレル・テンパリング)による混合ガウス分布に従う乱数の生成 - My Life as a Mock Quant

    マルコフ連鎖モンテカルロ法(メトロポリス法)による混合ガウス分布に従う乱数の生成 - My Life as a Mock Quant でやった内容の欠点とそれを補うためにもうちょっと高尚な手法である拡張アンサンブル法の1つ「レプリカ交換モンテカルロ法」を用いてやりましたよというお話。 シミュレーション条件・パラメーター設定に関しては適当なんで要考察。自分が扱いたい問題に応じてこれはやらないといけない。 通常のマルコフ連鎖モンテカルロ法(MCMC)での問題点 マルコフ連鎖モンテカルロ法(メトロポリス法)による混合ガウス分布に従う乱数の生成 - My Life as a Mock Quant でやった通常のいわゆるマルコフ連鎖モンテカルロ法を用いた「混合ガウス分布」からの乱数生成方法だと、2つのガウシアンのピーク(平均値)が離れているとうまくいかない。 実際に平均値を(-3,-3),(3,3)

    レプリカ交換モンテカルロ法(パラレル・テンパリング)による混合ガウス分布に従う乱数の生成 - My Life as a Mock Quant
    sh19910711
    sh19910711 2024/06/19
    "マルコフ連鎖モンテカルロ法を用いた「混合ガウス分布」からの乱数生成方法だと、2つのガウシアンのピークが離れているとうまくいかない / 離れたもう1つの混合ガウス分布のピークへ行くことができず" 2012
  • 階層性がある媒介モデル(マルチレベル媒介モデル)で間接効果をベイズ推定する - Qiita


     Stan Advent Calendar 2016 17  weightHRsalaryStan  - X - M - Y 170kg
    階層性がある媒介モデル(マルチレベル媒介モデル)で間接効果をベイズ推定する - Qiita
    sh19910711
    sh19910711 2024/06/18
    "選手はどこかの球団に所属しているので,やはり階層的なデータとみなす / 通常の回帰分析は,残差が独立であることを仮定しますが,データに階層性が存在する場合は,その前提が崩れる恐れ" 2016
  • みどり本の図10.4をStanで描画方法と信頼区間・予測区間 - Qiita

    はじめ 図10.4「生存種子数yの予測分布をstanで作成する」以降の予測区間の説明内容に誤りがあります、現在見直し中 自習用にstanを使い「データ解析のための統計モデリング(一般化線形モデル・階層ベイズモデル・MCMC)」の「10.3.3 階層ベイズモデルの事後分布推測と予測」の信頼区間と予測区間の求め方をまとめました 上記の章に出てくる図10.4「生存種子数yの予測分布$p(Y|β,s)$と観測データ」をstanで求める方法を初心者がまとめたものです 時間がある方は、このまとめより"StanとRでベイズ統計モデリング"を読むことを強くお勧めします http://www.kyoritsu-pub.co.jp/bookdetail/9784320112421 用語の確認 マルコフ連鎖モンテカルロ法(MCMC)を用いた統計モデリング言語です C++で実装 RとPythonのインターフェース

    みどり本の図10.4をStanで描画方法と信頼区間・予測区間 - Qiita
    sh19910711
    sh19910711 2024/06/18
    "あてはめ: 数理モデルに含まれるパラメータを観測データから推測 / 統計モデリング: その現象が発生する仕組みを知る + いままで得られたデータから未来(または過去)を予測する" 2017
  • ベイズ初心者でも分かるMCMC入門 - Qiita

    なかなかMCMCが理解できなかった自分がベイズ統計のや人から教えてもらってはじめて理解できた表現をまとめている自分用メモ。ベイズ統計の基は色々良いやサイトがあるので最低限に止めてます。初心者なので間違えにお気づきでしたら指摘頂けると助かります。 ベイズ統計学とは ベイズの定理というたった一つの公式から大抵の理論が導かれる P(θ)=事前確率、P(θ|D)=事後確率、P(D)=正規化定数(右辺の確率総和を1にしてくれる)、P(D|θ)=尤度 母数は確率変数(=分布を持っている)で、モデリングが必要 伝統的な統計学では母平均は確定している前提で特定の値が含まれる確率を考えたりしていたが、ベイズでは母平均が分布しているという考えを持つ 点数の分布がN(50,10)の試験で80点以上の人は何人いるか? MCMC(マルコフモンテカルロ連鎖法)とは ある確率分布から乱数を取り出すことにより、汎用

    ベイズ初心者でも分かるMCMC入門 - Qiita
    sh19910711
    sh19910711 2024/06/17
    "確率分布がわかってるのに何のために積分するのか / 分母の P(D) をとっぱらって、P(θ|D)はP(θ)P(D|θ) に比例していることまでは比較的簡単に分かります / 事後分布の形はなんとなく分かっている状態" 2016
  • Markov Chain Monte Carlo (MCMC)をpythonで実装し、大学生の睡眠時間を解析 - Qiita


    Sleep Offset  Wake Offset length1  使 Scatterplot使 0:00AsleepAwake23:00Awake3:3012:501:00 Scatterplot使 6:00AsleepAwake8:00
    Markov Chain Monte Carlo (MCMC)をpythonで実装し、大学生の睡眠時間を解析 - Qiita
    sh19910711
    sh19910711 2024/06/17
    "夜の12:00に寝ているかどうかはファジーなので夜の12:00に寝ている確率、と言い換えたほうが良さそう / 0:45ぐらいに50%をこえるのがわかります。つまり2日に1回は0:45以降になってようやく寝る、みたいな現象" 2019
  • 単回帰モデルを通してベイズ推定の流れとPystanの使い方を学ぶ - Qiita


    RStan  Rstan使PythonPystan使 稿 1.  2. MCMC 3. Pystan使 4.  Pystan使 0.   import numpy as np import matplotlib.pyplot as plt import pystan import arviz plt.rcParams["
    単回帰モデルを通してベイズ推定の流れとPystanの使い方を学ぶ - Qiita
    sh19910711
    sh19910711 2024/06/17
    "プロットするなどして、データの構造を掴み + データ生成過程の考察とStanコードの作成 / パラメータである𝜇について前もって知識がないときは、根拠不十分の原則に従って、とりあえず広い分布を考え" 2020
  • MCMCを素朴に実装しつつガンマ分布のパラメータを推定してみる - Qiita


     便2MCMCMarkov Chain Monte Carlo method""MCMCWinBUGSPyMC3  $k$$q$2
    MCMCを素朴に実装しつつガンマ分布のパラメータを推定してみる - Qiita
    sh19910711
    sh19910711 2024/06/17
    "観測データを集めた結果、その観測値の背後にあるであろう確率分布を、モデルに当てはめて推定してみたいという欲求が出てくる / 自分で作ることで色々見えてくるものもあり、理解が進むメリット" 2020
  • 基礎から分かる時系列分析 5.マルコフ連鎖モンテカルロ法(MCMC)(Stanで実装) - Qiita


    p({\bf x}_t|{\bf y}_{1:T})=p({\bf x}_t|{\bf y}_{1:T})\int\frac{p({\bf x}_{t+1}|{\bf x}_t)}{p({\bf x}_{t+1}|{\bf y}_{1:t})}p({\bf x}_{t+1}|{\bf y}_{1:T})d{\bf x}_{t+1} (MCMC) MCMCMCMC
    基礎から分かる時系列分析 5.マルコフ連鎖モンテカルロ法(MCMC)(Stanで実装) - Qiita
    sh19910711
    sh19910711 2024/06/17
    "カルマンフィルタはすべての確率変数が正規分布に従うと仮定することによって積分を行列計算に落とし込み解析的に分布を求める / MCMCは、求めたい分布からのサンプルを直接得て分布を推定する" 2021
  • スパース性を導入したベイズ線形回帰 - Qiita

    線形回帰の解がスパースである(0が多い)ことが事前にわかっているとき、 ベイズ線形回帰(Bayesian Linear Regression) において重みの事前分布に対して、 馬蹄分布(Horseshoe Distribution) を用いるのが一般的です。 正規分布などを事前分布に用いたベイズ線形回帰と比べて、馬蹄分布を事前分布に用いたベイズ線形回帰では、事後分布からのサンプリングには比較的複雑なコードが必要になります。 この記事では、 マルコフ連鎖モンテカルロ法(Markov chain Monte Calro method) のアルゴリズムの一つである ギブスサンプリング(Gibbs Sampling) を用いた、最も基的な馬蹄事後分布からのサンプリング方法を紹介します。 ベイズ線形回帰とスパース性 次のような線形回帰モデルにおいて、

    スパース性を導入したベイズ線形回帰 - Qiita
    sh19910711
    sh19910711 2024/06/17
    "スパース: 0が多いことが事前にわかっている / 𝑃(𝑍)から直接𝑍全体をサンプリングすることが難しい / Gibbs Sampling: 𝑍=(𝑍1, 𝑍2, …, 𝑍𝑀)のようにM個の部分集合に分けることによって逐次的に" 2022
  • StanでLDAをまわしてみた (自動微分変分推論) - Qiita

    はじめに LDAはトピックモデルと呼ばれる自然言語処理の分野で広く使われている数理モデルです。モデルの詳細は後ほど説明しますが、ざっくり言うと書かれた単語からその文章のトピックを複数推定するモデルです。 LDAのパラメータ推定には一般的にはRのtopicmodelsパッケージやPythonのgensimモジュールが使われることが多いですが、今回はモデルの拡張や仕組みの理解を目的として、stanでモデルをゼロから構築して推定することを試みます。 モデルの定義 コードは松浦さんのブログから借りてきました。ただし、stanのバージョンアップに合わせて、一部コードを修正しています。 data { int<lower=1> K; int<lower=1> M; int<lower=1> V; int<lower=1> N; int<lower=1,upper=V> W[N]; int<lower=1

    StanでLDAをまわしてみた (自動微分変分推論) - Qiita
    sh19910711
    sh19910711 2024/06/15
    "NUTSというアルゴリズムが有名ですが、MCMCだとLDAのようなパラメータの多いアルゴリズムでは推定にとてつもない時間が必要 / ADVI: ver.2.9からstanに搭載 + MCMCより精度は劣るものの高速" 2018
  • Bridge samplingでモデル比較実践:多項過程ツリーモデル - Qiita


    Stan Advent Calendar 20181224 😳💦🎄🎅Bayes Factor💏💑💕😱💦💦😢👺🤶🎄😦😢💔😖😭💔💦🙊💭R🌝Stan使Bayes Factor😘👦💕DM💐💌💖KO👊💥😳 Rsta
    Bridge samplingでモデル比較実践:多項過程ツリーモデル - Qiita
    sh19910711
    sh19910711 2024/06/15
    "Bayes Factor: 二つのモデルに対してどちらをデータが支持するかの程度を数量化したもの + モデル選択は慎重に / bridge_sampler()によって近似対数周辺尤度を算出 + bf()を用いることによってBayes Factorを計算" 2018
  • {lme4} 線形混合モデルの取り回し - Qiita


    (iris)3(Sepal.Width)(Petal.Length)3 (linerd mixed model) pdf {tidyr} nest使model_lmm_1R
    {lme4} 線形混合モデルの取り回し - Qiita
    sh19910711
    sh19910711 2024/06/15
    "種に共通した相関傾向を固定効果、そこからの種ごとの変動をランダム効果として取り扱い / ggplot: 修飾部分つけるとごちゃごちゃした見た目になって、慣れていないと読むのがツライものがあります" 2019
  • {rstan} 線形混合モデルをベイズで書いてみる - Qiita

    MCMC(*´Д`)ハァハァ — MrUnadon (@MrUnadon) 2017年9月1日 ちょっと前ですが、TokyoRでベイズ特集回をやった事があります。 その際に、ベイズ統計の基礎という大げさなタイトルでトークをしました。 トークは基礎的(理論的)な話だけでしたので、これはRとstanを使った実践編という感じです。 環境設定 # libraryにattachしておく library(tidyverse) # データ加工 library(rstan) # MCMCハァハァ library(patchwork) # 図を並べる library(lme4) # おまけ # rstanのchainを並列計算させる呪文 rstan_options(auto_write=TRUE) options(mc.cores=parallel::detectCores())

    {rstan} 線形混合モデルをベイズで書いてみる - Qiita
    sh19910711
    sh19910711 2024/06/15
    "「MCMCが収束する=良いモデル」というのは大変危険で、それをいうなら上に挙げた「単なる線形回帰」も収束している / 単なる線形回帰モデルのAICは、LMMのAICより明らかにデカいので「良くない」と判断" 2019
  • Rの構造方程式モデリングで数値データの関係性を可視化する - Qiita

    R初心者ですが、Rで構造方程式モデリング(共分散構造分析)をやってみます。 構造方程式モデリングを使うことで、重さや長さなどの直接観測可能な因子のみならず、 「先高感」「ブランドイメージ」などのように直接測定出来ない特性である構成概念(潜在因子)を含めて 各因子間の相関関係の強弱を可視化することができます。 多変量データに潜む共通因子を探り出すための手法である因子分析と 予測を行う重回帰分析を同時に行うことができるのが特徴です。 具体的にどのような用途に使えるかというと、 KGIに紐づく、多数のKPIがあるような場合にKPI間の相関関係の強弱をモデリング(図示化)することができるため、 今後の企業戦略を決定する際にどのKPIに注力すればよいかの参考になります。 参考:マッチングサービスにおけるKPIの話 Rのインストール 以下のサイトからお使いのOS(Windows, OSX, Linux

    Rの構造方程式モデリングで数値データの関係性を可視化する - Qiita
    sh19910711
    sh19910711 2024/06/15
    "直接測定出来ない特性である構成概念(潜在因子)を含めて各因子間の相関関係の強弱を可視化する / KGIに紐づく、多数のKPIがあるような場合にKPI間の相関関係の強弱をモデリング(図示化)することができる" 2019
  • ガウス過程に基づく分類モデルの学習ノート - Qiita


      Gaussian Processes for Machine Learning (http://www.gaussianprocess.org/gpml/chapters/) 3 Classification Expectation propagation Linear Models for Classification $x$$y=1$$S(x^tw)$$(y=\pm1)$ $S()$$f=x^tw$ $S(-f)=1-S(f)$$y=-1$$S(-x^tw)$ $w$$N(0,\Sigma_p)$ 
    ガウス過程に基づく分類モデルの学習ノート - Qiita
    sh19910711
    sh19910711 2024/06/15
    "Linear: 事後分布を求めて、予測モデルから積分消去 / Gaussian Process: 計算が困難なため、事後分布𝑝(𝑓|𝑋,𝑦)を正規分布で近似 / 事後分布の対数値の最大値を求めて、これを中心とする二次のテーラー展開" 2019
  • lavaanとRstanによる構造方程式モデリングの基本 - Qiita


     使 RlavaanRstan      SEM 
    lavaanとRstanによる構造方程式モデリングの基本 - Qiita
    sh19910711
    sh19910711 2024/06/15
    "構造方程式モデリング: lavaanパッケージを用いてモデリングが可能ですが、構造方程式モデリングの理解を深めるために、Rstanを用いたベイズ推定 / 潜在変数を導入し、潜在変数と観測変数との間の因果関係等を同定" 2019
  • 予測性と説明性を両立した一般化加法モデルとGA2M - Qiita


       KDD2019Microsoft()  GA$^2$M 
    予測性と説明性を両立した一般化加法モデルとGA2M - Qiita
    sh19910711
    sh19910711 2024/06/15
    "医療分野で予測モデルを作成した際には、予測精度と共に説明性が求められることが多く、その時に一般化加法モデルが有用 / 一般化線形モデルでの線形予測子を、非線形な関数の和としたモデル" 2019