並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 224件

新着順 人気順

オープンデータの検索結果41 - 80 件 / 224件

  • 法務局の地図データをネットで無料公開へ…不動産取引で使用、これまでは有償(読売新聞オンライン) - Yahoo!ニュース

    斎藤法相は20日の記者会見で、全国の法務局にある地図データを23日からネット上で無料公開すると発表した。国や自治体が調査した正確なデータの一般利用を促進し、民間事業者のコスト削減やスマート農業への利用などにつなげたい考えだ。 日本郵政、デジタル地図事業に参入へ…変化を随時反映する「生きた地図」作り 各法務局の地図は、土地の位置や区画が記されており、不動産取引の際に使われている。これまでは法務局やネット上で有償で限られた区域の地図を一つ一つ取得する必要があった。

      法務局の地図データをネットで無料公開へ…不動産取引で使用、これまでは有償(読売新聞オンライン) - Yahoo!ニュース
    • 超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた

      東京に拠点を置くテクノロジー企業「レアゾン・ホールディングス」が、1万9000時間に及ぶ国内最大級の日本語音声コーパス「ReazonSpeech」を無償公開しました。同時に、OpenAIが開発した超高性能音声認識AI「Whisper」に匹敵する性能をアピールする文字起こしサービスも公開されていたので、実際に使ってみました。 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開 - Reazon Human Interaction Lab https://research.reazon.jp/news/reazonspeech.html ReazonSpeech - Reazon Human Interaction Lab https://research.reazon.jp/projects/ReazonSpeech/ レアゾン・ホールディングスは「R

        超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた
      • 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開

        株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日 株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。 プロジェクトwebサイト:https://

          超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
        • Amazon.co.jp: 記者のためのオープンデータ活用ハンドブック: 熊田安伸: 本

            Amazon.co.jp: 記者のためのオープンデータ活用ハンドブック: 熊田安伸: 本
          • 画像生成AI「Stable Diffusion」などの開発に大きな貢献を果たした超巨大データセット「LAION-5B」とは?

            AIを構築する上ではアルゴリズムだけでなく訓練用のデータセットも重要であり、データセットの質によってAIの精度も大きく左右されます。高精度な画像生成AIとして話題のStable Diffusionでは、「LAION-5B」という50億以上もの画像とテキストのペアを含むデータセットを用いています。 LAION-5B: A NEW ERA OF OPEN LARGE-SCALE MULTI-MODAL DATASETS | LAION https://laion.ai/blog/laion-5b/ 大規模な機械学習モデルやデータセット、関連コードなどの一般公開を掲げる「Large-scale Artificial Intelligence Open Network(LAION)」というドイツの非営利団体は、2022年3月に超巨大なデータセットである「LAION-5B」をリリースしました。LAI

              画像生成AI「Stable Diffusion」などの開発に大きな貢献を果たした超巨大データセット「LAION-5B」とは?
            • Amazonのデータセットで始める商品検索

              この記事は 情報検索・検索技術 Advent Calendar 2022 の7日目の記事です。 はじめに 今年の夏、Amazonが多言語 (英語、スペイン語、そして日本語) のラベル付きの商品検索のデータセットを公開しました。 論文: https://arxiv.org/abs/2206.06588 リポジトリ: https://github.com/amazon-science/esci-data 情報検索において商品検索は、ウェブ検索を作りたいという企業より商品検索を作りたい企業の方が多いという意味で、ポピュラーなトピックだと思います。ところが公開データで実験を行おうとするとドメインが違うウェブ検索のデータセットか、ラベルのない商品カタログか、ラベルはあるけど小規模なデータセットかという限られた選択肢しかなく、仕方がないので非公開の独自データセットを作って実験を行うという状況でした。

                Amazonのデータセットで始める商品検索
              • DFFT|デジタル庁

                DFFTとはDFFT(Data Free Flow with Trust:信頼性のある自由なデータ流通)とは、「プライバシーやセキュリティ、知的財産権に関する信頼を確保しながら、ビジネスや社会課題の解決に有益なデータが国境を意識することなく自由に行き来する、国際的に自由なデータ流通の促進を目指す」というコンセプトです。DFFTは、2019年1月にスイス・ジュネーブで開催された世界経済フォーラム年次総会(ダボス会議)にて、安倍総理(当時)が提唱し、2019年6月のG20大阪サミットにおいて各国首脳からの支持を得て、首脳宣言に盛り込まれました。 安倍総理大臣による世界経済フォーラム年次総会演説(外務省) 最近の取組G7 産業・技術・デジタル大臣会合の開催結果 2024年3月14日及び15日に、イタリア・ヴェローナ及びトレントにおいて、G7産業・技術・デジタル大臣会合が開催され、河野デジタル大臣

                  DFFT|デジタル庁
                • Wikipediaの記事をすべてダウンロードしていつでもオフラインで閲覧&検索する方法

                  日本語の記事だけでも130万件以上、全言語を総合計すると5870万件以上にもなるオンライン百科事典「Wikipedia」の記事をすべてダウンロードし、オフラインで手軽に閲覧・検索する方法をブロガーのポール・ウィリアム氏が解説しました。 How To Download All of Wikipedia onto a USB Flash Drive in 2022 https://planetofthepaul.com/wikipedia-download-usb-flash/ Wikipediaはさまざまな原則の下で記事のダウンロードを許可しており、Wikipediaはダウンロードに際してはデータベースのダンプ方式を用いるよう呼びかけています。 Wikipediaの全記事のファイルサイズは英語版で95GB、日本語版でも20GBはあるため、これより大きなサイズのドライブを用意しておきます。US

                    Wikipediaの記事をすべてダウンロードしていつでもオフラインで閲覧&検索する方法
                  • 情報学研究データリポジトリ メルカリデータセット

                    株式会社メルカリが国立情報学研究所を通じて研究者に提供しているデータセットです。 2023/09/01 更新 データ概要 フリマ商品データ 株式会社メルカリが運営する,スマートフォン向けフリマアプリ「メルカリ」へ登録されたデータで,個人を特定する情報や非公開情報は含まれません。 具体的なデータの内容は以下の通りです。 アプリ上に公開されている商品データ(出品状態,商品名,商品の説明,販売価格,カテゴリ,商品の状態,サイズ,ブランド,送料の負担,発送の方法,発送元の地域,発送にかかる日数,いいね!の数,コメントの数,出品日時,更新日時) 各商品ページにて公開されているコメントデータ 各商品ページにて公開されている画像データ(対象全商品のサムネイル画像/一週間分のオリジナル画像) 提供中のデータは2020年1月~12月の1年間に出品された商品が対象です。(データは随時更新される予定です) 商品

                    • 第6回「東京都における都市のデジタルツイン社会実装に向けた検討会」 杉本臨時委員提出資料

                      "I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)

                        第6回「東京都における都市のデジタルツイン社会実装に向けた検討会」 杉本臨時委員提出資料
                      • 「3Dデジタル生物標本」1400点以上、九大が公開 ダウンロード自由、メタバースでも利用可

                        九州大学は8月26日、3Dモデル化した生物標本1400点以上をオンライン公開した。被写体をさまざまな角度から撮影し3Dモデル化する手法「フォトグラメトリ」を使い、水生生物など700種以上1400点のデジタル標本を作成したという。ライセンスはCC BY 4.0で、誰でも自由にダウンロードや配布が可能。 九州大学持続可能な社会のための決断科学センターの鹿野雄一特任准教授が開発した、生物標本を対象としたフォトグラメトリ手法「バイオフォトグラメトリ」を使い、3Dモデルを作成した。これまで生物学分野ではフォトグラメトリはあまり活用されず、CTスキャナーやMRIでの内部構造のモデル化が主流だったという。 生物標本は、分類学や生態学などの研究を進める上で重要な役割を担う。しかし、いくら厳重に管理しても標本の劣化や退色は免れず、利用の際に紛失や損傷のリスクも付きまとう。そのため、近年多くの博物館では、標本

                          「3Dデジタル生物標本」1400点以上、九大が公開 ダウンロード自由、メタバースでも利用可
                        • 無償で利用できる「約16万件の口コミデータ」 マイスタースタジオとNIIが提供

                          情報・システム研究機構国立情報学研究所(NII)は2022年8月18日に、マイスタースタジオが運営する口コミサイト「みん評」の口コミデータ「みんなの評判口コミデータセット」を研究用データセットとして無償提供すると発表した。 マイスタースタジオとNIIは、同日に「学術研究分野向けのデータ提供」で提携しており、今回のデータ提供はその活動の一環となる。データは、NIIのデータセット共同利用研究開発センターが運営する情報学研究データリポジトリを通じて提供される。 約16万件の口コミデータを利用可能 みん評は、多様な商品やサービスを取り上げ、実際にそれらを利用した消費者による口コミを収集しているサイト。4000を超える商品やサービスの口コミが約22万件投稿されている。今回提供されるデータセットは、2017年1月16日~2022年7月12日にみん評に投稿された約4700の商品やサービスに対する約16万

                            無償で利用できる「約16万件の口コミデータ」 マイスタースタジオとNIIが提供
                          • 約16万件の商品・サービスの口コミデータ、NIIが無償提供 自然言語処理などの研究向けに

                            口コミのジャンルは「引越し」「保険」「旅行」「美容」「資格」など暮らしに密接したものを用意。NIIは「肯定的・否定的コメントのいずれも、具体性や根拠をもった口コミを収載していることを特徴としている」とし、自然言語処理分野などでの利用を想定する他、主観的な評価スコアと組み合わせた分析も可能としている。 NIIでは2015年4月にデータセット共同利用研究開発センターを設置。データサイエンス研究のため、さまざまな民間企業や研究機関が持つ各種データセットを受け入れ、研究者に提供する「情報学研究データリポジトリ」事業に取り組んできたという。今回の取り組みもその一環に当たる。 関連記事 「ディープフェイク」を見破るプログラム、NIIが開発 圧縮された映像でも一定の信頼性 国立情報学研究所が、ディープフェイクを見破るプログラムを開発した。WebAPIとして提供するため、同プログラムを組み込んだWebサー

                              約16万件の商品・サービスの口コミデータ、NIIが無償提供 自然言語処理などの研究向けに
                            • 野球好きとデータ好きのためのStatcastデータ入門 - スポーツデータ解析の第一歩 - Lean Baseball

                              【2022/8/13更新】打球位置のプロット例を追加しました(解説ブログのリンクを含む) プライベートの時間はウイニングポスト9*1で自家生産の馬を育てるか, 野球データと戦っている人です. 野球のデータは見れば見るほど面白いです, どれぐらい面白いかと言うと「10年見ても飽きない*2」それぐらい面白いです(個人の感想です). それはさておき, 私はメジャーリーグのデータを使って調べ物をしたりなにかのテーマに取り組む時, 以下のデータセットを用いています.*3 Lahman’s Baseball Database. 年度別のチーム・選手成績など, ある程度まとまった単位のデータ. GitHubから取得可能(https://github.com/chadwickbureau/baseballdatabank). Retrosheet. 試合・打席ごとの成績データ. GitHubから取得可能(

                                野球好きとデータ好きのためのStatcastデータ入門 - スポーツデータ解析の第一歩 - Lean Baseball
                              • PLATEAUから街の構造を見る - estie inside blog


                                 estieestie8 8/10  PLATEAU PLATEAU3D 3DUnityVR使 3D PLATEAU LT 01 - connpass 3D PLATEAU LT 02 - connpass estie
                                  PLATEAUから街の構造を見る - estie inside blog
                                • 無料で使える航空写真とOpenDroneMapを利用して、あなたの街の3Dデータ(点群)を作成する! - Qiita

                                  (今回作っていく広域点群データの完成図です) 3Dデータを有効に可視化したい PLATEAUのデータを利用することで、地図 + 地形データの上に詳細な建物データを配置するなど3Dデータを活用したリッチな表現が比較的簡単に出来るようになりました。 が、3Dモデルはテクスチャ(ビルの外観など)を貼り付けるとWeb地図上ではかなーり動作が重たくなってしまう上、モデルが整備されていない・もしくは整備されているが、詳細な形状がモデリングされておらず四角い箱になっていたり、テクスチャが存在しなかったりする都市だと、こんな感じでちょっと寂しい絵面になってしまいます。 そこに、詳細な色付き点群データを利用して乗っけると一気にリッチな感じになりますね! 詳細な広域3Dメッシュモデルがテクスチャ付きで整備されていれば、それを利用すれば良い話ではあるのですが、全国分整備するにはお金も時間もかかります。 なので、

                                    無料で使える航空写真とOpenDroneMapを利用して、あなたの街の3Dデータ(点群)を作成する! - Qiita
                                  • シェアサイクルのオープンデータ、GBFS形式で公開~公共交通オープンデータ協議会 「ドコモ・バイクシェア」「HELLO CYCLING」の場所・利用可能台数

                                      シェアサイクルのオープンデータ、GBFS形式で公開~公共交通オープンデータ協議会 「ドコモ・バイクシェア」「HELLO CYCLING」の場所・利用可能台数
                                    • スマートニュース、国会議案データベースを無償公開 過去20年分をGitHubで

                                      スマートニュースは7月1日、国会の過去20年分以上の議案データ約1万8000件を収集・整理し、オープンデータ化した国会議案のデータベースを、GitHubで無償公開(衆議院、参議院)した。GitHubを利用しない人向けに、閲覧用のWebページ(衆議院、参議院)も公開した。 国会で審議された法案や予算案、条約、決議案といった議案は、衆参両議院のWebサイトに掲載されている。提出者や審議された委員会、賛成・反対した政党(衆院のみ)などの情報も確認できるが、国会の回次ごと、また議案ごとにページが分かれているため、集計や検索、一覧が難しかった。 今回、同社の「メディア研究所」が、各議案のページに掲載されている情報を収集、整理し、CSVファイルとJSONファイル形式で公開。MITライセンスに準拠し、商用・非商用を問わずオープンデータとして誰でも無償で使えるようした。 主に報道機関や研究者に、選挙報道や

                                        スマートニュース、国会議案データベースを無償公開 過去20年分をGitHubで
                                      • 広島県 インフラマネジメント基盤 DoboX

                                        • 自転車シェアリングのオープンデータを公共交通オープンデータセンターより提供開始

                                          公共交通オープンデータ協議会(会長 : 坂村 健 INIAD 東洋大学情報連携学部 学部長)は、公共交通オープンデータセンターを通じて、株式会社ドコモ・バイクシェアおよびOpenStreet株式会社(ハローサイクリング)が提供する自転車シェアリングのデータ(ポートの位置情報や、各ポートで利用可能な自転車の台数)を、オープンデータとして提供開始しました。 公共交通オープンデータ協議会には、首都圏の多数の公共交通事業者や ICT 事業者が参画し、公共交通データのオープンな流通のためのエコシステム創生に向けた活動を行っています。2019 年 5 月より公共交通オープンデータセンターの運用を開始し、鉄道、バス、航空、フェリー等、様々な公共交通のデータを、 ICT 事業者や一般の開発者に提供してきました。この度の取組みでは、自転車シェアリングに関するデータを、国際的に用いられているマイクロモビリティ

                                          • G空間情報センター

                                            © 2016 - 2022 Association for Promotion of Infrastructure Geospatial Information Distribution. All Rights Reserved.

                                            • GitHub - jim-schwoebel/voice_datasets: 🔊 A comprehensive list of open-source datasets for voice and sound computing (95+ datasets).

                                              AESDD - around 500 utterances by a diverse group of actors (over 5 actors) simlating various emotions. ANAD - 1384 recording by multiple speakers; 3 emotions: angry, happy, surprised. Arabic Speech Corpus - The Arabic Speech Corpus (1.5 GB) is a Modern Standard Arabic (MSA) speech corpus for speech synthesis. The corpus contains phonetic and orthographic transcriptions of more than 3.7 hours of MS

                                                GitHub - jim-schwoebel/voice_datasets: 🔊 A comprehensive list of open-source datasets for voice and sound computing (95+ datasets).
                                              • Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット

                                                Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット:AI・機械学習のデータセット辞典 データセット「Iris」について説明。150件のあやめの「表形式データ(花びら/がく片の長さと幅の4項目)」+「ラベル(3種類のあやめの分類)」が無料でダウンロードでき、多クラス分類問題などのディープラーニングや統計学/データサイエンスに利用できる。scikit-learnとTensorFlowにおける利用コードも紹介。

                                                  Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット
                                                • Japanese Fake News Dataset | Taichi Murayama

                                                  Overview Fake news has caused significant damage to various fields of society, e.g., economy, politics, and health problems. To counter this problem, various fake news datasets have been constructed. These existing datasets have focused almost exclusively on the factuality aspect of the news. Can we fully understand “fake news” and various events it causes based on these datasets given factuality

                                                    Japanese Fake News Dataset | Taichi Murayama
                                                  • GitHub - BandaiNamcoResearchInc/Bandai-Namco-Research-Motiondataset: This repository provides motion datasets collected by Bandai Namco Research Inc

                                                    This repository provides motion datasets collected by Bandai Namco Research Inc. Find here for a README in Japanese. There is a long-standing interest in making diverse stylized motions for games and movies that pursue realistic and expressive character animation; however, creating new movements that include all the various styles of expression using existing methods is difficult. Due to this, Mot

                                                      GitHub - BandaiNamcoResearchInc/Bandai-Namco-Research-Motiondataset: This repository provides motion datasets collected by Bandai Namco Research Inc
                                                    • AI研究開発用3Dモーションデータセットを無料で公開 | 株式会社バンダイナムコ研究所

                                                      株式会社バンダイナムコ研究所(以下、バンダイナムコ研究所)は、AI技術(機械学習と深層ニューラルネットワーク分類技術など)の研究開発に使用できる3Dモーションデータセットを、4月28日よりGitHubにて無料公開いたします。 バンダイナムコ研究所では、メタバース及びxR技術など三次元モーションを使用する研究開発を手がけています。現在、ゲームや映像に登場するCGキャラクターは、事前にアクターの方々に演技していただき、その動きをデータ化し再現させるモーションキャプチャ技術や、専門のクリエイターが手作業により制作することがほとんどです。 しかし、今後メタバースをはじめとしたコンテンツの規模が拡大すると、個性的なキャラクターや多彩なモーションが必要不可欠になり、従来の制作過程では限界を迎えることが予想されます。 一方、このようなAIを用いたモーション研究開発は、性別や動作、演技といった様々なパター

                                                      • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                                                        ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                                                          バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                                                        • GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
                                                          • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

                                                            2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

                                                            • ベース・レジストリのパイロット事業における実証サイトの公開を開始しました|デジタル庁

                                                              デジタル庁では、本日2022年4月22日(金)より、ベース・レジストリのパイロット事業として進めているレジストリカタログとアドレス・ベース・レジストリの実証サイトの公開を開始しました。 ベース・レジストリとは、公的機関等で登録・公開され、様々な場面で参照される、人、法人、土地、建物、資格等の社会の基本データであり、正確性や最新性が確保された社会の基盤となるデータベースです。(ベース・レジストリの詳細についてはベース・レジストリをご参照ください) 行政手続のワンスオンリーを実現するなど社会全体の効率性の向上を図るとともに、スマートシティ等の新しいサービスの創出を図るためには、マイナンバーや地理空間情報など社会全体の基盤となるデータを整備・活用することが必要です。 そこで、まずはベース・レジストリを、「公的機関等で登録・公開され、様々な場面で参照される、人、法人、土地、建物、資格等の社会の基本

                                                                ベース・レジストリのパイロット事業における実証サイトの公開を開始しました|デジタル庁
                                                              • 全国130万件の交通事故マップ-みえない交差点-プレミアムA:朝日新聞デジタル

                                                                人身事故が起きた全国130万件分の地点を日本地図に置き、あなたの近くに潜む危険な場所を可視化しました。各地の小さな交差点で交通事故が多発していることも明らかに。

                                                                  全国130万件の交通事故マップ-みえない交差点-プレミアムA:朝日新聞デジタル
                                                                • 個人投資家向けデータAPI配信サービス「J-Quants API」(ベータ版)の提供及びアーリーアダプター募集のお知らせ | 日本取引所グループ

                                                                  2022/04/05 JPX総研 個人投資家向けデータAPI配信サービス「J-Quants API」(ベータ版)の提供及びアーリーアダプター募集のお知らせ 株式会社JPX総研(以下「JPX総研」という。)は、プロジェクト”J-Quants”(以下、「本プロジェクト」という。)にて、データサイエンスに興味のある個人の方向けに、ITやデータ分析を活用した取引を促進するための環境を提供しております。本プロジェクトの一環として、昨年開催した株式データ分析コンペティションにおいて提供したヒストリカル株価・財務等のデータAPI配信が好評だったことを踏まえ、この度、J-Quants API(ベータ版)(以下、「本サービス」という)として提供することといたしましたのでお知らせいたします。 本サービスは、本番稼働前のベータ版として無償で提供することとし、ベータ版参加ユーザの皆様の声を反映させながら本番サービ

                                                                    個人投資家向けデータAPI配信サービス「J-Quants API」(ベータ版)の提供及びアーリーアダプター募集のお知らせ | 日本取引所グループ
                                                                  • ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話|NHK取材ノート

                                                                    東京の多摩川沿いの浸水リスクがある地域で、「なぜか人口が増えている」ことをデータ分析ソフトを使って明らかにして、その背景を探りました。 次にこんな記事も書きました。 南海トラフ巨大地震によって津波の浸水が想定されている区域で、高齢者の施設がすごく増えていることを示した記事です。 どちらの記事も、誰もが入手できる「オープンデータ」と、後述する「GIS」という分析システムを使って隠れた事実を浮き彫りにした、データジャーナリズムのお手本などと紹介されたこともあります。 そしてつい最近手がけたのがNHKスペシャル「〝津波浸水域〟の高齢者施設」。蓄積してきた分析のノウハウを注ぎ込んだ番組です。 「データ分析」というと専門的で、すごく難しく思う方もいるかもしれません。しかし最初に述べたように私は数年前までは、パソコンを満足に使えない、データ分析とは無縁の「ガラケー記者」だったのです。本当に。 そんな私

                                                                      ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話|NHK取材ノート
                                                                    • TechCrunch

                                                                      Welcome, folks, to Week in Review (WiR), TechCrunch’s weekly news recap. The weather’s getting hotter — but not quite as hot as the generative AI space, which saw a slew of new model

                                                                        TechCrunch
                                                                      • オープンアクセスなデータの課題(文献紹介)

                                                                        2022年2月5日付で、医学誌“The Lancet”の399巻10324号に、短報“The challenges of open access data”が掲載されています。著者は英・ケンブリッジ大学のCarol Brayne氏らです。 短報では、アイルランドの研究プロジェクト“The Irish Longitudinal Study on Ageing”(TILDA)内において、TILDAが公開しているデータセットを利用した研究に関する調査が行われ、深刻な課題が特定されたことを紹介しています。 まず、いくつかの文献において、データの特性に対する不十分な理解、または分析におけるサンプリング方法等の不適切さが明らかになったこと等が報告されています。さらにソフトウェアの進歩によって、ハーキング(結果が判明した後に仮説を提示すること)の実践が容易になると述べられています。逆の順序で仮説を設計す

                                                                          オープンアクセスなデータの課題(文献紹介)
                                                                        • 新型コロナワクチンの接種状況に関するオープンデータ仕様 / ワクチン接種記録システム(VRS)

                                                                          概要新型コロナワクチンの接種状況を、オープンデータとして一般公開しています。本ドキュメントは、その配信およびデータ構造に関する仕様書です。 以下の種類のオープンデータを提供しております。 なお、接種実績データは毎日1回更新されていますが、オープンデータの更新タイミングはダッシュボードと同時ではありません。 オープンデータ形式説明

                                                                          • 機械学習の回帰データとしては、ボストン住宅価格データではなく、カリフォルニア住宅価格データを使おう

                                                                            結論・サンプルコード 回帰のデータセットが欲しい場合、ボストンデータセットではなく、カリフォルニアデータセットを使いましょう。 ソースコード from sklearn.datasets import fetch_california_housing california_housing = fetch_california_housing() train_x = pd.DataFrame(california_housing.data, columns=california_housing.feature_names) train_y = pd.Series(california_housing.target) train_x.head() train_y.head() 結果 0 4.526 1 3.585 2 3.521 3 3.413 4 3.422 背景 ボストン住宅価格データはポリ

                                                                              機械学習の回帰データとしては、ボストン住宅価格データではなく、カリフォルニア住宅価格データを使おう
                                                                            • 交通事故統計情報のオープンデータ|警察庁Webサイト

                                                                              「世界最先端デジタル国家創造宣言・官民データ活用推進基本計画」(令和2年7月17日閣議決定)に基づき、交通事故統計情報のオープンデータを公開しています。 データの概要、ファイル定義書、各種コード表、利用規約をご理解の上、ご活用ください。 なお、公表しているデータは公開時最新のものですが、後日新たな事実が判明した場合等にはデータの修正が行われる場合があります。その際、公開データを修正することはありませんので、別途公表している統計表と相違することがあります。 概要・利用規約 ・交通事故統計データの概要 ・利用規約

                                                                              • 総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート

                                                                                総務省は1月11日、データサイエンスのオンライン講座「誰でも使える統計オープンデータ」を、MOOC講座プラットフォーム「gacco」で開講した。社会人・大学生に、統計オープンデータを活用したデータ分析の手法を解説する講座で、3月7日まで受講できる。 週約3時間×4週間の内容。政府統計の総合窓口「e-Stat」、総務省と統計センターが提供する統計GIS、API機能などを使い、データ分析の手法を学べる。 講師は「統計学が最強の学問である」の著書で知られる統計家の西内啓氏や、総務省統計局の担当者など。 2017年6月に初開講して以来、断続的に開講し、のべ約2万8000人が受講した講座。 関連記事 政府が「ワクチン接種状況ダッシュボード」公開 性別や都道府県別に可視化 政府が、全国の新型コロナワクチンの接種状況を一覧にまとめた「ワクチン接種状況ダッシュボード」を公開。統計情報をまとめたCSVやJS

                                                                                  総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート
                                                                                • 京都大学図書館機構 - 【図書館機構】2021年度京都大学図書館機構講演会「オープンデータとしての学術論文」

                                                                                  京都大学図書館機構は、京都大学重点戦略アクションプラン「オープンアクセス推進事業」の活動の一環として国際シンポジウム「オープンデータとしての学術論文」を開催します。 オープンデータは「制度面ならびに技術面における再利用性が確保された情報公開の枠組み」と認識されており、学術論文の制度面における再利用性の確保については、オープンアクセス運動で広く取り組まれてきています。一方、学術論文の技術面における再利用性の確保、すなわち機械可読性の実装については、タイトル、著者といった一部のメタデータでは実現されていますが、学術論文のその他の要素では十分に実現されていません。 本講演会では、「オープンデータとしての学術論文」に向けて、学術論文の参考文献リスト、本文という要素に注目した機械可読性の実現についての取り組みを紹介します。学術論文の参考文献リストのオープンデータ化、すなわちオープン・サイテーションに