TL;DR ベクトル検索だと、複数のステップを踏まないと答えられない質問の検索がむずい 「TomにEmil Eifrém(Neo4jのCEO)を紹介してくれる人は?」とかを検索むずい ナレッジグラフは構造化データと非構造化データをうまく扱えてベクトル検索の苦手を補える 課題はあるけどナレッジグラフは、Neo4jとLangchainで構築できるよ。 はじめに 今回はベクトル検索の苦手分野をどうしても補ってあげたいとおもっている筆者やまぐちが、ベクトル検索の苦手を補ってあげられるナレッジグラフに関してまとめていこうと思います。 少々長い記事ですが、ベクトル検索を労ってあげたいと思っている方はぜひ読んでください。 ベクトル検索の限界 以前の記事の最後にも少しだけ記載しましたが、ベクトル検索は以下の問題点があります。 必要な情報がTop Kのドキュメントには含まれていない可能性がある。 チャンクの
様々な資料ではデータをわかりやすく示すためグラフが用いられています。 グラフで示されているデータを他のデータと比較したり、表示の方法を変更したりしたくなることがありますが、元データが入手できない場合は画像からデータを抽出する必要があります。 目盛りをみながら手で数字にしていくのは大変な作業ですがWebPlotDigitizerというウェブアプリをつかうと比較的簡単にデータを抽出することができます。 使い方 WebPlotDigitizerは折れ線グラフ、棒グラフなどに対応しています。 今回は例として折れ線グラフからデータを抽出してみます。基本的な使い方は他のグラフでも同じです。 下記リンク先の「Launch App!」をクリックするとアプリの画面が開きます。 WebPlotDigitizer - Extract data from plots, images, and maps 画像の読み
金曜プレミアム・池上彰緊急スペシャル https://t.co/Vb4jiYsTjc 前回 | 2016年12月16日(金) 19:57~22:52 放送 格差はなぜ世界からなくならないのか▽貧しい人がますます貧しく...深刻データ語る日本の格差 pic.twitter.com/g9AFUJHW6Y — 不破雷蔵(懐中時計) (@Fuwarin) 2016年12月17日 12月16日にフジテレビ系列で放送されたという「金曜プレミアム・池上彰緊急スペシャル 格差はなぜ世界からなくならないのか▽貧しい人がますます貧しく...深刻データ語る日本の格差」という番組で使われた、日米の所得に絡んだグラフ。そのものの画像や映像は権利関係があるので(引用の領域をこえるとの判断が成される可能性はある)直接の提示は止めておくけれど、どうも印象操作的なグラフの使われ方がされたとの指摘が多数挙がっている。 それを
世界中で話題になっているパナマ文書。各国で政権を揺るがすような事態にもなっていますが、純粋にデータとしてみた場合、これは計算機やデータ解析に関わる人々にも面白いものだと思います。データの中身や背景などについてはさんざん報道されていますのでここでは触れません。一方、現場でどのような作業が行われているのかはあまり報道されていません。現実的な問題として、人力ではどうしようもない量のリークデータを手に入れた場合、調査報道機関はどんなことを行っているのでしょうか?私も以前から疑問に思っていたのですが、先日あるデータベース企業と、データ分析アプリケーションを作成する会社のブログにて、その実際の一端を窺うことができる投稿がありました: Panama Papers: How Linkurious enables ICIJ to investigate the massive Mossack Fonseca
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く