![技術ブログで長くPVを稼ぐ 4つの記事パターン - astamuse Lab](https://cdn-ak-scissors.b.st-hatena.com/image/square/bfa4d7795e7ff4d39855b0319aa206da09afe037/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fa%2Fastamuse%2F20210106%2F20210106211214.jpg)
この記事は 自然言語処理 Advent Calendar 2020 の25日目の記事です。 こんにちは、rinoguchi です。今年の4月に こちらの記事 を書いて以来、半年ぶりの投稿になります。 当社では、特許・研究課題・論文など多くの知的財産データを保持しています。これらのデータを活用するには、データに含まれる同一組織・同一人物に対して同一IDを付与してデータをグルーピングすることが必要であり、この作業のことを名寄せと呼んでいます。 今回はこの名寄せの仕組みについて紹介したいと思います。 大まかな処理フロー 当社では名寄せ処理を、まずそれぞれのデータソース(例えば特許や論文など)の中で実行し、次に異なるデータソース間で実行することで、最終的に組織ID・人物IDに対して特許・研究課題・論文などを紐づけたデータを生成しています。 とはいえ、データソース内名寄せもデータソース間名寄せも仕組
ご挨拶 新年、明けましておめでとうございます 本年もよろしくお願いいたします データエンジニアのaranです 昨年の6月以来、2回目の登場になります 去年の1月に入社して、ちょうど1年経ち 月日の流れの早さを感じています いきなりですが、皆様は年末年始をどのように過ごされましたでしょうか? 私は、家族の1人が、1月2日誕生日なこともあり 年始は、家族全員が本家に集まります 月日の経過と共に、甥っ子・姪っ子も増え、彼らも歳を重ねて行くので 年始の出費が、年々厳しくなっています (財布から諭吉がいっぱい消えてゆく・・・涙) 年始の出費が気にならないぐらい稼ぎたいって心に誓い、新年を過ごしました 前書き 前回はコレスポンデンス分析についてお話しさせて頂きましたが 今回は、BERTを使った文章検索についてお話しさせて頂きます 何でまた? 弊社では、特許情報を取り扱っていて ある特定の業界・分野の特
こんにちは。アプリケーションエンジニアの池田 (@yukung) です。 今年の NBA Finals 🏀は Toronto Raptors の優勝で幕を閉じましたね! Golden State Warriors の 3 peat (3連覇) への挑戦も夢には届かず… Warriors ファンにとっては怪我人が多発して不運な形で終わってしまい残念な結果になってしまいましたが、カナダに初めてのチャンピオンリングがもたらされたことからも、ここ数年のウォリアーズの黄金時代から NBA の時代が変わろうとしていることに未だ興奮冷めやらない池田が、今回のブログ記事をお届け致します! さて、今回は私が関わっているあるプロダクトにおける開発フローについてご紹介したいと思います。 アスタミューゼにおける開発フロー アスタミューゼには、既に運用に入ってるもの、新規構築中のものを含めて複数のプロダクトがあり
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く