検索結果

このウィキでページ「単語文書行列」は見つかりませんでした。以下の検索結果も参照してください。

ベクトル空間モデル (単語文書行列の節)
{3}\\t_{1}&0&2&1\\t_{2}&1&1&2\\t_{3}&0&0&3\\\end{pmatrix}}} 文書diに単語tjがn回出現するとき、wijをnとし、行列を形成する。単純に出現回数を利用する以外にtf-idf等のアルゴリズムによって得た重みを用いる生成方法がしばしば行われる。…

2キロバイト (193 語) - 2022年9月12日 (月) 03:13
自然言語処理
形態素解析構文解析語義の曖昧性解消照応解析現状発達している言語AI技術は、多次元のベクトルから、単語や文書の意味の近さを、その相互関係から推定しているもので、「AIの言語理解」は「人間の言語理解」は根本的に別物である。…

15キロバイト (2,085 語) - 2024年6月19日 (水) 00:32
単純ベイズ分類器 (例: 文書分類の節)
単純ベイズ分類器を文書分類問題に適用した例を示す。文書群をその内容によって分類する問題であり、例えば、電子メールをスパム (C=0) とスパムでないもの (C=1) に分類する。文書は、単語群としてモデル化できるいくつかのクラスから取り出されるものとする。ここで、文書のi番目の単語 w i {\displaystyle…

16キロバイト (2,895 語) - 2023年3月21日 (火) 20:56
潜在意味解析 (出現行列の節)
では、各文書における用語の出現を表した文書-単語マトリクスが使われる。これは各行が各単語に対応し、各列が各文書に対応した疎行列である。この行列の各成分の重み付けには tf-idf (term frequency–inverse document frequency) が用いられることが多い。この場合、行列…

18キロバイト (3,062 語) - 2024年3月31日 (日) 14:44
テキストマイニング
テキストマイニング︵英: text mining︶は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節などの単位で区切り、それらの出現の頻度や共出現の相関、共起関係、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。計算的テキスト分析︵computational…

10キロバイト (1,439 語) - 2024年3月8日 (金) 06:32
転置インデックス
転置インデックス︵てんちインデックス、Inverted index︶とは、全文検索を行う対象となる文書群から単語の位置情報を格納するための索引構造をいう。転置索引、転置ファイル、逆引き索引などとも呼ばれる。情報処理テクノロジにおける転置インデックスとは、単語や数字といった内容から、それが含まれているデータベースやドキュメント…

8キロバイト (1,179 語) - 2023年6月3日 (土) 12:18
情報検索
行列として扱い特異値分解を行い、得られた直交低次元ベクトル空間上検索を行う。単純なベクトル空間モデルでの検索に比べて、同義語が用いられている文書間の関連を反映し、検索の対象のデータの内容的な偏りに影響を受けにくい検索を行うことができるというメリットがある。文書検索全文検索概念検索…

19キロバイト (2,616 語) - 2024年3月10日 (日) 15:48
日本語の表記体系 (カテゴリ表語文字)
加えて、横書きの文書ではアラビア数字が普通は用いられる。ラテン文字はアクロニムや国際単位系の単位等に用いられる。ひらがな、カタカナのいずれでも、全ての日本語の単語を表記することができる。ローマ字でも"書く"ことは客観的に可能であるが、あくまでも音写でしかない。また、殆どの単語…

47キロバイト (5,101 語) - 2024年3月16日 (土) 03:20
庭訓往来
・頭書などに、様々な教材を載せたものが出現した。例えば、生花心得・詩歌・小謡・文書様作法・商売往来・筆を取る方法・筆づかい・十二月異名など。初歩教材総合教科書と形容したくなるような体裁をとっている。﹁注釈本系﹂は、単語や短句、文意について、﹁注﹂の形で解説を試みたものである。1834年﹃庭訓往来…

5キロバイト (845 語) - 2022年5月22日 (日) 10:49
自動要約 (カテゴリ文書作成ソフト)
文書を要約の対象として、それらから単一の要約を作成するものである。典型的には、Googleニュースなどのニュース・アグリゲーターによって収集された同一事件に関する記事の集合を入力として、それらの簡潔な要約を作成するものである。抽出的要約は、要約の対象となる文書に含まれる単語…

8キロバイト (1,194 語) - 2023年7月1日 (土) 21:02
朝鮮人の人名
単語である可能性もあり、この言葉は漢字でそれぞれ王を表記して姓、建てると書いて名を作ったことだとすれば、韓国の王氏は、中国の王氏とは漢字は同じだが、関連は全くない姓である。下の名前︵個人名︶は一般的に2文字からなる。伝統的に、うちの1字は中国由来の慣習である行列…

33キロバイト (4,428 語) - 2024年6月9日 (日) 17:47
スプーリング
他のスプールとは異なり、メールやニュースのスプールは通常、個々のメッセージ単位の参照が可能である。 ^ ﹁一般の単語と化した頭字語(バクロニム)﹂(英語:backronym)だと考える人もいる。 ^ bit 編集部﹃bit 単語帳﹄共立出版、1990年8月15日、117頁。ISBN 4-320-02526-1。 ^ J…

5キロバイト (680 語) - 2022年4月30日 (土) 01:38
チャットボット
倣された）では、入力された会話文から手がかりとなる単語やフレーズを認識し、それに対応するあらかじめ用意された、あるいはプログラムされた応答を出力することで、一見して有意義な形で会話を進めることができる。たとえば「MOTHER（お母さん）」という単語を含む入力に対して、「TELL ME MORE ABOUT…

60キロバイト (7,006 語) - 2024年7月2日 (火) 16:24
Mathematica
初等関数、特殊関数、数論、群論のライブラリ複素数、任意精度、区間演算、記号計算のサポート連続的/離散的計算のための数値と記号のツール疎行列を含む行列とデータの操作ツール常微分方程式 (ODE)、偏微分方程式 (PDE)、微分代数方程式（英語版） (DAE)、遅延微分方程式（英語版）…

66キロバイト (6,214 語) - 2024年3月8日 (金) 16:18
BERT (言語モデル)
を出力するべきである。この訓練プロセスの結果、BERTは、文脈における単語や文の潜在的表現︵英語版︶を学習する。事前訓練後、BERTをより小さなデータセット上でより少ないリソースでファインチューニングし、NLPタスク︵言語理解、文書分類︶や、シーケンス変換︵英語版︶に基づく言語生成タスク︵質問応答、…

21キロバイト (2,595 語) - 2023年12月30日 (土) 09:09
語義の曖昧性解消
Word-sense disambiguation︶とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。自然言語の単語には複数の語義が存在する場合がある。たとえば動詞﹁やる﹂には以下のような異なった語義が存在する:…

2キロバイト (232 語) - 2024年6月24日 (月) 01:19
バビロン
― 遺跡の発掘、メソポタミアの他の地域で発見された楔形文字文書、聖書、古代の文書︵とりわけヘロドトス︶における記述、あるいは︵クテシアスやベロッソスなどの文書の︶引用による文書など ― をつなぎ合わせても、その完全な実像に迫ることは難しい。史料同士が相互に矛盾さえし…

120キロバイト (16,088 語) - 2024年3月25日 (月) 14:48
言語モデル
言語モデル︵げんごモデル、英: language model︶は、単語列に対する確率分布を表わすものである。言語モデルは、長さがm個の単語列が与えられたとき、その単語列全体に対しての確率 P ( w 1 , … , w m ) {\displaystyle P(w_{1},\ldots ,w_{m})}…

26キロバイト (3,499 語) - 2023年12月29日 (金) 22:26
ホサナ
行列が、祭壇の周りを巡りながら朗唱する。このとき朗唱するのは﹃詩篇﹄118篇25節と別の祈祷文を合わせたものであり、それを Hoshanot と呼ぶ。Hoshanot は、hosha na が名詞化して﹁懇願﹂を意味する単語となった Hoshana…

9キロバイト (1,096 語) - 2022年4月23日 (土) 10:42
Feature Hashing
行列の(i, j)成分は文書iのj番目の単語の頻度(または重み)を表す(行列の行と列の役割を逆にする見方もあるが、この違いは重要ではない)。このような行列は一般的に非常にスパースである。訓練あるいはその前段階にいて、訓練データの単語集合に対して辞書表現を作り、単語…

11キロバイト (1,504 語) - 2022年11月21日 (月) 14:38

ウィキソースより
初等科國語六/漢字の音と訓
六﹄(1943年) 出典‥国立国会図書館デジタルコレクション:info:ndljp/pid/1277112/1/60 註: この文書ではルビが使用されています。ここでは﹁単語︵ルビ︶﹂の形で再現しています。一部の古いブラウザでは、ルビが正しく見えない場合があります。
すべての結果を見る
ウィキブックスより
初級システムアドミニストレータ/コンピュータシステム
クトップ型、ノート型、タブレット型など、さまざまな形態があります。特徴比較的安価で入手しやすい用途に合わせて拡張性が高いインターネット接続や文書作成、ゲームなど、さまざまな用途に利用できる高性能なCPUやグラフィックカードなどを搭載し、専門的な作業に適したコンピュータです。特徴
すべての結果を見る