比較言語学における統計的研究法の可能性について

寺田寅彦




 ()()()The
 ()()
 
 ()()()()()()
 ()()西
 ()()()
 
 ()()()()西
 ()()()()沿()()
 ()()調西西
  Homo Sapiens ()()
 ()()()()()()()()()()()()()()()
 dr
W(r, t)dr = 1/4πDt[#「1/4πDt」は分数]e-r2/4Dt[#「2」は上付き小文字、「r2/4Dt」は分数、「-r2/4Dt」は「e」の上付き]dr
であり、中心から同時に出発した分子総数がNであれば、この時点にこの地帯に来るものの数は NW(r, t)dr である。しかしこれらの分子が放射物質のように自然崩壊をするものとすれば、この数はtについて指数函数的しすうかんすうてきに減じるので
Ne-λt[#「-λt」は「e」の上付き]W(r)dr
であるとすべきであろう。さすれば距離rにおける密度は、これを 2πrdr で除したもので、これをσとすれば
σ(r, t) = N/8π2Drt[#「2」は上付き小文字、「N/8π2Drt」は分数]e-(r2/4Dt[#「2」は上付き小文字、「r2/4Dt」は分数]+λt)[#「-(r2/4Dt+λt)」は「e」の上付き]

 
 ()彿()
 
 ()()gradient
 
 Method of successive approximation
 ()()
 
 ()()()()()()()()()()()()()()()()()()()
 ()()
  Van Hinloopen Labberton ()()()Whymant 
 ()()()()西
 調西
 

beat butu
laugh walahu
flat filattai
hollow hola
new nii
fat futo
easy yasasi
clean kilei
ill walui
rough araki
hard katai
angry ikari
anchor ikari
tray tarai
soot susu
mattress musiro
etc. etc.

 ()()()()()
  Chikaranga ()()

 zhou
 hovev_181-2
 shiri
 huro

 gajah chiri ()()()() halq 西 gorge, throat, Hals  gal※(マクロン付きA小文字)  tair. t182-6()() hou lung
 () Kalisan.  Calzoni
 
 ()()()()() haikara () susi ()()()() kettu  vene () koivu 
 ()()
 ()()νν = 1/n 1/n()() a1 a2 a3  b1 b2 b3  biνi2i4i 22sii sii ()()()()()()()()
P = s1a1b1ν + s2a2b2ν2 + s3a3b3ν3 + ……[# s、a、b に続くアラビア数字はすべて下付き小文字、νに続くアラビア数字はすべて上付き小文字]
で与えられるはずである。この中に出現するs、a、b、νの各数はともかくも統計的になんとかして求められうる性質のものである。
 以上はできるだけ事がらを簡単に考えた考え方である。これ以上にだんだん試験的、近似的仮定を修正して、少しずつ実際の場合に近づけて行く事も、原理上からの困難はなく、ただ次第に計算が込み入るだけである。しかし、今のところ、あまりに込み入った計算では実用にならないから、できるならば簡単な形で進みたい。
 それで第一の試みとしては、まず前記のいちばん簡単な場合になるべく適合するように、材料のほうを選定し排列する事である。それはたとえば両国語の適当な語彙から比較に不適当な分子、たとえば本質的でないと思わるる接頭語、接尾語などを整理し(もちろんこれにはある仮定を要するが、それが tentative method として許容される事は、いわゆる精密科学においても同様である。そしてこの仮定には従来言語学者の苦心研究の結果が全部有効に利用されるはずである。)そうしてそれについて上記のabを出し、sは「近似的平均値」を推定して導入する。ここでいちばん困難なはABのnを同一に整理する事であるが、これにもいろいろの方法がある。たとえばA日本語とB英語の場合ならば、まず日本語のほうを、かりに「日本式ローマ字」で書く、しかして英語子音の「文字」の中で日本式にないものはかりに後者のどれかで「置換」する。たとえばcやqを皆kに直す類である。複子音も同様である。xなどは省いても、何かで置換しても統計の結果の値にはたいした影響は与えない事は明らかである。アラビアなどとなると、だいぶこの置換が困難な問題となるが、しかしたとえば喉音こうおんのあるものは半数だけkかg、残り半数をhで代用するというような試験的便法を取って第一歩を進める事もできる。(ここに統計的方法の長所があるとも言われる。)またたとえばマライ語の場合ならば ber, mer, per などのプレフィックスのrを省いてみるとか、中間のngを省いてみるとかする事も試みてよいわけである。
 かくのごとき試験的テンタティヴの整理によって、ともかくも両国語の子音がそれぞれかりに十四になったとする。次にかりに a1 a2 a3 a4 b1 b2 b3 b4[#アラビア数字はすべて下付き小文字] がいずれも1/4[#「1/4」は分数]で a5 b5[#「5」はすべて下付き小文字] 以上は零とし、s1 s2 s3 s4[#アラビア数字はすべて下付き小文字] が平均皆4だと仮定すると
siaibi[#「i」はすべて下付き小文字] = 1/4[#「1/4」は分数], i = 1, 2, 3, 4.
P = 1/4[#「1/4」は分数](1/14[#「1/14」は分数] + 1/142[#「2」は上付き小文字、「1/142」は分数] + 1/143[#「3」は上付き小文字、「1/143」は分数] + 1/144[#2つめの「4」は上付き小文字、「1/144」は分数])
1/14[#「1/14」は分数] = 0.07144444
1/142[#「2」は上付き小文字、「1/142」は分数] = 0.00510204
1/143[#「3」は上付き小文字、「1/143」は分数] = 0.00036443
1/144[#2つめの「4」は上付き小文字、「1/144」は分数] = 0.00002603
P = 0.07693694[#「P = 0.07693694」は上線( ̄)付き]÷4≒0.0192

 
 
a1 = b1 = 0; a2 = a3 = b2 = b3 = 4/10; a4 = b4 = 2/10[#アルファベットに続くアラビア数字はすべて下付き小文字、「4/10」「2/10」は分数]
∴ P = 4(0.16×1/142[#「2」は上付き小文字、「1/142」は分数]+0.16×1/143[#「3」は上付き小文字、「1/143」は分数]+0.04×1/144[#2つめの「4」は上付き小文字、「1/144」は分数])
= 4×0.0008756≒0.0035
すなわちわずかに〇、四プロセント弱ぐらいに減じてしまうのである。
 なお、もしも、シノニムの数が、上記4の二倍であるとすれば、以上の百分値はやはり二倍になるだけであるから、このほうから結果の桁数オーダーに著しい影響は起こらない。
 次に特別な場合として、邦語をかな一つ一つに切り離し、その一つ一つと音韻の似た原語と同義のシナ文字を求め、それを接合して説明をするという、普通よくあるやり方をするとどうなるか。この場合は、a1 b1[#「1」はすべて下付き小文字] いずれも1で他は零となるから
P = s1a1b1[#「1」はすべて下付き小文字]1/14[#「1/14」は分数] = s1[#「1」は下付き小文字]×0.0714
 s11  s11 5 s11 
 187-9()()
 ()()ν()()5
1/5[#「1/5」は分数] = 0.2; 1/52[#「2」は上付き小文字、「1/52」は分数] = 0.04; 1/53[#「3」は上付き小文字、「1/53」は分数] = 0.008; 1/54[#「4」は上付き小文字、「1/54」は分数] = 0.0016
 a1 = b1 = 0; a2 = b2 = a3 = b3 = 4/10; a4 = b4 = 2/104/102/10 P = s×0.007744 4
 
 
 ()()()()()()
 ()()
 ()()()()
 ()()
 ()()()()()()()()()()()()()
 ()()
 殿()殿()
 ()()()()()()
 

  便()()()()
 







底本:「寺田寅彦随筆集 第二巻」小宮豊隆編、岩波文庫、岩波書店
   1947(昭和22)年9月10日第1刷発行
   1964(昭和39)年1月16日第22刷改版発行
   1997(平成9)年5月6日第70刷発行
※底本の誤記等を確認するにあたり、「寺田寅彦全集」(岩波書店)を参照しました。
入力:(株)モモ
校正:かとうかおり
2000年10月3日公開
2003年10月30日修正
青空文庫作成ファイル:
このファイルは、インターネットの図書館、青空文庫(http://www.aozora.gr.jp/)で作られました。入力、校正、制作にあたったのは、ボランティアの皆さんです。




●表記について