[B! language] myrmecoleonのブックマーク

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった（CloseBox） | テクノエッジ TechnoEdge

仮想的なシステムであり、実際の普及は想定されていない。言語学習や異文化コミュニケーションのツールとしての可能性がある。結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提

myrmecoleon 2024/07/20

素直に英語か「やさしい日本語」使おうよ。誰にも正確な表記わからないような言語、覚えても使える場所ないよ。

リンク

「確率的なオウム」にできること、またそれがなぜできるのかについて

九州大学大学院人文情報連係学府（仮称・設置認可申請中）学際シンポジウムシリーズ「接続する人文学：テクストを計算する」 https://dh.kyushu-u.ac.jp/research/ 2024年7月

myrmecoleon 2024/07/11

リンク

生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

かなり前から「ChatGPTに学術論文を（英語で）書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告！📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。（限界助教先生の記事

myrmecoleon 2024/06/01

リンク

ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

まえがきミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか？それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。目次まえがき目次凡例この記事で使う名称についてビルマ語表記コードポイントラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯複雑なビルマ文字ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装実装の方針文字の並べ替えをせず、左から右に書く文字の形のバリエーション

myrmecoleon 2023/12/20

勉強になる。日本の漢字や他の文字もUnicode収録ではそれぞれの苦労があったようなので、それぞれの言語にこういうのあるんだろうな。

リンク

化学を「ばけがく」と読むみたいな言葉一覧・完全版

科学と化学が、同じようなシーンで使うのに、どっちも﹁かがく﹂という読みであり、伝えにくい……こういうことって、よくありますよね。でも、大丈夫。化学の方を﹁ばけがく﹂とわざと読む読み方があるんです！これは便利！こういう言葉って他にどんなのがあるのか気になったので、調べてみた。﹁説明読み﹂と言われているらしい化学と科学が紛らわしいので、化学の化をわざと訓読みして、ばけがくと読むみたいな言葉。ウィキペディアを調べると﹁説明読み﹂と呼ばれているらしい。︵武部良明﹁二字漢字語の音訓読み分けについて﹂︶正しい読みかたではないけれど、紛らわしさをさけるため、わざと読みを変える。すぐ思いつくのは、私立と市立の読み分け。私立を﹁わたくしりつ﹂、市立を﹁いちりつ﹂と読み替える例だろう。テレビのニュースなどでは、なんの説明もなく﹁わたくしりつの学校で〜﹂というふうに普通に読み上げるので、もはやこ

myrmecoleon 2023/10/19

language

リンク

【追記あり】「〜なんよ」がとても不快

==== 追記 ==== 書いた直後に全然反応がなかったのに、今見たら色々コメントがついていて驚きました。ブコメを読んだら、結構な数の人が怒っていて、私の中の善良な市民感覚が、「悪いことをしてしまった」という後悔の念を自然と抱かせましたが、落ち着いて考え直してみると、別にそう悪いわけでもないなという気もしています。とりあえず、これが率直なところです。色々とコメントをもらったので、いくつか返答します。・「不快」で他人の発言を抑圧しようとするのを表現規制って言うんじゃなかったっけ・自分の意思にそぐわないからと言って他人の言動を制限しようという発想かー。上手くいきそう？・自分の不快感のために他人の自由を制限できると思ってるんかな・不快に思うのは勝手だが、人の発話の自由を制限しようとするのは何様のつもりだろうと思うし、方言の利用を咎めることも更に最悪って感じがする（私は方言コスプレをポ

myrmecoleon 2023/10/17

千鳥全然見てないんだけど確認したら2008年くらいから使ってるなあ自分。口頭では一切使わないので方言とかではない。何に影響されたのかは意識ないが、何かしらのネットミームかな。

language

リンク

糖尿病の新呼称案は英語の「ダイアベティス」…専門家「普及難しいのでは」

︻読売新聞︼　日本糖尿病協会などが、糖尿病への偏見をなくすため、糖尿病の英語表記である﹁ダイアベティス﹂という呼称を用いる案をまとめ、近く公表する。﹁尿﹂の字を含む病名に抵抗感を示す患者の声を踏まえた対応だが、医師ら専門家からは﹁分

myrmecoleon 2023/09/22

わかりづらい語は略されるのが通例なので、ダイアベとかアベとか略されて「何々さんアベだから」とか不要な誤解を巻き起こしそう。

リンク

「マッチングアプリ」と同じイントネーションの言葉ってなくない？

色々考えたけど、なさそう。無理やり考えたのが以下の言葉。・バッティングだるい・ピッチング悪い・ブラッシング歯茎・クッキングたぬき何かある？

myrmecoleon 2023/06/13

発禁すら不意

リンク

「視覴」の謎

ChatGPTが﹁視覴﹂という新語を発明したらしいことをフガクラさんのツイート︵2023-06-08 08:51:02 JST︶で知る。すでに﹁視覴﹂は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである︵1件だけ2020年のページがあるが、最近修正されたものかどうか不明︶。映像・音声編集におけるノーマライズの重要性！︵2023-05-11︶﹁視覴的・聴覚的な一貫性﹂﹁視覴的な効果を最大化﹂﹁視覴的な混乱を避け﹂︵2回︶なお、このページは現在消えて視覴とは？AI︵ChatGPT︶が出力した新しい言葉なのか？︵2023-06-08︶にリダイレクトされ、﹁弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、﹁視覚﹂の誤

myrmecoleon 2023/06/12

AI時代の音便、あるいは読み間違いによる新語（独壇場とか）的なものを感じるよね。

リンク

おいしい→おいしそう〜！楽しい→楽しそう〜！じゃあ「かわいい」はどうすれば？→様々な案が寄せられる

柊マグネタイト @hiiragi_magne ・「かわいそう〜！」 ← 別の意味になる・「かわいいだろうな〜」 ← なんか違う。転校生が女子で、現役アイドルらしいっていう噂がクラスで流れたときにモブが言ってそう・「おそらくかわいい」 ← 含みがありそう。なんか失礼。何様感・「絶対かわいいじゃん！」 ← ニュアンスとしては近い 2023-05-22 22:11:43

myrmecoleon 2023/05/24

おいしいと楽しいは体験への表現で未体験で目前にある場合にも起こるが、かわいいは見た瞬間発生するので、目の前にない前提の表現、たとえば「かわいいらしい」（伝聞）が妥当かな。「赤そう」と言わないようなもの

language

リンク

文字コード | 衆議院議員河野太郎公式サイト

2023.05.10 官報に使われる﹁官報文字﹂というものがあります。そこには渡辺さんの﹁辺﹂の異体字が１４０文字も登録されています。日本語の常用漢字には２１３６文字ありますが、そこには邉や邊などは入っていません。そこでＪＩＳの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55，２７０文字もあります。全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した﹁文字情報基盤﹂を２０１１年に策定し、それにあわせたフォントを作成し、無償で提供しています。この﹁文字情報基盤﹂︵ＭＪ︶には、58，８６２文字が含まれています。しかし、このＭＪを全庁的に採用している自治体は、川口

myrmecoleon 2023/05/11

大事な仕事だ

リンク

【追記あり】外国語の単語＋る、で動詞として定着している単語

思いついたところ＋ちょっと調べた範囲で。他にあったら適宜追加します。単語元の単語備考サボるサボタージュ（sabotage）前方一致ダブるダブル（double）発音一致ハモるハーモニー（harmony）前方一致ググるグーグル（google）ググレカスパニクるパニック（panic）後方追加ディスるディスリスペクト（disrespect）前方一致ミスるミス（miss）後方追加トラブるトラブル（trouble）発音一致デコるデコレート（decorate）前方一致メモるメモ（memo）後方追加バズるバズ（buzz）後方追加スペるスペランカー（spelunker）前方一致発音一致：単語と元の単語の発音が一致している前方一致：元の単語の後方が省略され「る」が付加されている後方追加：元の単語にそのまま「る」が付加されている =========以下追記分========= ブコメとコメントから拾い

myrmecoleon 2023/04/11

定着してるかわからないけど、る言葉という呼び方があるみたいね。 https://www2.ninjal.ac.jp/conversation/event/pdf/sympo2019_1.pdf

リンク

iモード、企業戦士、コギャル――三省堂、消えた言葉だけ集めた辞書を発売

iモード、オート三輪、企業戦士、コギャル――三省堂は、こうした時代の変化によって使われなくなった言葉だけを集めた「三省堂国語辞典から消えたことば辞典」を発売した。価格は2090円。辞書としてだけでなく、昭和レトロや平成レトロを楽しめる商品として注目度アップを狙う。

myrmecoleon 2023/04/07

面白い

リンク

古代バビロニアの文章を解読できるAIを開発。ギルガメシュ叙事詩の一部や賛歌を解読 : カラパイア

ドイツのルートヴィヒ・マクシミリアン大学︵LMU︶の研究チームは、古代バビロニアの楔形文字の難しい文章を解読できるAIシステムを開発した。﹁Fragmentarium﹂というこのアルゴリズムは、ギルガメッシュ叙事詩を含む、人類がこれまでに書いたもっとも古い物語の断片をつなぎ合わせて解読することができるという。 LMUでは、2018年から、現存しているバビロニアの楔形文字の石板すべてをデジタル化するプロジェクトを行っている。

myrmecoleon 2023/02/17

リンク

旦那って言い方がおぞましすぎる

なんでみんなこれに疑問を抱いていないのかわからない。旦那って何？配偶者の女性は奴隷かなんかですか？旦那って主従関係の時に使う言葉だよね？なんで平然と結婚した夫婦に使ってるの？なんで当たり前みたいに男が﹁上﹂なの？店で﹁旦那様﹂と言う店員にも腹立つし、自分から配偶者の男のことを﹁うちの旦那が﹂と言ってるのも気持ち悪くて仕方ない。この意見言うと﹁気にしすぎだ﹂って言う阿保が沢山出てくるのも腹立つ。こうした無意識のミソジニーが積み重なって男尊女卑が続いてるのが日本だろうが。結局、こういう言葉を気にせず使う／修正しようともしない時点で、日本の男や一部女性達は男尊女卑を変える気がないんだなって絶望する。一生奴隷扱いでいい、そういう烙印なんだと思う。

myrmecoleon 2023/01/26

旦那は本来仏教語でお布施とか檀家とかとほぼ同じ、お金を出してくれるパトロンのことなんだよな。主従関係とはちょっと違う。贈与が原義でドナーとかドネートとかが同系統。悪く言うと「財布」。

language

リンク

もし「リーダブルコード」を弁護士が読んだら？ - MNTSQ Techブログ

こんにちは。﹁リーダブルコード﹂を先月読破して、感銘を受けた弁護士の人です。なにに感銘を受けたかというと、﹁エンジニアが高級言語を効率的にコーディングするための工夫﹂は、契約という言語をコーディングするために援用できることがとても多いということです。例えば、リーダブルコードは﹁関数には空虚な名前︵tmpとかretvalとか︶でなく、エンティティの実体に即した名前をつけよう！﹂と提案しています。これめっちゃわかります！！！なぜなら、契約言語では当事者というクラスの表現のために﹁甲﹂﹁乙﹂という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも﹁一定のインプットを入れると、必ず一定のアウトプット

myrmecoleon 2022/12/27

リンク

三大同じ単語なのにカタカナ英語で区別されてるやつ

セカンドとセコンドあと二つは？

myrmecoleon 2022/08/03

オランダ語のletter（レッテル）を挙げる人ばかりで、ラベル／レーベル／レイブル（紋章学）を挙げてる人がいないのはなんでだろう（いずれも英語のlabel）。／関連して調べて知ったがタグとタッグ（tag）も同じ語らしい

リンク

「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」は誤り - 古代漢字学習ブログ @kanji_jigen

﹁カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから﹂という説があります。以下のように、現在販売されている漢和辞典にも掲載されています。象形。からすの形にかたどる。からすはからだが黒く、目がどこにあるかわからないので、﹁鳥﹂の字の目にあたる部分の一画を省いた。借りて、感嘆詞、また、疑問詞に用いる。 ――﹃角川新字源﹄改訂新版、角川書店2017年、p824 烏は鳥の目玉を表す部分である﹁－﹂を省いた形。 ――﹃漢字源﹄改訂第六版、学研2019年、p1152 しかし、この説は誤りです。この説は金文の研究が盛んになるより以前に提唱されましたが、清代に金石学︵金文研究︶が発達したおかげで誤りであることがわかりました。すなわち、古文字学︵古代の漢字を研究する学問分野︶の世界では100年以上前に否定された説です。漢和辞典に掲載されているいわゆる﹁漢字の成り立ち﹂

myrmecoleon 2022/08/01

リンク

NDL Ngram Viewer | NDLラボ

サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ（以下「キーワード」といいます。）の出現頻度を可視化・列挙することができるサービスです。可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。具体的な内訳は次の通りです図書及び雑誌約230万点（約17億種類のキーワード) 図書約97万点（約8.5億種類のキーワード) 雑誌約132万点（約8.9億種類の

myrmecoleon 2022/05/31

リンク

ウクライナ首都は「キーウ」欧米メディア、表記変更広がる

ウクライナの首都キエフにある聖ソフィア大聖堂とボフダン・フメリニツキーの像︵2022年2月28日撮影︶。(c)Sergei SUPINSKY / AFP ︻3月3日 AFP︼ウクライナ首都の名前は﹁キエフ﹂か、それとも﹁キーウ﹂か──？ロシアのウクライナ侵攻を受け、欧米メディアの間では、同市の表記をロシア語由来の﹁キエフ︵Kiev︶﹂からウクライナ語の﹁キーウ︵Kyiv︶﹂に変更する動きが広まっている。英BBCに続き、今週には仏日刊紙リベラシオン︵Liberation︶も表記変更を発表した。リベラシオンは1日の発表で、読者が慣れている都市名の表記変更は難しいと認めつつも、政治的理由を優先して表記変更を決めたと説明。キエフという呼称は﹁ウクライナの地名のロシア化を象徴するものとなった﹂と指摘し、BBCが1月29日からキーウと表記するなど、英語圏の主要メディアの大半も表記を変更していること

myrmecoleon 2022/03/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (334)

languageに関するmyrmecoleonのブックマーク (705)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス