タグ

関連タグで絞り込む (334)

タグの絞り込みを解除

languageに関するmyrmecoleonのブックマーク (705)

  • 日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) | テクノエッジ TechnoEdge


      Japhalbet使Japhalbet JaphalbetJaphalbet Japhalbet
    日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) | テクノエッジ TechnoEdge
    myrmecoleon
    myrmecoleon 2024/07/20
    素直に英語か「やさしい日本語」使おうよ。誰にも正確な表記わからないような言語、覚えても使える場所ないよ。
  • 「確率的なオウム」にできること、またそれがなぜできるのかについて

    九州大学大学院 人文情報連係学府(仮称・設置認可 申請中)学際シンポジウムシリーズ「接続する人文学:テクストを計算する」 https://dh.kyushu-u.ac.jp/research/ 2024年7月

    「確率的なオウム」にできること、またそれがなぜできるのかについて
  • 生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

    かなり前から「ChatGPTに学術論文を(英語で)書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。 もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告!📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。 (限界助教先生の記事

    生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ
  • ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

    まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか? それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。 目次 まえがき 目次 凡例 この記事で使う名称について ビルマ語表記 コードポイント ラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯 複雑なビルマ文字 ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装 実装の方針 文字の並べ替えをせず、左から右に書く 文字の形のバリエーション

    ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ
    myrmecoleon
    myrmecoleon 2023/12/20
    勉強になる。日本の漢字や他の文字もUnicode収録ではそれぞれの苦労があったようなので、それぞれの言語にこういうのあるんだろうな。
  • 化学を「ばけがく」と読むみたいな言葉一覧・完全版


    使  便 調  調   
    化学を「ばけがく」と読むみたいな言葉一覧・完全版
  • 【追記あり】「〜なんよ」がとても不快

    ==== 追記 ==== 書いた直後に全然反応がなかったのに、今見たら色々コメントがついていて驚きました。 ブコメを読んだら、結構な数の人が怒っていて、私の中の善良な市民感覚が、「悪いことをしてしまった」という後悔の念を自然と抱かせましたが、落ち着いて考え直してみると、別にそう悪いわけでもないなという気もしています。とりあえず、これが率直なところです。 色々とコメントをもらったので、いくつか返答します。 ・「不快」で他人の発言を抑圧しようとするのを表現規制って言うんじゃなかったっけ ・自分の意思にそぐわないからと言って他人の言動を制限しようという発想かー。上手くいきそう? ・自分の不快感のために他人の自由を制限できると思ってるんかな ・不快に思うのは勝手だが、人の発話の自由を制限しようとするのは何様のつもりだろうと思うし、方言の利用を咎めることも更に最悪って感じがする(私は方言コスプレをポ

    【追記あり】「〜なんよ」がとても不快
    myrmecoleon
    myrmecoleon 2023/10/17
    千鳥全然見てないんだけど確認したら2008年くらいから使ってるなあ自分。口頭では一切使わないので方言とかではない。何に影響されたのかは意識ないが、何かしらのネットミームかな。
  • 糖尿病の新呼称案は英語の「ダイアベティス」…専門家「普及難しいのでは」


     尿尿尿尿
    糖尿病の新呼称案は英語の「ダイアベティス」…専門家「普及難しいのでは」
    myrmecoleon
    myrmecoleon 2023/09/22
    わかりづらい語は略されるのが通例なので、ダイアベとかアベとか略されて「何々さんアベだから」とか不要な誤解を巻き起こしそう。
  • 「マッチングアプリ」と同じイントネーションの言葉ってなくない?

    色々考えたけど、なさそう。 無理やり考えたのが以下の言葉。 ・バッティングだるい ・ピッチング悪い ・ブラッシング歯茎 ・クッキングたぬき 何かある?

    「マッチングアプリ」と同じイントネーションの言葉ってなくない?
    myrmecoleon
    myrmecoleon 2023/06/13
    発禁すら不意
  • 「視覴」の謎


    ChatGPT2023-06-08 08:51:02 JST Web使ChatGPT12020 2023-05-112AIChatGPT2023-06-0820233AI
    myrmecoleon
    myrmecoleon 2023/06/12
    AI時代の音便、あるいは読み間違いによる新語(独壇場とか)的なものを感じるよね。
  • おいしい→おいしそう〜! 楽しい→楽しそう〜!じゃあ「かわいい」はどうすれば?→様々な案が寄せられる

    柊マグネタイト @hiiragi_magne ・「かわいそう〜!」 ← 別の意味になる ・「かわいいだろうな〜」 ← なんか違う。転校生が女子で、現役アイドルらしいっていう噂がクラスで流れたときにモブが言ってそう ・「おそらくかわいい」 ← 含みがありそう。なんか失礼。何様感 ・「絶対かわいいじゃん!」 ← ニュアンスとしては近い 2023-05-22 22:11:43

    おいしい→おいしそう〜! 楽しい→楽しそう〜!じゃあ「かわいい」はどうすれば?→様々な案が寄せられる
    myrmecoleon
    myrmecoleon 2023/05/24
    おいしいと楽しいは体験への表現で未体験で目前にある場合にも起こるが、かわいいは見た瞬間発生するので、目の前にない前提の表現、たとえば「かわいいらしい」(伝聞)が妥当かな。「赤そう」と言わないようなもの
  • 文字コード | 衆議院議員 河野太郎公式サイト


    2023.05.10 使   JIS X 0213 使55  58 
    文字コード | 衆議院議員 河野太郎公式サイト
  • 【追記あり】外国語の単語+る、で動詞として定着している単語

    思いついたところ+ちょっと調べた範囲で。 他にあったら適宜追加します。 単語元の単語備考サボるサボタージュ(sabotage)前方一致ダブるダブル(double)発音一致ハモるハーモニー(harmony)前方一致ググるグーグルgoogle)ググレカスパニクるパニック(panic)後方追加ディスるディスリスペクト(disrespect)前方一致ミスるミス(miss)後方追加トラブるトラブル(trouble)発音一致デコるデコレート(decorate)前方一致メモるメモ(memo)後方追加バズるバズ(buzz)後方追加スペるスペランカー(spelunker)前方一致 発音一致:単語と元の単語の発音が一致している 前方一致:元の単語の後方が省略され「る」が付加されている 後方追加:元の単語にそのまま「る」が付加されている =========以下追記分========= ブコメとコメントから拾い

    【追記あり】外国語の単語+る、で動詞として定着している単語
    myrmecoleon
    myrmecoleon 2023/04/11
    定着してるかわからないけど、る言葉という呼び方があるみたいね。 https://www2.ninjal.ac.jp/conversation/event/pdf/sympo2019_1.pdf
  • iモード、企業戦士、コギャル――三省堂、消えた言葉だけ集めた辞書を発売

    iモード、オート三輪、企業戦士、コギャル――三省堂は、こうした時代の変化によって使われなくなった言葉だけを集めた「三省堂国語辞典から消えたことば辞典」を発売した。価格は2090円。辞書としてだけでなく、昭和レトロや平成レトロを楽しめる商品として注目度アップを狙う。

    iモード、企業戦士、コギャル――三省堂、消えた言葉だけ集めた辞書を発売
  • 古代バビロニアの文章を解読できるAIを開発。ギルガメシュ叙事詩の一部や賛歌を解読 : カラパイア


    LMUAI Fragmentarium LMU2018
    古代バビロニアの文章を解読できるAIを開発。ギルガメシュ叙事詩の一部や賛歌を解読 : カラパイア
  • 旦那って言い方がおぞましすぎる


      使 使    使 
    旦那って言い方がおぞましすぎる
    myrmecoleon
    myrmecoleon 2023/01/26
    旦那は本来仏教語でお布施とか檀家とかとほぼ同じ、お金を出してくれるパトロンのことなんだよな。主従関係とはちょっと違う。贈与が原義でドナーとかドネートとかが同系統。悪く言うと「財布」。
  • もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ


      tmpretval 使Review 
    もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ
  • 三大同じ単語なのにカタカナ英語で区別されてるやつ

    セカンドとセコンドあと二つは?

    三大同じ単語なのにカタカナ英語で区別されてるやつ
    myrmecoleon
    myrmecoleon 2022/08/03
    オランダ語のletter(レッテル)を挙げる人ばかりで、ラベル/レーベル/レイブル(紋章学)を挙げてる人がいないのはなんでだろう(いずれも英語のlabel)。/関連して調べて知ったがタグとタッグ(tag)も同じ語らしい
  • 「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」は誤り - 古代漢字学習ブログ @kanji_jigen


       2017p824  2019p1152  100 
    「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」は誤り - 古代漢字学習ブログ @kanji_jigen
  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

  • ウクライナ首都は「キーウ」 欧米メディア、表記変更広がる


    2022228(c)Sergei SUPINSKY / AFP 33 AFP KievKyivBBCLiberation 1BBC129
    ウクライナ首都は「キーウ」 欧米メディア、表記変更広がる