タグ

ブックマーク / golden-lucky.hatenablog.com (24)

  • SNSの居心地をよくする - golden-luckyの日記


    2023Twitter MastodonFacebookBluesky BlueskySNS Blueskypyspa Advent Calendar 2023 - Adventar  稿    SNS
    SNSの居心地をよくする - golden-luckyの日記
  • 出版社を作って4年が経ちました - golden-luckyの日記


    4 www.lambdanote.com   Advent Calendar 201925 4201812201911 n n3 4    
    igrep
    igrep 2019/12/26
    お疲れさまです!
  • 直販サイトを作って書籍を売ること - golden-luckyの日記


    PDFXMLPandocEPUB 3 --  20002
    直販サイトを作って書籍を売ること - golden-luckyの日記
    igrep
    igrep 2019/12/24
    いい話だなあ
  • 抽象データ型を自作する - golden-luckyの日記


     Pandoc PandocPandoc PandocLaTeX LaTeX PandocLaTeX  LaTeXInDesignFrameMaker使  稿
    抽象データ型を自作する - golden-luckyの日記
  • Markdownで書籍を作るとは - golden-luckyの日記


    Pandoc PandocReaderPandocPandoc PandocReaderPandoc使 PandocWriterPDFLaTeXWriterEPUB Writer使 Writer Writer
    Markdownで書籍を作るとは - golden-luckyの日記
  • Pandocをコマンドでなくライブラリとして使う - golden-luckyの日記


    Pandoc PandocPandocHaskellPandocpandocJSON Luapandoc HaskellPandoc pandocHaskellMarkdown使  XML稿Markdown 
    Pandocをコマンドでなくライブラリとして使う - golden-luckyの日記
  • もっとPandocフィルター - golden-luckyの日記


    2Pandoc Pandoc PandocLaTeX使 Lua使Pandoc Pandoc2Pandoc Markdown Pando
    もっとPandocフィルター - golden-luckyの日記
    igrep
    igrep 2019/12/18
  • Pandocフィルター101 - golden-luckyの日記


    PandocReader ReaderPandocReader使Pandoc PandocHaskell GitHubcloneHaskell ReaderPandocPandoc 
    Pandocフィルター101 - golden-luckyの日記
    igrep
    igrep 2019/12/17
    Pandocをライブラリーとして使えばわざわざJSONを経由しなくてもHaskell製のフィルターが定義できそうだけど、そうしないのは単純に面倒だから?
  • PandocをreSTのリストテーブルに対応させる - golden-luckyの日記


    PythonreStructuredTextreST reStructuredText https://docutils.sourceforge.io/rst.html reST 使DocutilsDocutilsreST DocutilsPandoc DocutilsDocutils Docutils 
    PandocをreSTのリストテーブルに対応させる - golden-luckyの日記
    igrep
    igrep 2019/12/16
    いいはなし
  • ライトウェイト構造化文書 - golden-luckyの日記


    PDFXML 2WebHTML  WebHTMLCSSJavaScript  CSSXSL-FOJavaScriptXSLT
    ライトウェイト構造化文書 - golden-luckyの日記
  • LaTeXソースを出力するときのエスケープ - golden-luckyの日記


    XML稿  TeX10稿使 稿 \ { } $ & # ^ _ % ~ LaTeX TeX 使 \ "\n""\\""\""
    LaTeXソースを出力するときのエスケープ - golden-luckyの日記
  • XMLをつぶす機械を作る機械を作る - golden-luckyの日記

    昨日は、ドキュメントの構造をプログラムのように実行できるというアイデアの話をしました。 具体的には、「ドキュメントの構造をS式で表現し(SXML)、そのタグをLispの関数と見立て、それを要素に関数適用する」というアプローチです。 たとえば、XMLで表したときに段落を意味する<para>のようなタグに対する変換処理は、こんな感じのLispの関数として定義できます。 (define (para arg) (print arg "\n\n")) 今日は、これをもうちょっと真面目に定義する部分と、これを評価する部分、それに実用的に使うためのフレームワークについて書きます。 以降、Lispの処理系としては、GaucheというSchemeの実装を使います。 Gauche https://practical-scheme.net/gauche/index-j.html ドキュメントをS式で書くの? ま

    XMLをつぶす機械を作る機械を作る - golden-luckyの日記
  • PDFから「使える」テキストを取り出す(第5回) - golden-luckyの日記


    PDF PDF  John Whitington   PDF20125 PDF PDFPDF 
    PDFから「使える」テキストを取り出す(第5回) - golden-luckyの日記
    igrep
    igrep 2019/12/13
  • PDFから「使える」テキストを取り出す(第4回) - golden-luckyの日記


    PDF  PDF  PDF  TJ BT /F1 12.4811 Tf 125.585 -462.55 Td [(#1)] TJ /F2 13.2657 Tf 19.932 0 Td [(
    PDFから「使える」テキストを取り出す(第4回) - golden-luckyの日記
    igrep
    igrep 2019/12/13
  • PDFから「使える」テキストを取り出す(第3回) - golden-luckyの日記

    昨日の記事では、PDFのページに表示されるコンテンツはPDFのドキュメント構造を掘っていくと手に入れることができて、それはこんな姿をしているぞ、というところまで話が進みました。 $ hpdft -r 66 NML-book.pdf [ /Filter: /FlateDecode /Length: 381.0, q .913 0 0 .913 0 595.276 cm q 462.33906 0 0 655.95015 -3.064 -652.208 cm /Im24 Do Q 1 G 1 g BT /F1 12.4811 Tf 125.585 -462.55 Td[(#1)]TJ /F2 13.2657 Tf 19.932 0 Td[<0b450a3a0c2403c3029403bb0715037103cd03bb029403ef03da03bf03bd0377062c0ac5>] TJ

    PDFから「使える」テキストを取り出す(第3回) - golden-luckyの日記
    igrep
    igrep 2019/12/13
    すごいたらい回しだ…
  • なんでドキュメントといったらXMLが出てくるのか - golden-luckyの日記


      XML使 XML XML使 XMLXML使 XML 
    なんでドキュメントといったらXMLが出てくるのか - golden-luckyの日記
    igrep
    igrep 2019/12/08
     "SSXMLSXML"   

    xml
     
  • ドキュメント技術とプログラミング言語の相似について - golden-luckyの日記

    よく知られているように、ドキュメントには「構造」があります。 WebページではHTMLCSSにより構造とスタイルを分離するべきとか、Wordでは書式設定をスタイルとして定義して使うことで構造とスタイルを分離するべきとか、ドキュメントの「べき」論で必ず言及される「構造とスタイルの分離」における「構造」です。 昨日までの話ではPDFにもドキュメント構造というのが出てきました。あれは、この「構造とスタイルの分離」というときの「構造」とは別物なので注意してください。 たぶん、PDFのドキュメント構造には、「ドキュメントを表すデータ構造」くらいの意味合いくらいしかありません。 一方、ドキュメントの話において「構造とスタイルの分離」というときの「構造」は、もうちょっとこうなんていうか、セマンティックな話です。 データをどう構成するかではなく、ドキュメントで表したい意味をどう構成するか、という話。 し

    ドキュメント技術とプログラミング言語の相似について - golden-luckyの日記
    igrep
    igrep 2019/12/08
    「記法・構造・見た目」と「ソースコード・AST・実行ファイル」
  • PDFから「使える」テキストを取り出す(第6回) - golden-luckyの日記


    PDFhpdft使 PDF PDF 使Xpdfpdftotext pdftotext http://www.xpdfreader.com/ XpdfPopplerPopplerpdftotext pdfminer pdfminer https://www.unixuser.org/~euske/py
    PDFから「使える」テキストを取り出す(第6回) - golden-luckyの日記
    igrep
    igrep 2019/12/06
  • PDFから「使える」テキストを取り出す(第2回) - golden-luckyの日記


    PDFPDF PDF PDFAdobePDF PDFUnicode PDF6 §5.9 "Extraction of Text Content" 
    PDFから「使える」テキストを取り出す(第2回) - golden-luckyの日記
    igrep
    igrep 2019/12/02
  • PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記


    PDF  2 PDF PDF 21 PDF PDF PDF使 PDF
    PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記
    igrep
    igrep 2019/12/01