ブックマーク / atmarkit.itmedia.co.jp (71)

  • ベクトルデータベース(Vector Database)/ベクトルストア(Vector Store)とは?

    ベクトルデータベース(Vector Database)/ベクトルストア(Vector Store)とは?:AI機械学習の用語辞典 ベクトルデータベースとは、テキストなどのデータを数値ベクトル(埋め込み)として保存するデータベースを指す。「ベクトルストア」とも呼ばれる。ベクトル検索により、意味的に類似する情報を探せるのが特徴で、チャットAIのRAG構築に役立つ。稿ではベクトル検索の機能を持つ代表的な製品の概要もそれぞれ簡単に紹介する。 連載目次 用語解説 生成系AI/自然言語処理におけるベクトルデータベース(Vector Database、ベクターデータベース、ベクトルDB)とは、主に単語や文章(テキスト)、画像、音声などの複雑なデータを、AI機械学習/言語モデルが処理しやすい数値ベクトル表現として保存するデータベースのことである。この数値ベクトル表現は「埋め込み表現(Embeddin

    ベクトルデータベース(Vector Database)/ベクトルストア(Vector Store)とは?
    masadream
    masadream 2024/03/10
    現行製品の端的なまとめ。「今後、データベースでのベクトル検索は標準機能となっていく可能性が高い(と筆者は考えている)」
  • データ分析もChatGPTの機能(旧Code Interpreter)でできるか、やったみた【番外編】


    ChatGPTCode InterpreterAI ChatGPT  
    データ分析もChatGPTの機能(旧Code Interpreter)でできるか、やったみた【番外編】
  • 日本企業の半数が「職場での生成AI利用」を歓迎していない BlackBerry


     調ChatGPTAI72IT81  AI ChatGPTAIAINRI AI AI
    日本企業の半数が「職場での生成AI利用」を歓迎していない BlackBerry
    masadream
    masadream 2023/09/23
    「顧客や第三者のデータ侵害、知的財産へのリスク、誤った情報の拡散が禁止措置の判断を後押ししている」わりと真っ当な反応だった。
  • ChatGPTやInstructGPTはなぜユーザーの意図に沿った返答を生成できるのか?


    ChatGPTInstructGPT沿ChatGPT ChatGPTInstructGPTGPT沿  GPTInstructGPTChatGPT ChatGPTGPT 3GPT 3.5GPT 3ChatGPTInstructGPTInstructGPTGPT 3 GPTInstructGPTChatGPTInstructGPT
    ChatGPTやInstructGPTはなぜユーザーの意図に沿った返答を生成できるのか?
  • 2023年の「AI/機械学習」はこうなる! 6大予測


     2020202120222023AI稿稿6 AI AI AI AI RLHF Foundation Model 
    2023年の「AI/機械学習」はこうなる! 6大予測
  • 「Python 3.11」からその成果が得られ始めたPython高速化プロジェクトとは

    このうち、最初の2つはPythonプログラム実行中にPythonで記述された関数が呼び出される際の処理の高速化やメモリ使用の効率化に役立っている。最後の特殊化適応的インタプリターは、さまざまな型を扱えるように生成されたバイトコードを、特定の型のオブジェクトに適応するバイトコードに変更することで処理の高速化を狙うものといえる。 フレームオブジェクトの遅延作成 ここでいうフレームオブジェクトとは、関数を呼び出すごとに作成され、その関数の実行情報を格納するオブジェクトのことだ。関数内のローカル変数や評価スタック、コードオブジェクト(実行するコードを表すオブジェクト)などは一般にフレームオブジェクトに保持される。 Python 3.10まではこのフレームオブジェクトが関数呼び出しのたびに作成され、CPythonを実装しているC言語側のヒープに確保されるようになっていた。しかし、メモリ確保は高価な処

    「Python 3.11」からその成果が得られ始めたPython高速化プロジェクトとは
  • Pythonが平均1.22倍高速化、メジャー安定版「Python 3.11」の機能向上とは


    PythonPython Software Foundation20221024PythonPython 3.11.0 Python 3.11.0Python Software FoundationPEPPythonPEPPython Enhancement Proposalgh-GitHub  PEP 657  
    Pythonが平均1.22倍高速化、メジャー安定版「Python 3.11」の機能向上とは
  • 「不足しているのは人材ばかりではない」 ガートナーが指摘する日本企業のDX課題とは

    ガートナージャパンは「DX(デジタルトランスフォーメーション)の実現にはデータとアナリティクス(D&A)の活用が不可欠で、そのためにはデータを駆動力としてビジネスを推進するデータドリブンが求められる」としている。 DXは「人」だけでは成功しない ガートナージャパンのアナリストでシニアディレクターを務める一志達也氏は、「日企業はDXの成功を目指してデータの民主化やデータ人材、デジタル人材の育成を掲げている。しかし、人だけで成功することは難しい。他に何をしなければならないのか、重要性の高い主たる要素を理解し、それを備えるために戦略的に行動すべきだ」と述べている。 一志氏は、データドリブンな組織になるために企業がバランス良く備えるべき要素として、次の4つを挙げている。 スキルやリテラシーを備えた人 「高度な人材ほど役割を明確にし、組織のどこでどのように動き、どのような成果を求めるかを、組織と人

    「不足しているのは人材ばかりではない」 ガートナーが指摘する日本企業のDX課題とは
  • 「まず経営幹部が作った」、ノーコード開発で1万7000のアプリを生み出したLIXILは、アプリ開発の民主化をどう進めてきたか


    17000LIXIL LIXIL202110400017000 LIXIL2022624Google AppSheet使400017000 Google CloudLIXIL   
    「まず経営幹部が作った」、ノーコード開発で1万7000のアプリを生み出したLIXILは、アプリ開発の民主化をどう進めてきたか
  • 仕様書約8000ページ、NTTドコモが巨大レガシーシステムをクラウドネイティブ化できた理由


    8000NTT NTT150 DX NTT
    仕様書約8000ページ、NTTドコモが巨大レガシーシステムをクラウドネイティブ化できた理由
  • 「デジタル化の意味を『IT化』と混同している」 ガートナーが日本のデジタル化に関する展望を発表


    2022314ITDX   IT
    「デジタル化の意味を『IT化』と混同している」 ガートナーが日本のデジタル化に関する展望を発表
  • データ中心のAI(DCAI:Data-Centric AI)とは?


    AIAI   AIDCAIData-Centric AIAI CleanGood DataNoisyBig Data1 1 Good DataB
    データ中心のAI(DCAI:Data-Centric AI)とは?
  • 13億パラメーターを持つGPT言語モデルをrinnaが公開、日本語に特化


    GPT使 ×|×|,×|,,×|,,, 14  2021AI 5 2020NLPTransformerBERTGPT-32021AI 5 Microsoft
    13億パラメーターを持つGPT言語モデルをrinnaが公開、日本語に特化
  • 最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」

    最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」:AutoML OSS入門(6)(1/4 ページ) AutoML OSSを紹介する連載第6回は、ローコード機械学習ライブラリ「PyCaret」を解説します。さまざまな機械学習ライブラリのラッパーであるPyCaretは、データ分析のあらゆる工程でコードの行数を削減します。

    最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」
  • カインズのDXの秘訣は「同じ言葉」で話すこと


    DXIT1/3  使DX 226  KindnessDX
    カインズのDXの秘訣は「同じ言葉」で話すこと
  • Gartner、AIイノベーションを促進する4つのトレンドを解説

    Gartnerは4つのトレンドが、近い将来のAIのイノベーションを促進するという見通しを示した。「責任あるAI」「スモールデータとワイドデータのアプローチ」「AIプラットフォームの運用化」「データ、モデル、コンピュートリソースの効率利用」だ。 Gartnerは2021年9月7日(米国時間)、先ごろ発表した「Hype Cycle for Artificial Intelligence, 2021」(AIのハイプ・サイクル:2021年)に含まれる4つのトレンドが、近い将来のAIのイノベーションを促進するとの見通しを示した。 4つのトレンドとは、「責任あるAI」「スモールデータとワイドデータのアプローチ」「AIプラットフォームの運用化」「データ、モデル、コンピュートリソースの効率利用」だ。 Gartnerのシニアプリンシパルリサーチアナリスト、シュバンギ・バシスト氏は、次のように述べている。「A

    Gartner、AIイノベーションを促進する4つのトレンドを解説
  • colab-sshを使って、VS CodeからGoogle Colabに接続してみよう


     ColabCode使Google ColabVisual Studio CodeVS Codecode-servercolab-ssh使VS CodeGoogle ColabSSH colab-ssh vscode colabVS CodeGoogle ColabSSHcolab-ssh使colab-ssh使 colab-sshGoogle ColabS
    colab-sshを使って、VS CodeからGoogle Colabに接続してみよう
  • VS CodeでJupyterしてみよう


    JupyterProject JupyterPythonMarkdown WebWebJupyter NotebookJupyterLabVisual Studio CodeVS CodePythonJupyterVS Code  VS CodePy
    VS CodeでJupyterしてみよう
  • [解決!Python]テキストファイルに書き込むには

    open関数でファイルを書き込み用にオープンし、ファイルに文字列を書き込む方法や書き込みのモード、pathlib.Pathクラスを使う方法などを紹介する。 # ファイルを書き込み用にオープンして、ファイル先頭から文字列を書き込む with open('test.txt', 'w') as f:  # 「with open('test.txt', 'wt') as f:」と同じ f.write('this is a test.\n')  # 改行したければ改行文字を最後に付加 sl = ['atmark IT\n', 'deep insider\n'] f.writelines(sl)  # 文字列リストはwritelinesメソッドで書き込む x = 1 f.write(str(x) + '\n')  # テキストファイルに書き込めるのは文字列のみ # 上で作成した内容の確認 from p

    [解決!Python]テキストファイルに書き込むには
  • [解決!Python]テキストファイルを読み込むには

    open関数やpathlib.Pathクラスを使ってファイルをオープンし、その内容を読み込む方法、with文と組み合わせる方法、テキストファイルを反復的に処理する基パターンを紹介する。 # ファイルをオープンして、1行ずつその内容を読み込んで処理する with open('test.txt') as f: for line in f: line = line.rstrip()  # 読み込んだ行の末尾には改行文字があるので削除 print(line) # 出力結果(4行目に空行が表示されるときとされないときがあるのを除き、以下同じ) #atmark IT # #deep insider # テキストファイルをオープンして、その内容を全て読み込み、クローズする f = open('test.txt')  # f = open('test.txt', 'rt'): s = f.read() 

    [解決!Python]テキストファイルを読み込むには