![ChatGPTのミスを見つけるためのGPT-4ベースのモデル「CriticGPT」が開発される](https://cdn-ak-scissors.b.st-hatena.com/image/square/a302620e2c761f56d7a3dc07bbe271ef8129e928/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2024%2F06%2F28%2Fmistake-gpt-4-criticgpt%2F00.png)
こんにちは、横須賀市生成AI推進チームのM田です。 横須賀市がChatGPTを全庁利用を始めて1年経ちましたが、現在、いよいよ市民向けのAIサービスの実現に向けて相談AIチャットボットの実証実験をはじめたところです。 既に多くの人から話しかけてもらっていて、想定したよりも多くのアクセスがあったため一時停止するトラブルもありました…。 (現在は動いています) 今回は、この「ニャンぺい」を公開するにあたって、内部で行うテストをChatGPT(GPT-4o)とPythonプログラムを使って超効率化したよ、という話です。 AIチャットボットのテストAIチャットボットを作るにあたって、チャットボットの挙動(望んだ返答をしているか)のチェックをするテストは欠かせません。 テストは、まず複数のシナリオを作り、チャットボットへ質問し、回答を採点します。そして、採点結果をもとにチャットボットを修正して、再度
概要 pythonでテストコードを書くときがありますが、(筆者のように)超初心者からすると難しい用語や書き方がたくさん並んでいてハードルが高いです。 テストコードの入口となる最低限(最低限過ぎるかもしれませんが)の書き方を備忘を兼ねて書きます。 pythonでのテストコードを書く時のライブラリの種類 筆者が簡単に調べたところ、2つのライブラリがよく使われているようです。 unittest : python標準ライブラリ。インストールが必要ない。pytestと比較すると、柔軟なテストケースを書きづらい。 pytest : サードパーティ製のライブラリ。インストールの必要がある。柔軟なテストケースが書ける。pythonのテストコードを書く時のデファクトスタンダートになりつつある模様(これが本当かは確認していないですが、そういう記述を見かけることが多かったです)。 筆者個人としては、以下の3つの
伊藤忠は海外現地法人および一部の海外グループ企業が利用しているSAP ECC6.0をSAP S/4HANA Cloudへと移行するプロジェクトを進めている。すでにグローバル15拠点で移行を完了し、2025年11月までに残り約30拠点で完了する予定だ。移行プロジェクト担当者への取材から基幹システム刷新成功のヒントが分かる。 伊藤忠商事(以下、伊藤忠)は1858年に創業し、世界61カ国で繊維をはじめとするさまざまなビジネスに携わる総合商社だ。国内のビジネスだけでなく、輸出入や三国間取引を含むトレードビジネスの他、事業投資など幅広いビジネスを展開している。 同社は1996年、北米の現地法人の基幹システムとしてグループとして初めてSAPを導入した。そして2002年、北米で導入したSAPを基に開発した「G-SAP」をグローバルの40拠点に展開した。導入時のモディフィケーションおよび20年に渡る追加対
この記事では、SDPFクラウド/サーバで提供しているファイアウォールサービスについて、数週間かかっていたコントローラのテストを一新し、開発効率/品質向上に繋がった事例を紹介します。 目次 目次 はじめに ファイアウォール サービスとは テストにおける課題 問題1: テスト時間が長い 問題2: テストツールのEOL テスト環境の一新 問題の調査と整理 外部サービスのmock化 apiごとのテスト実装 CIの導入 テスト環境を一新して さいごに はじめに みなさん、こんにちは。 現在、SDPFクラウド/サーバで提供しているファイアウォール/ロードバランサーのサービス開発業務に携わっています、片貝です。 この記事では、数週間かかっていたファイアウォールサービスのテストを一新し、開発効率/品質向上に繋がった事例を紹介させていただきます。 ファイアウォール サービスとは ファイアウォールサービスでは
はじめに Zigについてのメモ の Zig 言語のスローガンと概要 に「C で大量にある未定義動作を Zig ではかなり少なくしています(といってもちゃんと数えたわけではないですが)」と書いたのですが、その後ちゃんと数えてみました。 最終版ドラフトで未定義動作の個数を数えてみた ISO - ISO/IEC 9899:2018 - Information technology — Programming languages — C でPDFがCHF 198で販売されています(Google検索によると2022-07-17時点で28,077.01 円)。 が、この価格では私にはちょっと手が出ないので以下の2つの最終版ドラフトを参照しました (と書いたのですが、その後上記のPDFを買いました)。 C17 (C standard revision) - Wikipedia からリンクされている N2
ちょめ子 @chome2xx 私「この機能って今使われてますか?」 ?「今は使われてない認識です」 私「設計書って更新されてます?」 ?「更新されてる認識です」 いや、認識じゃなくて事実を教えてくれって思ってしまうのだが、SEこういう言い回し好きだよね 2024-03-18 10:02:14
クイックサマリー:「テストピラミッド」は、自動テストをUI、サービス、ユニット単位に整理することで、開発に自動テストを組み込む方法を示すために作成されました。2012年に定義されて以降、このモデルは次第に使われなくなってきたように思いますが、本当に廃れてしまったのでしょうか。この記事では、最新のテスト戦略を紹介するとともに、今日のソフトウェア開発におけるテストピラミッドの関連性を検討します。 筆者の同僚であるジャン・フィリップ・ピエトルチェクが、かつてコードを書く開発者の責任について、次のように述べました。 none「我々の仕事の成果を最終的に使用する人々は、(中略)我々がただ最善を尽くすだけでなく、実際に機能するものを作ることを期待しているのです。」 — ジャン・フィリップ・ピエトルチェク 彼の言葉は、私たちが書くコードをそれに依存する人々の観点からとらえている点で非常に印象に残りました
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く