GPT-3

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Generative Pre-trained Transformer 3 (GPT-3)
作者 OpenAI[1]
初版 June 11, 2020 (beta)
リポジトリ ウィキデータを編集
前身 GPT-2
後継 GPT-3.5
種別 自己回帰モデル transformer 言語モデル
公式サイト openai.com/blog/openai-api
テンプレートを表示

GPT-3Generative Pre-trained Transformer 32020

Transformer20481750800 GB[2]NLPGPT-n調[2]

GPT-3OpenAIGPT-2GPT3[3]2020520207GPT-3[4]NLP[1]

GPT-3[5]GPT-3202052831OpenAIGPT-3[1]:34GPT-3AI[6]20224GPT-3[7]

2020922GPT-3API使GPT-3[8]

背景[編集]


2010[9]使[9]NLP使12017TransformerGPT-nTransformer[10]NLP[11]2018611OpenAIgenerative pre-trainingGP[2]GPT-n調NLP[2]

20202170Turing Natural Language GenerationT-NLG[12]

訓練と能力[編集]

GPT-3によって書かれた教育学に関する学生の小論の例

「学習スタイル」という概念は、学習スタイルが形成される過程を説明できない点で問題がある。ある学生は、特定の経験をしたために、特定の学習スタイルを身につけるかもしれない。別の学生は、自分の学習ニーズにあまり適していない学習環境に適応しようとすることで、特定の学習スタイルを習得するかもしれない。しかし最終的には、学習スタイルと環境および個人的要因との相互作用を理解し、それらがどのように私たちの学習方法や経験する学習の種類を形成するかを理解する必要がある。

– 著者: マイク・シャープルズ[13]

2020528OpenAI31arXiv3GPT-3[1][5]GPT-3GPT-2[14]2GPT-3: [1]:14[3]GPT-3[15]GPT-32Turing NLG10[5]

[]


GPT-3GPT-2[16]

[17]

GPT-3GPT-2

: 175dense10[18]


[]


GPT-360%Common Crawl4,100[1]:9WebText219022%Books11208%Books25508%Wikipedia303%[1]:9
GPT-3学習データ
データセット トークン数 学習データ中の割合
Common Crawl 4100 億 60%
WebText2 190 億 22%
Books1 120 億 8%
Books2 550 億 8%
Wikipedia 30 億 3%

学習[編集]

能力[編集]


GPT-3CSSJSXPython[4]GPT-3[4]GPT-3GPT-3GPT-2CTRLOpenAIGPT-3GPT-3GPT-1WikipediaCTRL Wiki[19]

2020611OpenAI使GPT-3 API[20][21]API[20]OpenAI GPT-3 APIGPT-3[22]80200GPT-352%[1]

20211118OpenAIAPI[23]OpenAIOpenAI[24]2022127OpenAIInstructGPTGPT-3API使OpenAIInstructGPT沿[25]

GPT-3[5]GPT-3[1]:342020528GPT-3[5][1][1][26]:34

GPT-3[1]

20226Almira Osmanovic ThunströmGPT-3稿[27][28]

[]


7[29] GPT-3.5  Codex 

text-curie-001 - 202414[30]

text-babbage-001 - 202414[30]

text-ada-001 - 202414[30]

davinci - 202414davinci-002 [30]

curie - 202414curie-002 [30]

babbage - 202414babbage-002 [30]

ada - 202414ada-002 [30]

[]

[]


GPT-3CodexIDE使GitHub Copilot[31][32]

GPT-3使[33][34]

GPT-3CodexDB[35]SQL使

GPT-3Jason RohrerProject December使GPT-3使AI[36]

AIGPT-3使81[37]

AI DungeonGPT-3使OpenAI[38][39]

Copy.ai[40]Jasper.ai[41]TextCortex AI[42]Hypotenuse AI[43]GPT-3

2022GPT-3使[44][45]

[]


Farhad ManjooGPT-3[46]

Daily Nous9GPT-3[47]David ChalmersGPT-3AI1[6]

WIREDGPT-3[48]

The National Law ReviewGPT-3OpenAI[49]

MITGary Marcus[50]GPT-3GPT-3[51]GPT-3

Facebook AIJerome PesentiGPT-3[52]

NablaOpenAI使GPT-3GPT-3GPT-3AI[53]

GPT-3[54]

Massimo Chiriatti調[55]

OpenAISam AltmanGPT-3GPT-3AIGPT-3[56]

[]


GPT-3OpenAI2015[57]2019OpenAIGPT-3OpenAI8%GPT-2[58]OpenAI[59]2020OpenAIGPT-3OpenAIAPIGPT-3GPT-3[8]

GPT-3GoogleAI2021Timnit GebruEmily M. Bender[60]

GPT-3使[?][61][62]GPT126,000稿Common CrawlTechCrunchBBCThe New York TimesReddit[63]OpenAIUSPTO2019GPTAIOpenAIAI[64]

GPT-3.5[編集]

Generative Pre-trained Transformer 3.5 (GPT-3.5)
作者 OpenAI[1]
初版 2022年3月15日 (2年前) (2022-03-15)
リポジトリ なし
前身 GPT-3
後継 GPT-4
種別 自己回帰モデル transformer 言語モデル
ライセンス プロプライエタリ
公式サイト なし
テンプレートを表示

沿[]


2022315OpenAIGPT-3CodexAPItext-davinci-002code-davinci-002[65]20216[66]

20221128text-davinci-003[67]

20221130OpenAIGPT-3.5[68]GPT-3.5調ChatGPT[69]

2023613gpt-3.5-turbo-16k function calling[70]function callingChatGPT  ChatGPT 

OpenAI  GPT-3.5  GPT-3 [71]GPT-3.5  GPT-4 

[]


5[72]
  • 会話用
    • gpt-3.5-turbo - 使用可能な文脈が最長4096トークン
    • gpt-3.5-turbo-16k - 使用可能な文脈が最長16384トークン
  • 後続の文章生成用
    • text-davinci-003 - 2024年1月4日に提供終了[30]
    • text-davinci-002 - 2024年1月4日に提供終了[30]
    • code-davinci-002 - プログラミング用

参照項目[編集]

  • BERT (言語モデル) - Transformerアーキテクチャに基づく言語モデルの一種
  • Generative pre-trained transformer - 大規模なテキストデータで学習し、人間に近いテキストを生成する言語モデル
  • LaMDA - Googleが開発した会話型ニューラル言語モデルのファミリー
  • 自然言語処理(NLP) - 自然言語データに対するコンピュータ処理に関する学際的な分野
  • ChatGPT - OpenAIによるGPTファミリー上に構築されたチャットボット
  • ハルシネーション (人工知能) - 人工知能モデルによる学習データで正当化されない欺瞞的な応答

脚注[編集]



(一)^ abcdefghijklmBrown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav et al. (Dec 2020). Larochelle, H.; Ranzato, M.; Hadsell, R. et al.. eds. Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems (Curran Associates, Inc.) 33: 18771901. https://proceedings.neurips.cc/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf. 

(二)^ abcdImproving Language Understanding by Generative Pre-Training. pp. 12 (2018611). 2020731

(三)^ abShead, Sam (2020723). Why everyone is talking about the A.I. text generator released by an Elon Musk-backed lab. CNBC. https://www.cnbc.com/2020/07/23/openai-gpt3-explainer.html 2020731  Four preprints were released between May 28 and July 22, 2020.

(四)^ abcBussler, Frederik (2020721). Will GPT-3 Kill Coding?. Towards Data Science. 202081

(五)^ abcdeSagar, Ram (June 3, 2020). OpenAI Releases GPT-3, The Largest Model So Far. Analytics India Magazine. https://analyticsindiamag.com/open-ai-gpt-3-language-model/ 2020731. 

(六)^ abChalmers, David (2020730). GPT-3 and General Intelligence. Daily Nous. https://dailynous.com/2020/07/30/philosophers-gpt-3/#chalmers 202084 

(七)^ A.I. Is Mastering Language. Should We Trust What It Says?. The New York Times (2022415). 2023215

(八)^ abHao, Karen (September 23, 2020). OpenAI is giving Microsoft exclusive access to its GPT-3 language model (). MIT Technology Review. https://www.technologyreview.com/2020/09/23/1008729/openai-is-giving-microsoft-exclusive-access-to-its-gpt-3-language-model/ 2020925. ""The companies say OpenAI will continue to offer its public-facing API, which allows chosen users to send text to GPT-3 or OpenAI's other models and receive its output. Only Microsoft, however, will have access to GPT-3's underlying code, allowing it to embed, repurpose, and modify the model as it pleases."" 

(九)^ abAn understanding of AI's limitations is starting to sink in. The Economist. (2020611). ISSN 0013-0613. https://www.economist.com/technology-quarterly/2020/06/11/an-understanding-of-ais-limitations-is-starting-to-sink-in 2020731 

(十)^ Polosukhin, Illia; Kaiser, Lukasz; Gomez, Aidan N.; Jones, Llion; Uszkoreit, Jakob; Parmar, Niki; Shazeer, Noam; Vaswani, Ashish (12 June 2017). "Attention Is All You Need". arXiv:1706.03762 [cs.CL]

(11)^ Natural Language Processing. 2020731

(12)^ Sterling, Bruce (February 13, 2020). Web Semantics: Microsoft Project Turing introduces Turing Natural Language Generation (T-NLG). Wired. ISSN 1059-1028. https://www.wired.com/beyond-the-beyond/2020/02/web-semantics-microsoft-project-turing-introduces-turing-natural-language-generation-t-nlg/ 2020731. 

(13)^ Marche, Stephen (2022126). The College Essay Is Dead. The Atlantic. 2022128

(14)^ Language Models are Unsupervised Multitask Learners. openai.com. 2019124 "GPT-2, is a 1.5B parameter Transformer"

(15)^ Ray, Tiernan (202061). OpenAI's gigantic GPT-3 hints at the limits of language models for AI. ZDNet. 2020731

(16)^ "We use the same model and architecture as GPT-2 ... with the exception" Brown (2020)

(17)^ "with the exception that we use alternating dense and locally banded sparse attention patterns in the layers of the transformer, similar to the Sparse Transformer" Brown (2020)

(18)^ "we train GPT-3, an autoregressive language model with 175 billion parameters" Brown (2020)

(19)^ Gehman, Samuel; Gururangan, Suchin; Sap, Maarten; Choi, Yejin; Smith, Noah A. (1620 November 2020), REALTOXICITYPROMPTS: Evaluating Neural Toxic Degeneration in Language Models, Association for Computational Linguistics, pp. 33563369, arXiv:2009.11462, https://arxiv.org/abs/2009.11462 202162 

(20)^ abOpenAI API. OpenAI (2020611). 2023215

(21)^ Coldewey, Devin (2020611). OpenAI makes an all-purpose API for its text-based AI capabilities. TechCrunch. 202110272020731 If you've ever wanted to try out OpenAI's vaunted machine learning toolset, it just got a lot easier. The company has released an API that lets developers call its AI tools in on "virtually any English language task."

(22)^ Arram (202079). GPT-3: An AI that's eerily good at writing almost anything. Arram Sabeti. 2020731

(23)^ OpenAI's API Now Available with No Waitlist (). OpenAI (20211118). 2022115

(24)^ OpenAI API (). beta.openai.com. 2022115

(25)^ Aligning Language Models to Follow Instructions (). OpenAI (2022127). 2022115

(26)^ Brown, Tom B.; et al. (2020). "Language Models are Few-Shot Learners". arXiv:2005.14165 [cs.CL]

(27)^ Thunström, Almira Osmanovic (2022630). We Asked GPT-3 to Write an Academic Paper about ItselfThen We Tried to Get It Published. Scientific American. 2022630

(28)^ Can GPT-3 write an academic paper on itself, with minimal human input? (). Archive ouverte HAL (2022621). 2022630

(29)^ OpenAI API. 202356

(30)^ abcdefghiGPT-4 API general availability and deprecation of older models in the Completions API. openai.com. 202377

(31)^ OpenAI Codex (). OpenAI (2021810). 20221223

(32)^ Thompson, Clive (15 March 2022). How an AI Became My Code-Writing Genie. Wired. https://www.wired.com/story/openai-copilot-autocomplete-for-code/ 20221223. 

(33)^ Microsoft announced its first customer product features powered by GPT-3 and @Azure.. The AI Blog (2021525). 2023215

(34)^ Vincent, James (2021525). Microsoft has built an AI-powered autocomplete for code using GPT-3. The Verge. https://www.theverge.com/2021/5/25/22451144/microsoft-gpt-3-openai-coding-autocomplete-powerapps-power-fx 20221223 

(35)^ CodexDB - SQL Processing Powered by GPT-3. CodexDB - SQL Processing Powered by GPT-3. 2023215

(36)^ Fagone, Jason (2021723). The Jessica Simulation: Love and loss in the age of A.I.. San Francisco Chronicle. https://www.sfchronicle.com/projects/2021/jessica-simulation-artificial-intelligence/ 2021729 

(37)^ GPT-3 (202098). A robot wrote this entire article. Are you scared yet, human? | GPT-3. The Guardian. ISSN 0261-3077. https://www.theguardian.com/commentisfree/2020/sep/08/robot-wrote-this-article-gpt-3 2020915 

(38)^ Update: Language Models and Dragon. Latitude blog (2021128). 2023215

(39)^ This Mystical Book Was Co-Authored by a Disturbingly Realistic AI (). www.vice.com. (2022). https://www.vice.com/en/article/7kbjvb/this-magickal-grimoire-was-co-authored-by-a-disturbingly-realistic-ai 20221223 

(40)^ Writing helper Copy.ai raises $2.9M in a round led by Craft Ventures. copy.ai (2021317). 2022115

(41)^ Dzieza, Josh (2022720). Can AI write good novels?. The Verge. https://www.theverge.com/c/23194235/ai-fiction-writing-amazon-kindle-sudowrite-jasper 20221223 

(42)^ 1,2-Millionen-Dollar-Investment für ein Start-up, das KI-basierte Texte erstellt (). (2022621). https://www.derstandard.de/story/2000136763282/1-2-millionen-dollar-investment-fuer-ein-start-up-das 2023214 

(43)^ Lomas, Natasha (202087). Hypotenuse AI wants to take the strain out of copywriting for e-commerce (). TechCrunch. 202315

(44)^ Can ChatGPT AI chatbot spot early stages of Alzheimer's? - study. (2022). https://www.jpost.com/health-and-wellness/mind-and-spirit/article-725929 2023210 

(45)^ Agbavor, Felix; Liang, Hualou (December 22, 2022). Predicting dementia from spontaneous speech using large language models. PLOS Digital Health 1 (12): e0000168. doi:10.1371/journal.pdig.0000168. 

(46)^ Manjoo, Farhad (2020729). How Do You Know a Human Wrote This?. The New York Times. ISSN 0362-4331. https://www.nytimes.com/2020/07/29/opinion/gpt-3-ai-automation.html? 202084 

(47)^ Philosophers On GPT-3 (updated with replies by GPT-3). Daily Nous (2020730). 2020731

(48)^ Simonite, Tom (July 22, 2020). Did a Person Write This Headline, or a Machine?. Wired. ISSN 1059-1028. https://www.wired.com/story/ai-text-generator-gpt-3-learning-language-fitfully/ 2020731. 

(49)^ Claypoole, Theodore (2020730). New AI Tool GPT-3 Ascends to New Peaks, But Proves How Far We Still Need to Travel. The National Law Review. 202084

(50)^ Marcus, Gary (2018121). The deepest problem with deep learning (). Medium. 2020929

(51)^ Marcus, Gary; Davis, Ernest (August 22, 2020). GPT-3, Bloviator: OpenAI's language generator has no idea what it's talking about. MIT Technology Review. https://www.technologyreview.com/2020/08/22/1007539/gpt3-openai-language-generator-artificial-intelligence-ai-opinion 2020823. 

(52)^ Metz, Cade (20201124). Meet GPT-3. It Has Learned to Code (and Blog and Argue). (). The New York Times. ISSN 0362-4331. https://www.nytimes.com/2020/11/24/science/artificial-intelligence-ai-gpt3.html 20201124 

(53)^ Medical chatbot using OpenAI's GPT-3 told a fake patient to kill themselves (). AI News (20201028). 202118

(54)^ Chomsky on Terence McKenna, Sam Harris, GPT3, Cryptocurrencies, Kierkegaard, Neuralink, & Hofstadter. 24 March 2021. : 1:11:44.

(55)^ Floridi, Luciano; Chiriatti, Massimo (1 November 2020). GPT-3: Its Nature, Scope, Limits, and Consequences. Minds and Machines 30 (4): 681694. doi:10.1007/s11023-020-09548-1. 

(56)^ Vincent, James (2020730). OpenAI's latest breakthrough is astonishingly powerful, but still fighting its flaws. The Verge. https://www.theverge.com/21346343/gpt-3-explainer-openai-examples-errors-agi-potential 2022119 

(57)^ Olanoff, Drew (20151211). Artificial Intelligence Nonprofit OpenAI Launches With Backing From Elon Musk And Sam Altman. Tech Crunch. https://techcrunch.com/2015/12/11/non-profit-openai-launches-with-backing-from-elon-musk-and-sam-altman/ 2021531 

(58)^ Hao, Karen (2019829). OpenAI has released the largest version yet of its fake-news-spewing AI. MIT Technology Review. https://www.technologyreview.com/2019/08/29/133218/openai-released-its-fake-news-ai-gpt-2/ 2021531 

(59)^ Coldewey, Devin (2019311). OpenAI shifts from nonprofit to 'capped-profit' to attract capital. Tech Crunch. https://techcrunch.com/2019/03/11/openai-shifts-from-nonprofit-to-capped-profit-to-attract-capital/ 2021531 

(60)^ Bender, Emily M.; Gebru, Timnit; McMillan-Major, Angelina; Shmitchell, Shmargaret (3 March 2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?. FAccT '21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. pp. 610623. doi:10.1145/3442188.3445922

(61)^ Mindzak, Michael; Eaton, Sarah Elaine. Artificial intelligence is getting better at writing, and universities should worry about plagiarism (). http://theconversation.com/artificial-intelligence-is-getting-better-at-writing-and-universities-should-worry-about-plagiarism-160481 2021116 

(62)^ Rogerson, Ann M.; McCarthy, Grace (December 2017). Using Internet based paraphrasing tools: Original work, patchwriting or facilitated plagiarism? (). International Journal for Educational Integrity 13 (1): 115. doi:10.1007/s40979-016-0013-y. ISSN 1833-2595. 

(63)^ Here are a few ways GPT-3 can go wrong. TechCrunch.

(64)^ Comment Regarding Request for Comments on Intellectual Property Protection for Artificial Intelligence Innovation (PDF). USPTO.

(65)^ New GPT-3 Capabilities: Edit & Insert (). OpenAI (2022315). 2023113

(66)^ Models. 2023215

(67)^ Jan LeikeTwitter使: Check out OpenAI's new text-davinci-003! Same underlying model as text-davinci-002 but more aligned. Would love to hear feedback about it! / Twitter

(68)^ Model index for researchers. 2023215

(69)^ ChatGPT: Optimizing Language Models for Dialogue (). OpenAI (20221130). 2023113

(70)^ Function calling and other API updates. openai.com. 2023614

(71)^ OpenAI API. 202356

(72)^ OpenAI API. 202355