画像認識が可能なオープンソースモデルの﹁Llama 3-V﹂が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル﹁GPT4-V﹂よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars | by Aksh Garg | May, 2024 | Medium https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee 今回発表されたLlama 3-Vは、 Metaが公開した言語モデルの﹁L
![GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円](https://cdn-ak-scissors.b.st-hatena.com/image/square/e27b71c5489604880df77b4dc55156e074d4cf8a/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2024%2F05%2F29%2Fllama-3v%2F00.jpg)