COLUMN

コラム

2024年08月20日

GPTからOpenELMまで。代表的な大規模言語モデルまとめ

カテゴリー：テクノロジー

タグ：AI, 生成AI, LLM

大規模言語モデル（LLM）は、自然言語処理（NLP）の分野で最も注目されている技術の一つです。LLMは大量のテキストデータを学習し、テキスト生成、翻訳、要約、質問応答などのタスクを行うことができます。

現在は学習量が大規模化しており、その提供元も大企業になってきています。そうしたLLMについて、幾つかの代表的なモデルを紹介します。

GPT

GPTは、OpenAIによって開発されたLLMファミリーになります。GPTはGenerative Pre-trained Transformerの略で、大量のテキストデータを学習し、テキスト生成に優れています。特に翻訳や要約などの自然言語処理において高い性能を発揮します。

GPT-4 | OpenAI

T5

T5は、Googleによって開発されたLLMモデルのシリーズになります。初回のリリースが2019年で、最新リリースはT5Xになります。T5はText-to-Text Transfer Transformerの略で、テキストからテキストへの変換を行います。チャットボット、機械翻訳システム、テキスト要約ツール、コード生成、ロボット工学など、さまざまなアプリケーションに採用されています。

google-research/text-to-text-transfer-transformer

BERT

BERTはBidirectional Encoder Representations from Transformersの略で、2018年にGoogleより発表されたLLMモデルファミリーになります。Transformerを組み込むことで、文章を文頭・文末の双方向から学習し、より高いレベルで文章を解釈できるようになりました。

google-research/bert

XLNet

XLNetはBERTの改良版として開発されたLLMです。340Mのパラメータを持ち、330億語で学習されたモデルで、2019年にApache License 2.0にて公開されています。BERTで用いられていたMasked Language Model（MLM）を改良し、Permutation Language Model（PLM）を採用しています。

[1906.08237] XLNet: Generalized Autoregressive Pretraining for Language Understanding

Llama

LlamaはMeta社の開発したLLMモデルになります。Llama2は、ChatGPT 3.5に匹敵するモデルと言われており、Llama3はさらに高い性能を誇ります。オープンソースなので、派生版モデルも数多くあります。

Llama 3.1

Gemini

Geminiは、Googleが開発したLLMモデルになります。Geminiは、GPT-4のライバルとして位置づけられています。モデルのサイズが複数用意されており、最小のGemini Nanoはスマートフォンへの搭載を想定しています。

‎Gemini と話してアイデアを広げよう

Gemma

GemmaはGeminiをベースにしたLLMモデルになります。Gemmaはオープンモデルとしており、Gemmaをベースに独自のチューニングを行って専用AIエンジンを開発できます。商業利用も可能とのことです。

Google AI Gemma オープンモデル |Google for Developers | Google AI for Developers

OpenELM

OpenELMはAppleの発表したLLMです。最小のモデルは2.7億パラメータで、最大のモデルは30億パラメータを持ちます。最小のモデルはiPhoneへの搭載も可能です。iOS 18以降から搭載されるApple Intelligenceでも利用される可能性があります。

OpenELM

まとめ

LLMの多くは汎用的なものであり、これらのモデルをベースに独自のチューニングを行ったり、追加学習を行って特徴を持たせられます。日本語をさらに強化したり、医療分野や法律分野に特化させたりすることも可能です。

それぞれのモデルに特徴や強みがありますので、用途に合わせて選択してください。

役に立ったら、記事をシェアしてください

コラム一覧

カテゴリー
- フロントエンド実績(2)
- システム開発(55)
- 製品(1)
- 開発事例(5)
- ユースケース(8)
- 知ったかテックワード(42)
- 新規事業開発(29)
- ソリューション(12)
- レポート(10)
- ビジネス(24)
- 導入事例(5)
- テクノロジー(76)
- サービス(28)
- 事例(22)
- API連携(2)
タグ
- 業務システム(28)
- プログラミング(31)
- フロントエンド(38)
- システム運用(16)
- TypeScript(1)
- WebAssembly(2)
- ウォーターフォール開発(2)
- GraphQL(1)
- CSS(2)
- システム開発(69)
- スクラム(1)
- スタートアップ(11)
- Nexaweb(1)
- BaaS(10)
- データベース(5)
- SPA(2)
- 基本用語(26)
- Case study(5)
- Keyword(10)
- FaaS(1)
- AI(26)
- アジャイル開発(18)
- Supabase(1)
- Database(2)
- イノベーション(5)
- プロジェクト管理(13)
- 月額制(1)
- クラウドサービス(12)
- ACF(1)
- PaaS(3)
- サービス開発(5)
- BookReview(3)
- React(3)
- Firebase(1)
- 通知(1)
- バックエンド(8)
- low-code(2)
- ナレッジマネジメント(1)
- Vue.js(2)
- ChatGPT(1)
- Tailwind CSS(1)
- DBaas(2)
- 失敗事例(2)
- セミナー(2)
- Web(21)
- DX(34)
- Hexabase_health(1)
- 生成AI(7)
- 受託開発(1)
- Kubernetes(3)
- WebComponents(1)
- API(6)
- JavaScript(2)
- Next.js(1)
- フレームワーク(3)
- ローコード開発(4)
- ノーコード開発(1)
- Hexabase(12)
- LLM(3)
- 画像生成(1)

Contact Usお問い合わせはこちら