COLUMN
2024年08月22日
大規模言語モデルを手軽に利用できるLLM APIまとめ
カテゴリー:テクノロジー, API連携
タグ:AI, api, プログラミング, クラウドサービス
LLMをビジネスに取り入れる企業が増えています。さらに、自社独自のデータを盛り込んだLLMをサービスと提供するケースも増えています。そうした時、気になるのはGPUなどの初期投資でしょう。
今回は、LLMを手軽にAPI経由で利用できるサービスをまとめて紹介します。
独自のAIモデルを提供するサービス
OpenAI API
ChatGPTやDALL-Eなど、OpenAIのサービスは多岐にわたります。特にChatGPTは、多くの企業が導入しているサービスです。テキストはもちろん、画像や動画、音声にも利用できます。
Gemini API
GeminiはGoogleの開発した最新のAIです。GeminiはNano、Pro、Ultraの3種類のモデルがあり、Nanoはスマートフォンでの利用が想定されています。Googleの各種サービスに組み込まれている他、APIを利用した操作も可能です。
Google AI Gemini API | Gemma open models | Google for Developers | Google AI for Developers
Groq
Groqは元Googleのエンジニアが創業・開発しているLLMです。回答が速い点が、他のLLMとの違いです。LPU(Language Processing Unit)という処理エンジンを独自に開発しており、Groqを最適にチューニングしていることで実現しています。
Claude
Claudeは元OpenAIの幹部が立ち上げた企業になります。現状では、テキストと画像について扱えます。一時期にはChatGPTよりも優れているという評価もありました。現在の最新版はClaude 3.5 Sonnetであり、次のバージョンが楽しみなサービスです。
Cohere
Cohereは企業向けに特化したLLMです。特にRAGをはじめとする企業内データの探索に特化しています。Cohereのクラウドサービスはもちろん、オンプレミスやパブリッククラウドへのデプロイも可能です。
Mistral AI API
Mistralはフランス発のAIスタートアップです。元Meta社、元DeepMindの開発者が立ち上げた企業で、AIの研究開発に特化しています。オープンなモデルであるMistral 7B、Mixtral 8x7Bを公開しています。商用モデルはMistral SmallやMistral Embed、Mistral Largeがあります。
Mistral AI API | Mistral AI Large Language Models
Perplexity API
PerplexityはGPTモデルと検索を組み合わせることで、データの参照元を表示します。そのため、結果がより信頼性の高いものになるのが特徴です。
ALEPH ALPHA
ALEPH ALPHAは元Appleの開発者が立ち上げたAIサービスです。ALEPH ALPHAはドイツ発の企業で、EUにおけるOpenAIを目指すとしています。EUのデータ管理、プライバシーに則した利用が可能です。
ALEPH ALPHA - AI for Enterprises and Governments
DeepSeek
DeepSeekは236億のパラメータを持つLLMです。他のLLM APIと比べて低価格なのは魅力ですが、中国のAIなので利用については注意が必要そうです。
AI21
AI21はイスラエル発のAIスタートアップです。出典元へのリンクを提供する機能があります。直接使うことも、Amazon Bedrockなどを通じて利用することもできます。
外部のLLMを呼び出すAPI
多数あるLLMのAPIを束ねて使いやすくしてくれるサービスです。エンジンは独自ではないですが、異なるLLMを試す・使い分けるのが容易です。
Azure OpenAI Service
Azureが提供するサービスです。以下のモデルが利用できます。
- OpenAI
- Phi-3
- Llama
- Mistral AI
- Cohere
- Hugging Face
- Stability AI
- Core42
- Nixtla
Azure OpenAI Service – 高度な言語モデル | Microsoft Azure
Vertex AI
Vertex AIはGoogleの提供するフルマネージド統合 AI 開発プラットフォームです。Model Gardenには、さまざまなAIモデルが掲載されています。基本的にGoogleの開発したモデルですが、Llama 2やClaudeなど、他社のモデルも利用できます。
- Gemini モデル
- Imagen 2.0
- Chirp 2.0
- Gemma
- CodeGemma
- PaliGemma
- Llama 2
- Falcon
- BERT
- T-5 FLAN
- ViT
- EfficientNet
- Claudeモデルファミリー
Gemini 1.5 Pro と Gemini 1.5 Flash を使用した Vertex AI | Google Cloud
Amazon Bedrock
Amazon BedrockはAWSの提供するサービスで、各種LLMモデルを一つのエンドポイントで利用できます。利用できるモデルは以下の通りです。
- AI21 Labs
- Amazon Titan
- Claude
- Cohere
- Llama
- Mistral AI
- Stability AI
基盤モデルによる生成 AI アプリケーションの構築 - Amazon Bedrock - AWS
NVIDIA LLM APIs
NVIDIAはLlama 2やPhi、MistralaiなどさまざまなAIモデルをAPIで提供しています。利用できるモデルは以下の通りです。
- YI-large (01-ai)
- Sea-lion-7b-instruct (aisingapore)
- Starcoder2 (bigcode)
- Databricks
- Deepseek
- Gemma (Google)
- Codegemma (Google)
- Recurrentgemma-2b (Google)
- Shieldgemma-9b (Google)
- Granite (ibm)
- Breeze-7b-instruct (mediatek)
- Codellama-70b (meta)
- Llama (meta)
- Phi-3 (microsoft)
- Codestral-22b-instruct-v0.1 (mistralai)
- Mathstral-7b-v0.1 (mistralai)
- Mixtral (mistralai)
- Nemotron-4 (nvidia)
- Rakuten AI (rakuten)
- Seallm
- Srctic (snowflake)
- Solar (upstage)
Fireworks AI
Fireworks AIは元Googleのエンジニアが立ち上げたサービスです。利用できるモデルは以下の通りです。
- Llama 3/3.1
- Mixtral MoE
- Firefunction V2
- FireLLaVA-13B
- Chronos Hermes 13B v2
- CodeGemma 2B/7B
- Code Llama
- Stable Diffusion
- Playground v2/v2.5
Introduction - Fireworks AI Docs
NPL Cloud
NPL Cloudは独自にファインチューニングしたDolphinやLlama、Whisper、Bartなど用途に応じてさまざまなモデルを利用したAI APIを提供しています。
Together AI
元Appleのシニアディレクターが立ち上げたAIプラットフォームサービスです。オープンでカスタマイズ可能なAIモデルを作成するプラットフォームを提供しています。
Replicate
ReplicateはさまざまなAIモデルをAPIとして提供しています。利用した秒数に応じて課金が発生します。Replicate上でモデルを実行したり、ファインチューニングできます。
Replicate — Run AI with an API
まとめ
API経由であれば、コール数やトークン数に応じた課金で、安価にLLMを利用できます。チューニングなど独自のモデルを作った場合も、それをAPI経由で使えるようにするプラットフォームがあるので、初期投資はぐっと抑えられるでしょう。ぜひ、自社サービスにAIを取り入れてみてください。
HexabaseではAIドリブン開発を推進しており、自然言語を用いた開発効率化を実現しています。必要なのは「ことば」だけ。3分で要件定義ができるAIドリブン開発アルファ版「App Modeler」の無料提供スタート!をぜひご覧ください。