日本語

COLUMN

コラム

2024年08月22日

大規模言語モデルを手軽に利用できるLLM APIまとめ

カテゴリー：テクノロジー, API連携

タグ：AI, api, プログラミング, クラウドサービス

LLMをビジネスに取り入れる企業が増えています。さらに、自社独自のデータを盛り込んだLLMをサービスと提供するケースも増えています。そうした時、気になるのはGPUなどの初期投資でしょう。

今回は、LLMを手軽にAPI経由で利用できるサービスをまとめて紹介します。

独自のAIモデルを提供するサービス

OpenAI API

ChatGPTやDALL-Eなど、OpenAIのサービスは多岐にわたります。特にChatGPTは、多くの企業が導入しているサービスです。テキストはもちろん、画像や動画、音声にも利用できます。

OpenAI API | OpenAI

Gemini API

GeminiはGoogleの開発した最新のAIです。GeminiはNano、Pro、Ultraの3種類のモデルがあり、Nanoはスマートフォンでの利用が想定されています。Googleの各種サービスに組み込まれている他、APIを利用した操作も可能です。

Google AI Gemini API | Gemma open models | Google for Developers | Google AI for Developers

Groq

Groqは元Googleのエンジニアが創業・開発しているLLMです。回答が速い点が、他のLLMとの違いです。LPU（Language Processing Unit）という処理エンジンを独自に開発しており、Groqを最適にチューニングしていることで実現しています。

Groq is Fast AI Inference

Claude

Claudeは元OpenAIの幹部が立ち上げた企業になります。現状では、テキストと画像について扱えます。一時期にはChatGPTよりも優れているという評価もありました。現在の最新版はClaude 3.5 Sonnetであり、次のバージョンが楽しみなサービスです。

Build with Claude \ Anthropic

Cohere

Cohereは企業向けに特化したLLMです。特にRAGをはじめとする企業内データの探索に特化しています。Cohereのクラウドサービスはもちろん、オンプレミスやパブリッククラウドへのデプロイも可能です。

Mistral AI API

Mistralはフランス発のAIスタートアップです。元Meta社、元DeepMindの開発者が立ち上げた企業で、AIの研究開発に特化しています。オープンなモデルであるMistral 7B、Mixtral 8x7Bを公開しています。商用モデルはMistral SmallやMistral Embed、Mistral Largeがあります。

Mistral AI API | Mistral AI Large Language Models

Perplexity API

PerplexityはGPTモデルと検索を組み合わせることで、データの参照元を表示します。そのため、結果がより信頼性の高いものになるのが特徴です。

ALEPH ALPHA

ALEPH ALPHAは元Appleの開発者が立ち上げたAIサービスです。ALEPH ALPHAはドイツ発の企業で、EUにおけるOpenAIを目指すとしています。EUのデータ管理、プライバシーに則した利用が可能です。

ALEPH ALPHA - AI for Enterprises and Governments

DeepSeek

DeepSeekは236億のパラメータを持つLLMです。他のLLM APIと比べて低価格なのは魅力ですが、中国のAIなので利用については注意が必要そうです。

AI21

AI21はイスラエル発のAIスタートアップです。出典元へのリンクを提供する機能があります。直接使うことも、Amazon Bedrockなどを通じて利用することもできます。

AI21 Studio Documentation

外部のLLMを呼び出すAPI

多数あるLLMのAPIを束ねて使いやすくしてくれるサービスです。エンジンは独自ではないですが、異なるLLMを試す・使い分けるのが容易です。

Azure OpenAI Service

Azureが提供するサービスです。以下のモデルが利用できます。

OpenAI
Phi-3
Llama
Mistral AI
Cohere
Hugging Face
Stability AI
Core42
Nixtla

Azure OpenAI Service – 高度な言語モデル | Microsoft Azure

Vertex AI

Vertex AIはGoogleの提供するフルマネージド統合 AI 開発プラットフォームです。Model Gardenには、さまざまなAIモデルが掲載されています。基本的にGoogleの開発したモデルですが、Llama 2やClaudeなど、他社のモデルも利用できます。

Gemini モデル
Imagen 2.0
Chirp 2.0
Gemma
CodeGemma
PaliGemma
Llama 2
Falcon
BERT
T-5 FLAN
ViT
EfficientNet
Claudeモデルファミリー

Gemini 1.5 Pro と Gemini 1.5 Flash を使用した Vertex AI | Google Cloud

Amazon Bedrock

Amazon BedrockはAWSの提供するサービスで、各種LLMモデルを一つのエンドポイントで利用できます。利用できるモデルは以下の通りです。

AI21 Labs
Amazon Titan
Claude
Cohere
Llama
Mistral AI
Stability AI

基盤モデルによる生成 AI アプリケーションの構築 - Amazon Bedrock - AWS

NVIDIA LLM APIs

NVIDIAはLlama 2やPhi、MistralaiなどさまざまなAIモデルをAPIで提供しています。利用できるモデルは以下の通りです。

YI-large (01-ai)
Sea-lion-7b-instruct (aisingapore)
Starcoder2 (bigcode)
Databricks
Deepseek
Gemma (Google)
Codegemma (Google)
Recurrentgemma-2b (Google)
Shieldgemma-9b (Google)
Granite (ibm)
Breeze-7b-instruct (mediatek)
Codellama-70b (meta)
Llama (meta)
Phi-3 (microsoft)
Codestral-22b-instruct-v0.1 (mistralai)
Mathstral-7b-v0.1 (mistralai)
Mixtral (mistralai)
Nemotron-4 (nvidia)
Rakuten AI (rakuten)
Seallm
Srctic (snowflake)
Solar (upstage)

Fireworks AI

Fireworks AIは元Googleのエンジニアが立ち上げたサービスです。利用できるモデルは以下の通りです。

Llama 3/3.1
Mixtral MoE
Firefunction V2
FireLLaVA-13B
Chronos Hermes 13B v2
CodeGemma 2B/7B
Code Llama
Stable Diffusion
Playground v2/v2.5

Introduction - Fireworks AI Docs

NPL Cloud

NPL Cloudは独自にファインチューニングしたDolphinやLlama、Whisper、Bartなど用途に応じてさまざまなモデルを利用したAI APIを提供しています。

高度な人工知能API

Together AI

元Appleのシニアディレクターが立ち上げたAIプラットフォームサービスです。オープンでカスタマイズ可能なAIモデルを作成するプラットフォームを提供しています。

Replicate

ReplicateはさまざまなAIモデルをAPIとして提供しています。利用した秒数に応じて課金が発生します。Replicate上でモデルを実行したり、ファインチューニングできます。

Replicate — Run AI with an API

まとめ

API経由であれば、コール数やトークン数に応じた課金で、安価にLLMを利用できます。チューニングなど独自のモデルを作った場合も、それをAPI経由で使えるようにするプラットフォームがあるので、初期投資はぐっと抑えられるでしょう。ぜひ、自社サービスにAIを取り入れてみてください。

HexabaseではAIドリブン開発を推進しており、自然言語を用いた開発効率化を実現しています。必要なのは「ことば」だけ。3分で要件定義ができるAIドリブン開発アルファ版「App Modeler」の無料提供スタート！をぜひご覧ください。

役に立ったら、記事をシェアしてください

コラム一覧

Contact Usお問い合わせはこちら