2024年08月22日

大規模言語モデルを手軽に利用できるLLM APIまとめ

カテゴリー:テクノロジー, API連携

タグ:AI, api, プログラミング, クラウドサービス

Knowledge_seci_model

LLMをビジネスに取り入れる企業が増えています。さらに、自社独自のデータを盛り込んだLLMをサービスと提供するケースも増えています。そうした時、気になるのはGPUなどの初期投資でしょう。

今回は、LLMを手軽にAPI経由で利用できるサービスをまとめて紹介します。

独自のAIモデルを提供するサービス

OpenAI API

ChatGPTやDALL-Eなど、OpenAIのサービスは多岐にわたります。特にChatGPTは、多くの企業が導入しているサービスです。テキストはもちろん、画像や動画、音声にも利用できます。

OpenAI API | OpenAI

Gemini API

GeminiはGoogleの開発した最新のAIです。GeminiはNano、Pro、Ultraの3種類のモデルがあり、Nanoはスマートフォンでの利用が想定されています。Googleの各種サービスに組み込まれている他、APIを利用した操作も可能です。

Google AI Gemini API | Gemma open models | Google for Developers | Google AI for Developers

Groq

Groqは元Googleのエンジニアが創業・開発しているLLMです。回答が速い点が、他のLLMとの違いです。LPU(Language Processing Unit)という処理エンジンを独自に開発しており、Groqを最適にチューニングしていることで実現しています。

Groq is Fast AI Inference

Claude

Claudeは元OpenAIの幹部が立ち上げた企業になります。現状では、テキストと画像について扱えます。一時期にはChatGPTよりも優れているという評価もありました。現在の最新版はClaude 3.5 Sonnetであり、次のバージョンが楽しみなサービスです。

Build with Claude \ Anthropic

Cohere

Cohereは企業向けに特化したLLMです。特にRAGをはじめとする企業内データの探索に特化しています。Cohereのクラウドサービスはもちろん、オンプレミスやパブリッククラウドへのデプロイも可能です。

Login | Cohere

Mistral AI API

Mistralはフランス発のAIスタートアップです。元Meta社、元DeepMindの開発者が立ち上げた企業で、AIの研究開発に特化しています。オープンなモデルであるMistral 7B、Mixtral 8x7Bを公開しています。商用モデルはMistral SmallやMistral Embed、Mistral Largeがあります。

Mistral AI API | Mistral AI Large Language Models

Perplexity API

PerplexityはGPTモデルと検索を組み合わせることで、データの参照元を表示します。そのため、結果がより信頼性の高いものになるのが特徴です。

Perplexity API

ALEPH ALPHA

ALEPH ALPHAは元Appleの開発者が立ち上げたAIサービスです。ALEPH ALPHAはドイツ発の企業で、EUにおけるOpenAIを目指すとしています。EUのデータ管理、プライバシーに則した利用が可能です。

ALEPH ALPHA - AI for Enterprises and Governments

DeepSeek

DeepSeekは236億のパラメータを持つLLMです。他のLLM APIと比べて低価格なのは魅力ですが、中国のAIなので利用については注意が必要そうです。

DeepSeek

AI21

AI21はイスラエル発のAIスタートアップです。出典元へのリンクを提供する機能があります。直接使うことも、Amazon Bedrockなどを通じて利用することもできます。

AI21 Studio Documentation

外部のLLMを呼び出すAPI

多数あるLLMのAPIを束ねて使いやすくしてくれるサービスです。エンジンは独自ではないですが、異なるLLMを試す・使い分けるのが容易です。

Azure OpenAI Service

Azureが提供するサービスです。以下のモデルが利用できます。

  • OpenAI
  • Phi-3
  • Llama
  • Mistral AI
  • Cohere
  • Hugging Face
  • Stability AI
  • Core42
  • Nixtla

Azure OpenAI Service – 高度な言語モデル | Microsoft Azure

Vertex AI

Vertex AIはGoogleの提供するフルマネージド統合 AI 開発プラットフォームです。Model Gardenには、さまざまなAIモデルが掲載されています。基本的にGoogleの開発したモデルですが、Llama 2やClaudeなど、他社のモデルも利用できます。

  • Gemini モデル
  • Imagen 2.0
  • Chirp 2.0
  • Gemma
  • CodeGemma
  • PaliGemma
  • Llama 2
  • Falcon
  • BERT
  • T-5 FLAN
  • ViT
  • EfficientNet
  • Claudeモデルファミリー

Gemini 1.5 Pro と Gemini 1.5 Flash を使用した Vertex AI | Google Cloud

Amazon Bedrock

Amazon BedrockはAWSの提供するサービスで、各種LLMモデルを一つのエンドポイントで利用できます。利用できるモデルは以下の通りです。

  • AI21 Labs
  • Amazon Titan
  • Claude
  • Cohere
  • Llama
  • Mistral AI
  • Stability AI

基盤モデルによる生成 AI アプリケーションの構築 - Amazon Bedrock - AWS

NVIDIA LLM APIs

NVIDIAはLlama 2やPhi、MistralaiなどさまざまなAIモデルをAPIで提供しています。利用できるモデルは以下の通りです。

  1. YI-large (01-ai)
  2. Sea-lion-7b-instruct (aisingapore)
  3. Starcoder2 (bigcode)
  4. Databricks
  5. Deepseek
  6. Gemma (Google)
  7. Codegemma (Google)
  8. Recurrentgemma-2b (Google)
  9. Shieldgemma-9b (Google)
  10. Granite (ibm)
  11. Breeze-7b-instruct (mediatek)
  12. Codellama-70b (meta)
  13. Llama (meta)
  14. Phi-3 (microsoft)
  15. Codestral-22b-instruct-v0.1 (mistralai)
  16. Mathstral-7b-v0.1 (mistralai)
  17. Mixtral (mistralai)
  18. Nemotron-4 (nvidia)
  19. Rakuten AI (rakuten)
  20. Seallm
  21. Srctic (snowflake)
  22. Solar (upstage)

LLM APIs

Fireworks AI

Fireworks AIは元Googleのエンジニアが立ち上げたサービスです。利用できるモデルは以下の通りです。

  1. Llama 3/3.1
  2. Mixtral MoE
  3. Firefunction V2
  4. FireLLaVA-13B
  5. Chronos Hermes 13B v2
  6. CodeGemma 2B/7B
  7. Code Llama
  8. Stable Diffusion
  9. Playground v2/v2.5

Introduction - Fireworks AI Docs

NPL Cloud

NPL Cloudは独自にファインチューニングしたDolphinやLlama、Whisper、Bartなど用途に応じてさまざまなモデルを利用したAI APIを提供しています。

高度な人工知能API

Together AI

元Appleのシニアディレクターが立ち上げたAIプラットフォームサービスです。オープンでカスタマイズ可能なAIモデルを作成するプラットフォームを提供しています。

Together AI

Replicate

ReplicateはさまざまなAIモデルをAPIとして提供しています。利用した秒数に応じて課金が発生します。Replicate上でモデルを実行したり、ファインチューニングできます。

Replicate — Run AI with an API

まとめ

API経由であれば、コール数やトークン数に応じた課金で、安価にLLMを利用できます。チューニングなど独自のモデルを作った場合も、それをAPI経由で使えるようにするプラットフォームがあるので、初期投資はぐっと抑えられるでしょう。ぜひ、自社サービスにAIを取り入れてみてください。

HexabaseではAIドリブン開発を推進しており、自然言語を用いた開発効率化を実現しています。必要なのは「ことば」だけ。3分で要件定義ができるAIドリブン開発アルファ版「App Modeler」の無料提供スタート!をぜひご覧ください。

役に立ったら、記事をシェアしてください