【カンタン版】生成AIの主要モデル、会社、サービスなどまとめ

57

主要生成AI(チャット系)

  • 特徴
  • 高い汎用性を持ち、文書生成、翻訳、要約、プログラミングなどの幅広いタスクに対応。
  • 日本語も得意。
  • 一番有名なAIモデル。

ラインナップ:
- Chat GPT 3.5 turbo (4よりは性能は低いが、速度が速く、お金も安い)
- Chat GPT 4(音声や画像生成にも対応。)
- Chat GPT 4o(1からモデル作り直されたモデル。3.5並みの速度で、4ぐらい賢い。特に音声や画像生成が大幅に向上したため、同時通訳なども出来る)


  • 特徴
  • テキスト、画像、音声すべて高い性能をもつ。
  • 動画の理解は他のモデルよりもダントツで高い。

ラインナップ:
- Gemini 1.5 pro(Chat GPT4o並みの性能。一度に読み込めるトークン数が圧倒的に多い)
  • 特徴: 無料で使えるオープンソース。
  • 性能は悪くないが、他のモデルとくらべると日本語が苦手。
  • 基本的にパソコンにインストールして使うため、ブラウザ上から使いたい場合は Groq Cloud などを使う。

ラインナップ:
- Llama3 8B(軽量版。自分で動かすには、70Bはキツイので、現実的にこちらを使うことが多い)
- Llama3 70B(パラメータ数が多い賢い版。自分のPCで動かすには、RTX4090 が2本ぐらいいる)
  • 特徴: 全体的に能力が高く、日本語能力も高い。ChatGPT4 のライバル的存在。

  • ラインナップ:
    - Haiku(軽量版。APIの価格が安く、ChatGPT3.5よりは賢く、速度も速いため、使いやすい)
    - Sonet(普通版。あまりHaikuとの差がわからない)
  • - Opus(賢い版。ChatGPT4 か、それ以上の性能。ただし画像を作ったりはできない。読み込むことは出来る)



関連サービス

  • 特徴
AI自体は作っていないが、AIを動かすための独自チップを開発している。
さらに高速チップで動かしたAIを利用できるようなサービスも行っていて、Grop Cloudから、Llama3などを使うとトンデモナク処理が早くてビビる。
APIもなぜか無料で使える(いつまで使えるかはなぞ)

---------------------------------------------------------------------------------

主要生成AI(画像系)


Stable Diffusion

特徴:
英語のみ。
パソコンに保存して使えるオープンソース(無料)がある。
ウェブで使える有料版もある。
Midjourneryと同じレベルで、リアルなものが作れるが細かい設定が多く、簡単ではない。

 
seaart

特徴:
日本語対応。
無料で毎日最大150枚の画像生成が出来る。
内部的にはStable Diffusionが使われている。

---------------------------------------------------------------------------------