Azure OpenAI

Visual ChatGPTを試してみる

はじめに

Visual ChatGPT というChatGPT と一連の Visual Foundation Models を接続して、チャット中に画像を送受信できるようにするOSSがMicrosoftから公開されているので試してみました。

これはGPUではなくCPUだけで処理できるようです。一連の流れは下記の通りですが、Anacondaのインストールが必要になります。

GitHub - chenfei-wu/TaskMatrix
GitHub - chenfei-wu/TaskMatrix

Contribute to chenfei-wu/TaskMatrix development by creating an account on GitHub.

github.com

インストール

Anacondaのインストール

最初にPython環境を整えるためにAnacondaのインストールを行います。これはPython 3.8が利用できればpynevでも問題ないと思います。

apt update
apt upgrade
wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh
chmod +x Anaconda3-2022.10-Linux-x86_64.sh
./Anaconda3-2022.10-Linux-x86_64.sh
source .bashrc

以上でインストールを完了します。

Visual ChatGPTのインストール

コードをダウンロードしてきます。

Pythonをインストールします。

git clone https://github.com/microsoft/visual-chatgpt.git
cd visual-chatgpt
conda create -n visgpt python=3.8
conda activate visgpt
pip install -r requirements.txt

apt install libgl1-mesa-dev

実行

OpenAIのAPIを設定します。

export OPENAI_API_KEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

CPUで実行します。

python visual_chatgpt.py --load ImageCaptioning_cpu,Text2Image_cpu

あとはアクセスします。

何か入力してあげます。下記ではcatと入力しています。

ネコ

 

なにしろCPUだと遅いのでAzureで一番コア数が多いもので試しました。96 vCPUです。

動かなかったです。

Yes
Action: Generate Image From User Input Text
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [01:49<00:00, 2.19s/it]
Segmentation fault (core dumped)

-Azure, OpenAI
-